Chegou o sexto lançamento do ChatGPT de final de ano, com videochamada e compartilhamento de tela, além de ovo de Páscoa de Natal
Depois que o ChatGPT foi totalmente lançado ontem no Family Bucket da Apple, o OpenAI trouxe outra atualização importante.
Hoje, o ChatGPT lançou funções de videochamada e compartilhamento de tela, bem como um "Modo Papai Noel" de voz limitado pelo Papai Noel.
Em outras palavras, agora o ChatGPT não é apenas eloqüente, mas também pode “abrir os olhos para ver o mundo”. Se tiver dúvidas, faça uma “videochamada” diretamente para o ChatGPT Talvez possa te ajudar a resolver melhor o problema.
Esses recursos serão lançados para todos os usuários do Team e para a maioria dos assinantes Plus e Pro na próxima semana. Os utilizadores pagantes na UE terão de esperar um pouco mais.
O ChatGPT, que suporta mais de 50 idiomas, será capaz de compreender cenas visuais em tempo real, ajudá-lo a resolver problemas e até mesmo se tornar um tutor de IA para lhe ensinar coisas novas.
Nesta conferência de imprensa, que também durou menos de 20 minutos, o diretor de produtos da OpenAI, Kevin Weil, Jackie Shannon, Michelle Qin e Rowan Zellers nos mostraram o que o ChatGPT com “olhos” pode fazer?
Por exemplo, quando você compra um conjunto de equipamentos para café feito à mão, mas não sabe por onde começar, é melhor fazer uma “videochamada” para o ChatGPT.
Ele pode ensinar passo a passo como realizar cada etapa com base no aparelho à sua frente, desde colocar o papel de filtro, despejar água quente, colocar pó de café moído no papel de filtro, etc., tudo isso ensinado e dominado .
Preso? Sinta-se à vontade para fazer qualquer pergunta aos professores do GPT. Este professor de IA não apenas responde a todas as perguntas, mas também ocasionalmente fornece incentivo humano, cheio de valor emocional.
Além da orientação por vídeo em tempo real, o ChatGPT também oferece suporte à funcionalidade de compartilhamento de tela. Os usuários só precisam clicar no ícone do modo de voz avançado no canto inferior direito e selecionar Compartilhar tela no menu suspenso para obter ajuda direcionada.
Ao “ver” um amigo fantasiado de Papai Noel e brincar sobre se ele está qualificado para se candidatar ao cargo de Papai Noel em um shopping, o professor do GPT dará sugestões de redação adequadas e alto incentivo à inteligência emocional.
Ei Kevin, sua fantasia de Papai Noel é tão festiva. Talvez continue praticando seu "Ho Ho Ho" e você se tornará um Papai Noel de shopping em pouco tempo.
Na verdade, o presidente da OpenAI, Greg Brockman, conduziu recentemente um questionário de conhecimento sobre anatomia humana com Anderson Cooper usando ChatGPT com função visual.
Quando Cooper desenhou partes do corpo no quadro negro, o ChatGPT foi capaz de “entender” instantaneamente o que ele estava desenhando.
“A posição é muito boa, o cérebro está bem ali na cabeça. Quanto ao formato, é um bom começo, mas o cérebro é mais parecido com um oval. O ChatGPT pode até cantar a fórmula da área do triângulo com sotaque britânico.
No entanto, houve falhas óbvias no processamento subsequente de problemas geométricos pelo ChatGPT. Um simples erro de anotação não foi encontrado e ainda há muito espaço para melhorias na capacidade de compreensão da geometria plana.
Para dar as boas-vindas à chegada do Natal, a OpenAI também lançou uma voz predefinida “Papai Noel”. Os usuários só precisam clicar no ícone do floco de neve na tela inicial para conversar com o Papai Noel ChatGPT.
Por exemplo, deixe o Papai Noel contar uma história.
Devo dizer que toda vez que “Papai Noel” fala “Ho Ho Ho~” é bastante mágico e soa muito festivo.
Durante a transmissão ao vivo, o apresentador também fez diversas perguntas ao “Papai Noel”, incluindo, entre outras, sua tradição de Natal favorita, suas renas favoritas, etc.
Curiosamente, quando Kevin Weil colocou a barba postiça do Papai Noel e perguntou como mantê-la, ChatGPT, que deu o conselho, também respondeu no tom do Papai Noel:
"Meu amigo, esta é a barba mais incrível que já vi."
Esta voz será lançada hoje e, para permitir que todos os usuários experimentem plenamente este ovo de férias, o OpenAI irá redefinir o número de uso de voz avançado do usuário durante a primeira experiência. Mesmo que a cota se esgote, o usuário poderá continuar a se comunicar. você através do modo de voz padrão interação "Papai Noel".
Talvez porque a coletiva de imprensa tenha sido muito longa, as reclamações dos internautas também se concentraram na voz do Papai Noel. O exemplo mais típico é o internauta X @khoomeik.
O cientista pesquisador do Google Deepmind, Jonas Adler, até criticou diretamente o OpenAI:
É incrível a rapidez com que a OpenAI responde aos produtos que lançamos e parece que sempre são lançados ao mesmo tempo. No entanto, não estou muito interessado que eles usem o Modo Papai Noel como resposta ao Gemini 2.0, pois parece faltar a importância e a seriedade para se igualar ao Gemini 2.0.
Vale ressaltar que ontem o Google assumiu a liderança no lançamento de um produto de IA com recursos de compreensão visual, que pode entender e analisar a cena real em que o usuário se encontra, e tem recebido muitos elogios dos internautas.
Hoje, a OpenAI seguiu o exemplo e instalou “olhos” no ChatGPT, o que também significa que o ChatGPT se expandiu ainda mais de uma modalidade relativamente única para “compreensão multimodal de linguagem visual”.
Ou seja, o ChatGPT não se limitará mais às instruções de texto e informações inseridas pelo usuário, mas será capaz de compreender o contexto do usuário por meio da visão, incluindo páginas na tela do computador, imagens capturadas por câmeras de celulares, e até mesmo informações em tempo real de outros periféricos.
Há meio século, cientistas do laboratório Xerox PARC imaginaram um computador que pudesse compreender o comportamento humano. O desenvolvimento atual da IA está a transformar este sonho numa realidade para além do monitor.
Do papel ao teclado, do binário à linguagem natural, os humanos têm simplificado a forma como comunicam com as máquinas. As capacidades visuais do ChatGPT também nos permitem ver a resposta definitiva, que é permitir que as máquinas “vejam” o mundo como os humanos.
Considerando que Altman e o ex-diretor de design da Apple, Jony Ive, têm desenvolvido dispositivos de hardware inteligentes de IA, estou ainda mais animado em ver esse recurso aparecer neste novo hardware.
No momento em que a IA abre os olhos, ela finalmente entra no mundo aos olhos humanos.
# Bem-vindo a seguir a conta pública oficial do WeChat de Aifaner: Aifaner (WeChat ID: ifanr). Mais conteúdo interessante será fornecido a você o mais rápido possível.