Finalmente o selo foi levantado! O Bing assumiu a liderança no ChatGPT para oferecer suporte à função de reconhecimento de imagem, não apenas pode entender memes, escrever páginas da web, mas também “consultar um médico”

Lembra dos recursos multimodais que a OpenAI mencionou quando lançou o GPT-4 em março deste ano?

▲ Demonstração da resposta GPT-4, traduzida por máquina

O GPT-4 suporta a entrada de imagens e pode entender memes, problemas de física e papéis. Uma vez lançado, chocou a todos. Este também é o maior ponto de atualização do GPT-4 em comparação com o GPT-3.5.

Infelizmente, a OpenAI diz que o recurso de entrada de imagem ainda é uma prévia de pesquisa e ainda não está disponível ao público.

▲ Adicionado um ícone de reconhecimento de imagem Imagem de: Reddit

No entanto, recentemente um internauta do Reddit descobriu que sua conta do Bing Chat adicionou discretamente uma entrada para upload de fotos.

A Microsoft revelou anteriormente que o Bing Chat usa o modelo GPT-4 e mencionou no grande log de atualização do mês passado que adicionará suporte multimodal ao Bing. No geral, o Bing Chat provavelmente será desenvolvido gradualmente para os usuários Abrir mapa teste de função de reconhecimento.

Este internauta fez muitos testes no Bing Chat, vamos ver o quão poderoso é o Bing Chat com "olhos longos".

A primeira é a função mais incrível de visualização de memes do GPT-4. O GPT-4 pode não apenas entender o conteúdo da imagem, mas também analisar as piadas do meme como humanos.

Por exemplo, neste meme, o GPT-4 pode ver que a imagem quer expressar que é um absurdo usar a interface ultrapassada em forma de VGA para carregar o iPhone e é um absurdo introduzir uma risada.

▲ Traduzido por máquina

Os internautas enviaram os mesmos memes para o Bing Chat para teste, e uma coisa estranha aconteceu: o Bing Chat não reconheceu que era uma interface VGA, então não conseguiu “pegar” a piada, mas o Bing Chat ainda assim 151 Shidi decifrou as fotos , ainda disse a marca do cabo e deu informações mais detalhadas.

Isso pode ser um erro acidental do Bing Chat ou pode ser que a Microsoft tenha feito mais ajustes de restrição na aplicação real do GPT-4, resultando em um desvio na resposta.

Os internautas enviaram outro cartoon de meme sobre aprendizado de máquina e, desta vez, o Bing Chat conseguiu responder ao conteúdo e às piadas da imagem com mais precisão.

A análise do Bing Chat de outro meme de passar roupas em um carro também está no local.

▲ A tradução aqui está errada, o texto original é: Diddy Kong, Pyra, Pikachu, Zero Suit Samus, Donkey Kong, Sonic the Hedgehog, Ness, Cloud Strife e Incineroar

Qual é a precisão do reconhecimento de imagem do Bing Chat? Ele carregou uma foto dos personagens do "Nintendo Smash Bros." Há muitos personagens dispostos na mesma foto e pediu ao Bing Chat para reconhecer todos os personagens, um por um.

Como resultado, o Bing Chat reconheceu 7 dos 12 caracteres e parece que o problema bidimensional ainda é um pouco difícil para ele.

Quando o OpenAI foi lançado, ele também mostrou um caso de programação de uma página da Web tirando uma foto à mão. O internauta também desenhou uma foto à mão para testar o Bing.

Vamos pular o longo link de código e ver diretamente o efeito desta página em execução. Pode-se ver que o protótipo da página web básica ainda está construído.

A adição da função de reconhecimento de imagem adiciona muitos usos ao Bing Chat. Afinal, muitos conteúdos (como fórmulas e gráficos) na realidade são difíceis de expressar claramente em palavras. Neste momento, basta jogar uma imagem para AI para obter a resposta.

Deixe-o explicar, por exemplo, o processo pelo qual os cromossomos se cruzam durante a meiose.

Deixe-o brincar de professor de biologia e analise como funciona a filtração de néfrons.

Pode até ser usado como um médico online para diagnosticar doenças de pele de forma simples.

Anteriormente, o ChatGPT foi desenvolvido para aprender línguas estrangeiras e praticar o inglês oral devido à sua excelente compreensão de texto e habilidades de expressão.

Depois de adicionar o reconhecimento visual, o Bing Chat pode até desempenhar o papel de professor do ensino fundamental, médio ou mesmo universitário para ajudar os alunos a resolver problemas matemáticos, físicos e químicos complexos. Se a função de reconhecimento de imagem puder ser promovida no futuro, isso pode resolver o problema da educação até certo ponto, o problema dos recursos desequilibrados.

Os usuários também podem usá-lo para diagnóstico médico básico, economizando dinheiro e tempo necessários para tratamento médico, refletindo o valor da IA ​​para o público em geral.

É claro que, embora o Bing Chat possa entender basicamente o conteúdo do mundo real, suas respostas só podem ser usadas como referência, afinal, e não podem ser consideradas conselhos profissionais.

Portanto, se a função de reconhecimento de mapas for totalmente aberta ao público, a Microsoft precisa fazer muitas restrições e depurações para garantir que o público não tenha problemas de segurança devido à desconfiança da resposta da IA.

A curto prazo, o reconhecimento de imagens do Bing Chat deve ser apenas uma função de teste disponível para um pequeno número de usuários. Se você estiver interessado, pode fazer login na sua conta da Microsoft imediatamente para ver se há mais uma na barra de bate-papo do Bing Ícone de imagem de bate-papo.

Atualmente o Bing Chat está aberto para todas as contas da Microsoft, venha e abra a caixa cega para ver se você recebeu a qualificação do teste ⬇

https://www.bing.com/new

Chega de besteira.

#Bem-vindo a prestar atenção à conta pública oficial do WeChat de Aifaner: Aifaner (ID do WeChat: ifanr), conteúdo mais interessante será apresentado a você o mais rápido possível.

Ai Faner | Link Original · Ver comentários · Sina Weibo