Baidu Wenxin Yiyan fez sua estreia! Ainda não pode corresponder ao ChatGPT, mas não fique desapontado

AI é realmente toda a raiva nos dias de hoje.

A OpenAI conta com a força do ChatGPT para chamar a atenção, e o Google seguiu com o Bard. Ainda ontem, o modelo GPT-4 voltou a roubar os holofotes. Você acabou de cantar sobre o campo de IA onde fiz minha estreia. Hoje é a vez do Baidu.

Ainda esta tarde, o tão esperado Baidu Wenxin chegou conforme programado. No entanto, no início da coletiva de imprensa, o CEO da Baidu, Robin Li, deu uma chance a todos:

De certa forma, o Baidu está se preparando para isso (publicando Wenxin Yiyan) há muitos anos. Começamos a investir em pesquisa de IA há mais de dez anos e lançamos o grande modelo de linguagem Wenxin em 2019. O Wenxin Yiyan de hoje é uma continuação dos esforços dos últimos muitos anos.

Mas não se pode dizer que estamos completamente prontos. Wenxin disse que o limite para benchmarking contra ChatGPT, ou mesmo GPT-4, é muito alto. Nenhum grande fabricante global o fez ainda, e o Baidu é o primeiro. Meu próprio teste sente que ainda há muitas imperfeições.

Como foi o desempenho do atrasado Wen Xin Yiyan? Qual é a diferença com o ChatGPT? Ele pode atender à demanda do mercado por grandes modelos em chinês? Fizemos uma análise abrangente dele.

Também vamos liberar o site para testes internos  https://cloud.baidu.com/survey_summit/wenxin.html?track=C816552

O que uma nova geração de grandes modelos de linguagem e produtos generativos de IA pode fazer?

Cinco pontos-chave:

  • Escrita criativa;
  • Criação de copywriting empresarial;
  • Cálculos matemáticos e lógicos;
  • compreensão chinesa;
  • Geração multimodal.

Para esses cinco cenários, Robin Li deu demonstrações, respectivamente. Vale ressaltar que essas demonstrações não são operações ao vivo, mas sim gravações.

A primeira é a capacidade de criação literária de Wen Xin Yi Yan. Li Yanhong continuamente levantou várias questões relacionadas ao "Problema dos Três Corpos" para Wen Xin Yi Yan.

Em primeiro lugar, a partir do vídeo de demonstração, a velocidade de resposta de Wenxinyiyan é muito rápida, muito mais rápida que o ChatGPT, e o conteúdo que sai é muito bom. Mais tarde, lançaremos as mesmas perguntas para ChatGPT e Bing Chat. Vamos dar uma olhada em três diferença entre o

▲A animação não é acelerada

Com relação à criação de direitos autorais comerciais, Li Yanhong fez uma pergunta a Wen Xin:

Se você deseja criar uma empresa de serviços de tecnologia que usa modelos grandes para atender à atualização digital de pequenas e médias empresas, que nome de empresa você pode escolher?

Aqui estão as perguntas e respostas.

Sem falar que é bem decente.

Também pode ser usado para gerar press releases, pode-se dizer que a IA é usada do começo ao fim, o que está de acordo com o posicionamento desta empresa.

Na sessão de dedução lógica matemática, o Baidu fez uma pergunta sobre galinhas e coelhos na mesma gaiola. Wen Xin primeiro descobriu que a pergunta estava errada e depois mudou a pergunta, e foi capaz de respondê-la com precisão.

Antes de Wenxin Yiyan ser lançado, algumas pessoas imaginaram que esse modelo de linguagem seria melhor do que OpenAI, Google e Microsoft, então o Baidu também mostrou suas habilidades nesta parte. Wenxin Yiyan não apenas respondeu com precisão ao significado do idioma "Luoyang Zhigui " , também explicou o fenômeno financeiro por trás disso e, finalmente, escreveu um poema acróstico tibetano usando esse idioma.

Li Yanhong também mencionou na cena que o chinês é a vantagem de Wen Xin Yi Yan e, inversamente, a análise de materiais em inglês tornou-se sua desvantagem.

Finalmente, a capacidade de geração multimodal de Wenxin Yiyan é introduzida. Desenhar imagens, escrever textos longos e gerar conteúdo de vídeo curto com base em textos são todos concluídos um a um. Esta é uma habilidade que o ChatGPT não possui.

▲Também pode gerar voz de dialeto

Li Yanhong também mencionou que Baijiahao já está usando os recursos de geração multimodal de Wenxin Yiyan para converter conteúdo de texto em vídeos.

Após a reunião, o primeiro lote de usuários pode experimentar o Wenxin Yiyan primeiro por meio do código de teste interno fornecido pelo Baidu. Enviamos o aplicativo de teste interno e traremos a você o conteúdo da experiência o mais rápido possível no futuro.

Antes disso, alimentamos as várias cenas demonstradas na reunião para ChatGPT (versão 3.5) e Bing Chat, respectivamente, para ver como elas saem.

Comparado com o ChatGPT e o Bing Chat, como é a experiência de Wenxin Yiyan?

Durante a demonstração, Li Yanhong enfatizou repetidamente que o Baidu está em uma posição única no processamento da língua chinesa.

Em comparação com o ChatGPT e o Bing Chat, a maior diferença agora é a geração multimodal, ou seja, cartazes, conteúdo de voz e até vídeo podem ser gerados por meio da linguagem.

Na apresentação da coletiva de imprensa, Li Yanhong demonstrou o uso de Wenxin Yiyan para gerar pôsteres de eventos, vozes de dialetos e vídeos relacionados a eventos com base no conteúdo das perguntas. No entanto, o custo de geração de vídeo é relativamente alto e ainda não está aberto a todos os usuários neste estágio.

A capacidade de gerar fotos e vídeos realmente fez nossos olhos brilharem. Robin Li também disse: "A IA generativa multimodal é uma clara tendência de desenvolvimento".

Além desta funcionalidade, também estamos curiosos sobre outras capacidades face ao ChatGPT e ao Bing Chat, pelo que aproveitamos o conteúdo demonstrado na conferência de imprensa para questionar sobre o ChatGPT (versão 3.5) e o Bing Chat. Deixe-me falar sobre a conclusão primeiro: o desempenho de Wenxinyiyan no campo chinês é realmente melhor do que os dois predecessores ChatGPT e Bing Chat.

A primeira é a pergunta sobre "O Problema dos Três Corpos". Tanto o Bing Chat quanto o Wenxin Yiyan podem responder corretamente à pergunta de quem é o autor e de onde ele é, enquanto o ChatGPT rotulou erroneamente a cidade natal de Liu Cixin como Shandong.

Curiosamente, a fonte de informações do Bing Chat é o Baidu Baike.

Quanto aos atores da série de TV "Three-Body Problem" que será encenada no início de 2023, o ChatGPT, cuja base de informações está travada em 2021, volta a desanimar, dizendo que a série de TV "Three-Body Problem" ainda não começou a filmar, enquanto o Bing Chat encontrou a resposta em Douban.

Em termos de direitos autorais de negócios, todos os três podem dar suas opiniões. O ChatGPT também anexou cuidadosamente um nome em inglês, o que é conveniente para entrarmos no mercado internacional.

No entanto, o Bing Chat identificou incorretamente o significado da pergunta na primeira consulta e não me forneceu o nome exato da empresa, mas forneceu uma solução sobre como escolher o nome da empresa.

Quanto a qual dos três nomes é melhor, deixo para todos julgarem.

Seja ChatGPT ou Bing Chat, eles não nos dão total tranquilidade ao resolver problemas de matemática, mas o problema da galinha e do coelho na mesma gaiola mencionado na coletiva de imprensa do Baidu não os incomodou e ambos responderam com precisão.

Em contraste, prefiro a interpretação do Bing Chat, que é mais como um professor persuasivo, e a resposta de Wen Xinyiyan é um pouco como uma resposta de referência depois da aula.

Em termos de compreensão chinesa, as vantagens de Wenxinyiyan são refletidas.

Quando perguntei "Quão caro era o papel em Luoyang naquela época", o ChatGPT erroneamente pensou que eu estava perguntando sobre o preço da Dinastia Tang e me disse que o papel em Luoyang não era nada caro. Não havia problema com A identificação do Bing Chat, mas não forneceu dados precisos.

E o preço de Wenxin de dois a três mil Wen é pelo menos consistente com os dados que obtive na pesquisa.

Acredito que você também tenha notado que, sem falar no conteúdo da escrita, nem o ChatGPT nem o Bing Chat entendem o que são os acrósticos tibetanos. Em comparação, o desempenho do Baidu Wenxin Yiyan é realmente excelente.

Claro, tal comparação é injusta com o ChatGPT e o Bing Chat, afinal, não experimentamos Wenxinyiyan oficialmente, e é apenas uma comparação com a apresentação na coletiva de imprensa. Depois de obter a oportunidade de teste, experimentaremos Wenxinyiyan pela primeira vez e veremos como nos saímos naquele momento.

Li Yanhong também mencionou na coletiva de imprensa que, embora o idioma chinês tenha vantagens óbvias, Wenxinyiyan não treinou o suficiente para idiomas e cenários de código em inglês e seu desempenho não é bom o suficiente. Acredito que o Baidu melhorará rapidamente no futuro.

Mantenha os pés no chão e olhe para as estrelas

Não há dúvida de que o lançamento de Wenxin Yiyan é um marco para a Internet chinesa.

Como Li Yanhong disse no início, o Baidu é o primeiro grande fabricante a produzir um produto que pode ser comparado ao ChatGPT e alcançou um avanço no produto gerador de IA de modelo grande em chinês a partir do zero.

Mas, por outro lado, também precisamos observar corretamente a lacuna entre Wenxinyiyan e ChatGPT.

O que hoje chamamos de ChatGPT, ou o modelo de linguagem GPT-4 por trás dele, levou 5 anos e 4 iterações para concluir o processo de mudança quantitativa para mudança qualitativa. É quase impossível para Wen Xinyiyan alcançá-lo em um período tão curto de tempo.

A julgar pela coletiva de imprensa de hoje, o Wenxinyiyan não é um produto revolucionário como as pessoas esperavam, mas sim um teste intermediário das reservas de tecnologia de IA do Baidu, mostrando que o Baidu também tem a capacidade de buscar e desenvolver os produtos de inteligência artificial mais avançados .

Após a abertura ao público, Wenxinyiyan pode aprender e melhorar por meio de um grande número de solicitações de pesquisa dos usuários, de modo a melhorar a precisão e a velocidade de lidar com os problemas correspondentes. No ChatGPT, vimos a velocidade com que os modelos de linguagem AI evoluem.

Se você também está ansioso para ver uma verdadeira "versão chinesa do ChatGPT", é melhor dar a Wen Xin algum tempo e paciência. Três dias após a despedida, devemos nos olhar com admiração, principalmente pelos modelos de IA.

Chega de besteira.

#Bem-vindo a seguir a conta pública oficial do WeChat de Aifaner: Aifaner (ID do WeChat: ifanr), conteúdo mais interessante será apresentado a você o mais rápido possível.

Ai Faner | Link Original · Ver comentários · Sina Weibo