Pesado pela manhã! A atualização épica do ChatGPT do Google, o novo modelo alcança o GPT-4 e subverte completamente a pesquisa
Antes de começar o artigo, deixe-me contar um pouco de conhecimento frio: este ano é o 15º ano que o Google realiza a I/O Developer Conference.
Ao longo das conferências I/O nos últimos sete anos, o conteúdo de IA sempre foi uma prioridade para o Google. Por exemplo, antes de o ChatGPT se tornar popular, o Google já havia demonstrado a série LaMDA de modelos de geração de linguagem na conferência I/O, mas não esperou pela oportunidade do incêndio.
Hoje, o surto do ChatGPT levou a IA ao seu melhor momento, mas também deixou o Google extremamente ansioso.
Depois de assistir a toda a conferência, o Google mencionou a palavra "IA" quase 200 vezes e quase escreveu IA em todos os produtos, incluindo Gmail, pesquisa, Pixel etc., ansioso para provar a todos que ainda está na vanguarda da IA.
Se esta conferência tivesse ocorrido há meio ano, teria sido extremamente empolgante: escritório assistido por IA, pesquisa de IA, programação de IA, cada uma das quais é uma importante aplicação técnica. É uma pena que a Microsoft tenha ido tão longe antes disso.
A reação do público pode até ser considerada um pouco fria. Na verdade, houve apenas dois grandes aplausos: o modo escuro de Bard e o dock gratuito para o tablet Pixel.
Na conferência I/O de hoje, os novos produtos e tecnologias lançados pelo Google são como alcançar a Microsoft e a OpenAI – alcançando o futuro da IA que foi realizado preventivamente.
PaLM2, a arma secreta do Google contra GPT-4
O modelo de linguagem grande tornou-se o principal produto no círculo de tecnologia. Cada empresa espera criar um modelo autodesenvolvido que possa desafiar o GPT a provar sua força de pesquisa científica, e o Google não é exceção.
O Google lançou uma nova geração de modelo de linguagem grande PaLM2 para competir com o GPT-4.
De acordo com o Google, eles usaram um grande número de conjuntos de dados matemáticos e científicos para treinar o PaLM 2. Em comparação com o modelo PaLM do ano passado, o PaLM 2 melhorou muito seu processamento multilíngue, raciocínio e capacidades de codificação.
De acordo com o teste oficial do Google, alguns resultados do PaLM2 (como matemática) são melhores do que o GPT-4.
O Google não divulgou a escala de parâmetros específica do PaLM 2, apenas mencionando que o PaLM 2 é baseado nas mais recentes instalações de computação JAX e TPU v4. O Google otimizou o algoritmo do PaLM 2, tornando-o menor que o PaLM em tamanho, mas com melhor desempenho geral e maior eficiência computacional.
Suporte PaLM 2 Mais de 100 linguagens diferentes e mais de 20 linguagens de programação, incluindo JavaScript, Python, Prolog, Verilog, Fortran, etc., podem ser consideradas um mestre da linguagem.
Não basta fazer a compreensão e geração de texto convencional. PaLM 2, que suporta multimodalidade, também pode entender e gerar conteúdo de áudio e vídeo. O Google mostrou um modelo chamado Med-PaLM que é ajustado para a área médica. De acordo com Análise de filme X Light de lesões de pacientes, o Google atingiu o nível de médicos humanos a esse respeito.
O modelo PaLM 2 também pode ser "dividido" em 4 versões de tamanhos diferentes e implantado em vários dispositivos. Por exemplo, um modelo Gecko relativamente pequeno pode ser executado em um smartphone, de modo que o terminal móvel também possa ter um modelo de linguagem grande.
Vale a pena mencionar que o PaLM 2 está atualmente aberto para visualização, e o próprio robô de bate-papo do Google, Bard, usou o modelo PaLM 2 para aprimorar sua capacidade de resposta. O conteúdo do Google tem mais de 70 equipes de produtos usando PaLM 2 para criar produtos. A maioria das atualizações nesta conferência são projetadas com base no modelo PaLM 2. Pode-se dizer que PaLM 2 é o principal mecanismo da IA abrangente do Google.
Além do PaLM 2, o CEO do Google, Sundar Pichai, também estragou um pouco as novidades do modelo grande de próxima geração Gemini (Gemini), que ele disse ter sido projetado para ser multimodal, eficiente e construído para inovações futuras. .
Gemini é um novo modelo desenvolvido em conjunto pela fusão de duas grandes equipes de IA, Google Brain e DeepMind. Pelo nome, pode-se ver que o Gemini combinará os pontos fortes dos dois e espera-se que esteja entre os modelos de linguagem grandes mais poderosos .
Bardo: Atualize multimodal, capaz de desenhar e ler imagens
Parece melhor, é mais abrangente e pode ser usado por mais pessoas.
Após menos de 2 meses de atualizações, o Google migrou o Bard para o modelo de linguagem grande mais poderoso PalM2, um concorrente do ChatGPT e BingChat que foi significativamente atualizado e mais poderoso:
- Cancele a lista de espera e abra para mais de 180 países e regiões;
- Adicionada pergunta e resposta com imagem, o diálogo é mais intuitivo;
- Integre o Adobe Firefly para gerar imagens rapidamente;
- Citações de fontes, modo escuro, botão de exportação de código, atualização de mais detalhes.
Limitado britânico e americano, apenas inglês, lista de espera, não é fácil usar o Bard com muitas restrições. A partir de hoje, a Bard está anunciando oficialmente o cancelamento da lista de espera e abrindo a experiência para mais de 180 países e regiões.
A Bard agora também suporta japonês e coreano e em breve expandirá o suporte para 40 idiomas, incluindo chinês.
Em termos de funções, Bard também passou por atualizações consideráveis, que podem ser resumidas em quatro palavras como "imagens e textos". Ao fazer perguntas ao Bard, ele não é mais um robô que pode apenas responder a textos secamente, mas também pode nos mostrar respostas mais ricas e intuitivas na forma de imagens.
Ao mesmo tempo, o Google também trouxe a capacidade do Google Lens para Bard, para que este pudesse não apenas responder a imagens, mas também entender imagens e redigir conteúdo com base nas informações da imagem. Por exemplo, você pode enviar a ele a foto de um cachorro e pedir que ele escreva legendas com base na raça do cachorro.
Talvez seja porque a função da imagem de Vincent ao lado é muito popular. O Google também adicionou essa função ao Bard, mas ela coopera com o Adobe Firefly. Ao integrar o Firefly's Bard, imagens de alta qualidade podem ser geradas em linguagem natural. E com o endosso da Adobe, não há necessidade de se preocupar com direitos autorais e qualidade das imagens.
A Adobe é apenas o começo, e o Google trabalhará com Kayak, OpenTable, empresas de recrutamento zip, Khan Academy e outros parceiros para adicionar mais recursos ao Bard.
Comparado com o ChatGPT, o posicionamento do Bard é mais tendencioso para o BingChat. É um mecanismo de busca e uma ferramenta de produtividade. Ele adicionará uma função de referência na próxima semana e exibirá a fonte do código gerado para garantir a precisão. E a capacidade de exportar e executar código foi adicionada para facilitar o trabalho dos desenvolvedores com eficiência. Aliás, foi adicionado um modo escuro, que arrancou aplausos da cena.
Embora houvesse alguns oolongs em sua estreia, o Google ainda nos mostrou um Bardo em constante aprimoramento. É uma pena que "nós" seja a palavra que mais ouvimos na introdução. Depois que todas as funções lançadas hoje forem implementadas e lançadas, o Bard será uma ferramenta suficientemente abrangente e madura.
Duet AI: Lide com tarefas de escritório para AI
Aí vem o concorrente Copilot.
O Google introduziu uma nova ferramenta, Duet AI, para seu Workspace, permitindo-nos ver o papel que a IA desempenha no pacote de escritório do Google baseado em nuvem:
- Documentação: resume o texto completo e escreve automaticamente;
- Apresentação de Slides: Diagrama de Vincent, Melhorando a Eficiência;
- Tabelas: Analisar dados, desenvolver estratégias.
No Google Docs, você pode dizer ao Duet AI o que deseja criar e fazer com que ele gere artigos automaticamente. Você também pode deixá-lo gerar diferentes estilos de escrita de acordo com suas necessidades.
A função "ChatPDF" de "ler" artigos e perguntas-chave não foi deixada para trás.
Esses recursos de geração, expansão e ajuste de texto também são usados no Google Mail.
Em termos de apresentações de slides, o Duet AI atua como um gerador de imagens, o que pode ajudá-lo a economizar tempo procurando imagens na Internet e enriquecer as apresentações de slides com conteúdo original.
No formulário, o Duet AI pode organizar automaticamente os dados de acordo com suas perguntas para tornar os dados mais padronizados.
Esses recursos também podem ser vinculados a outros serviços do Google. Por exemplo, depois de criar um formulário no Bard, você pode gerar um documento de formulário com um clique para uso posterior.
O Duet AI também adicionou um conjunto de ferramentas de desenvolvimento de nuvem do Google orientadas por aprendizado de máquina, que podem fornecer correção de erros de código em tempo real, geração, etc., e suporte a várias linguagens de desenvolvimento, como Go, Java, Javascript, Python e SQL.
Não precisamos esperar que Bard passe, agora podemos esperar Duet AI. Se você quiser experimentar esses recursos, ainda precisa entrar na lista de espera e esperar que o Google abra o teste na região correspondente.
De um modo geral, o Duet AI é menos surpreendente do que ver o Copilot pela primeira vez, e a demonstração da função parece ser mais fraca. Mas levou menos de dois meses para que Bard o alcançasse. Aguarde mais possibilidades trazidas pelo Duet AI.
Pesquisa do Google: redefinido, tudo
Pesquisas futuras podem ter esta aparência:
Impulsionada pelo PaLM 2, a pesquisa do Google também introduziu uma inovação, e um novo mecanismo de pesquisa SGE (Search Generative Experience) foi lançado. Você não precisa mais dividir uma grande pergunta em várias perguntas pequenas e depois reunir as respostas após pesquisando, com a bênção da IA generativa, você pode deixar a pesquisa fazer um trabalho pesado.
Na conferência, o Google destacou a melhoria da IA generativa nas compras. Ao usar o Google para pesquisar um produto, você verá a descrição do produto, avaliações, preços e imagens de exibição.
O Google, que tem mais de 35 bilhões de listagens de produtos, atualiza constantemente a uma taxa de 1,8 bilhão por hora. Ao pesquisar e comprar no Google, você pode obter resultados mais atualizados e confiáveis.
O Google acredita que a publicidade é uma parte importante da Internet e continuará a manter seu compromisso com a transparência da publicidade e garantir que os anúncios e os resultados de pesquisa sejam diferenciados.
O Google está abrindo inscrições para o Search Labs hoje e abrindo acesso nas próximas semanas, oferecendo suporte ao Google app e ao navegador Chrome. O link do aplicativo é o seguinte: labs.google.com/search
A ansiedade da IA do Google só pode ser resolvida com IA
Algumas pessoas dizem, brincando, que o Google I/O deste ano deveria ser chamado de Google AI/O. As joias da Microsoft e da OpenAI estão na frente, e o Google tem um momento um pouco menos surpreendente, mas esta é sem dúvida a auto-revolução mais resoluta do Google nos últimos anos.
O Google, que afirma ser o primeiro da IA, tem perdido oportunidades muitas vezes por causa de sua estratégia excessivamente cautelosa e conservadora. Agora o Google finalmente percebeu que deve agir rapidamente, como muitos executivos do Google disseram, para ser "ousado e responsável", e não pode mais hesitar por medo de cometer erros.
É claro que a IA não é uma panacéia, e o Bardo atualizado pode não ser capaz de mudar a tendência de subversão da pesquisa do Google. Mas não há dúvida de que a IA irá remodelar a busca e revolucionar essa interação.
O Bing, cuja participação é muito inferior à do Google, alcançou em apenas alguns meses mais de 100 milhões de usuários ativos diários por meio de chatbots e realizou mais de 500 milhões de chats, dos quais 70% dos usuários que experimentam a nova função de chat do Bing irá usá-lo para tarefas relacionadas à pesquisa.
Quando o maior mecanismo de busca do mundo decidir abandonar o fardo do passado e abraçar totalmente essa tendência, o que mudará pode não ser apenas o futuro do Google, mas também pode subverter o mecanismo operacional da Internet e mudar a interação de bilhões de usuários. .
Um mundo novo e mais simples está chegando.
#Bem-vindo a prestar atenção à conta pública oficial do WeChat de Aifaner: Aifaner (ID do WeChat: ifanr), conteúdo mais interessante será apresentado a você o mais rápido possível.