A pesquisa de IA já está poluindo a Internet
Deixe os usuários comerem pedras e colocarem cola na pizza, e a derrubada da pesquisa de IA do Google ainda está próxima.
A Perplexity, que alegava ser subversiva para o Google, teve problemas logo depois.
Comparado ao ChatGPT, a pesquisa de IA pode se conectar à Internet, citar fontes e é menos fácil de falar bobagens.
Mas e se a própria fonte for lixo?
Pesquisa de IA, já referenciando outra pesquisa de IA
Muitas pessoas ouviram a piada sobre "Lin Daiyu arrancando o salgueiro-chorão". Recentemente, estava assistindo novamente Water Margin e tive uma ideia e perguntei a Perplexidade em chinês: "Quais são as semelhanças entre o personagem de Lin Daiyu e o personagem de Lu Zhishen?"
A resposta não foi digna de nota, mas um personagem inesperado apareceu na fonte citada: Byte Doubao, o assistente de IA de propriedade de Douyin.
Será esta uma nova forma de guerra empresarial? Quando cliquei, descobri que o conteúdo era o histórico de bate-papo entre o usuário e Doubao, e as respostas da IA eram muito boas em estereótipos. Se a qualidade for melhor que a conta de marketing, escrever assim é um pecado a mais.
Quando pesquisei diretamente a mesma pergunta no Google, Doubao voltou a aumentar sua presença e ficou em segundo lugar. Não era a mesma citação de Perplexidade, mas quando cliquei nela ainda era uma série de bobagens começando com "primeiro". " E em segundo lugar".
Conforme relatado anteriormente por The Information, Perplexity usa APIs para acessar dados sobre as classificações de pesquisa do Bing e do Google, que determinam a relevância, qualidade e autoridade das páginas da web.
Ou seja, se Beanbao é fácil de pesquisar no Google, pode ser mais fácil ser citado pela Perplexity. Isso deixa as pessoas curiosas: por que os pufes podem aparecer nos motores de busca?
Quando entrei na versão mais recente da versão web do Doubao, a resposta apareceu. Ele marcou uma opção por padrão: permitir que conteúdo compartilhado seja incluído pelos mecanismos de pesquisa e exibido na página de resultados da pesquisa.
A experiência acima ocorreu no dia 31 de maio, às 14h. Às 19h do dia 1º de junho, Byte respondeu a Aifaner, dizendo que Doubao foi atualizado e o conteúdo é compartilhado nos mecanismos de busca. Não é verificado por padrão, mas o usuário escolhe ativamente ser rastreado pelos mecanismos de busca.
Ao mesmo tempo, Byte disse que parte do conteúdo de perguntas e respostas pesquisado e incluído era, na verdade, conteúdo de perguntas e respostas de alta qualidade criado por alguém usando uma conta virtual, não por um usuário real. Já foi limpo. Ao pesquisar no Google, existem apenas 5 resultados no site.
Doubao parece ter estabelecido um precedente ao permitir a indexação de registros de bate-papo entre usuários e IA. Perplexity, Tiangong, Secret Tower e 360 AI podem compartilhar o histórico de bate-papo como um link, mas não há opção semelhante ao Beanbao.
O ChatGPT também suporta o compartilhamento de conversas com links, mas promete que será usado apenas para compartilhamento entre indivíduos e não aparecerá em resultados de pesquisas públicas na Internet.
Nos primeiros anos, as “fazendas de conteúdo” roubavam ou reuniam artigos de outras pessoas para produzir conteúdo rapidamente. Eles contavam com estratégias de SEO (otimização de mecanismos de pesquisa), como otimização de palavras-chave e atualizações frequentes, para ocupar a primeira fila das páginas de pesquisa e ganhar tráfego e. taxas de publicidade.
Naquela época, os contribuidores de conteúdo ainda eram pessoas reais, produzindo vários artigos todos os dias, mas agora é a vez da IA, e as capacidades de combate de copiar, colar, limpar e produção em massa não estão no mesmo nível.
“Lin Daiyu desenraizou os salgueiros-chorões” e “Lu Zhishen cantou a canção de enterrar flores” não são fatos. Quanto mais as pessoas diziam isso, mais peso tinha, e se tornou um fato aos olhos da pesquisa da IA. eram Zhihu, Douyin, histórias com nariz e olhos inventadas por usuários de Jianshu.
Se a fonte de informação se tornar a IA, os resultados serão ainda mais trágicos. Imagine que mais conteúdo gerado por IA é incluído no Google, as pesquisas de IA referem-se às classificações de pesquisa do Google e, então, o que é finalmente apresentado aos usuários são os resultados indesejados da IA sobrepostos à IA.
Os seres humanos que são alimentados só podem tornar-se mais criteriosos e distinguir informações úteis de bobagens.
Pesquisa de IA de 80 pontos
Para ser justo, ainda gosto de produtos de pesquisa de IA, como o Perplexity. Eles mais uma vez melhoraram minha produtividade após o ChatGPT.
Os humanos fazem perguntas, pesquisam, resumem e documentam. Já é um fluxo de trabalho maduro. Pagamos menos, mas somos mais eficientes.
Na maioria dos casos, o desempenho da pesquisa de IA é bastante bom. Parte do motivo pelo qual a IA do Google foi derrubada foi que ele estava ansioso para lançar recursos e se concentrou apenas em aumentar o peso do Reddit nas buscas, não conseguindo permitir que a IA refletisse se os resultados eram consistentes com o bom senso.
Quando inseri o mesmo problema que causou a falha na pesquisa de IA do Google no Perplexity, os resultados foram mais satisfatórios.
Em relação a “quantas pedras as pessoas comem por dia?”, Perplexity pode encontrar com precisão a fonte do Onion News e explicar que é um absurdo, ao contrário da pesquisa de IA do Google que trata o Onion News como um padrão.
Há também "O que devo fazer se o queijo da pizza escorregar facilmente?" A IA do Google sugeriu adicionar um pouco de cola antes de pesquisar. A perplexidade era obviamente mais inteligente e forneceu alguns métodos razoáveis primeiro. Depois que perguntei se a cola poderia ser adicionada, descobri com precisão o engano. Pesquisa de IA do Google. Postagem no Reddit, dizendo que era uma piada.
Para tornar os resultados mais rigorosos, a Perplexity chegou a procurar na Amazon, dizendo que só encontrou uma variedade de colas atóxicas, e não disse que essas colas podem ser usadas para alimentação.
Comparado com o Perplexity, o Google obviamente não é inferior em capacidades de modelo, mas em engenharia e produção subsequentes.
Em princípio, a pesquisa de IA consiste em pesquisar primeiro e depois resumir. Em comparação com os robôs de bate-papo que não estão conectados à Internet, há menos ilusões. Uma das principais tecnologias é o RAG (Retrieval Augmentation Generation).
RAG combina recuperação de informações e modelos generativos. A recuperação de informações encontra informações relevantes em uma enorme biblioteca de documentos com base em consultas de usuários, usando esses documentos recuperados como contexto para gerar respostas mais precisas e detalhadas.
A biblioteca de documentos aqui pode ser a biblioteca de índice de um mecanismo de pesquisa tradicional, ou pode ser um banco de dados proprietário, como direito, ou conteúdo gerado pelo usuário, como mídia social.
Se uma página da web estiver repleta de muito conteúdo gerado por IA de baixa qualidade, isso terá um impacto negativo no RAG da pesquisa de IA.
Então, face ao conteúdo agressivo gerado pela IA, a segunda metade da pesquisa de IA pode ser continuar a competir com capacidades de engenharia que não sejam modelos, e comparar a qualidade das fontes de dados e capacidades de pesquisa, incluindo se pode pesquisar por mais páginas da web e pesquise páginas da web com mais autoridade ou integre informações proprietárias, como relatórios financeiros.
A situação atual é que gradualmente nos tornamos inseparáveis da pesquisa de IA. Se a pesquisa tradicional que depende de palavras-chave e abertura manual de links é de 40 pontos, o modelo grande que é fácil de falar bobagem é de 60 pontos, e a pesquisa de IA em rede tem. elevou o padrão para 80 pontos. Embora você ainda cometa erros, você não pode voltar atrás depois de experimentá-los, então não precisa negá-los completamente.
Citando fontes de várias maneiras, a guerra empresarial da pesquisa de IA
Além das páginas web comuns, os produtos de pesquisa de IA parecem ter a mesma ideia: fornecer fontes de informação multimodais.
360 AI pode encontrar vídeos, Secret Tower pode encontrar podcasts e trabalhos acadêmicos, e Perplexity pode pesquisar no Reddit e no YouTube.
Mas a pesquisa de IA tem mais a ver com fornecer uma cartilha. Se você quiser um conteúdo mais detalhado, ainda assim não pode ser preguiçoso e ir até a fonte da informação.
Ao mesmo tempo, há outro fenômeno interessante. Os aplicativos estão lançando funções de pesquisa de IA integradas, como o “Sousousu” de Xiaohongshu em testes internos e o “Livro de perguntas de IA” do WeChat Reading para explorar a IA no ecossistema existente. Nesse sentido, também são produtos de busca de IA.
▲ Foto de: Xiaohongshu@三水水
O aplicativo Tencent Yuanbao, lançado há 2 dias, é baseado no grande modelo Hunyuan e integra funções como pesquisa de IA, resumo de IA e escrita de IA. Foi ainda mais promissor desde o início.
Porque possui recursos como a plataforma de contas públicas WeChat e a plataforma Tencent News, e a conta pública é uma coleção de conteúdo de alta qualidade na Internet chinesa.
Por exemplo, se você inserir um título e pesquisar um artigo específico sobre contas públicas, a Tencent Yuanbao poderá fornecer um resumo melhor e recomendar mais artigos sobre contas públicas. Pelo contrário, IA como Doubao captura os canais de distribuição de conteúdo de contas públicas e o resumo é relativamente omitido.
Combinado com a operação do Doubao para exibir conteúdo de IA na página de resultados de pesquisa, parece que nos lembramos novamente da distribuição de conteúdo da Internet móvel.
Na era da Internet móvel, diferentemente da era anterior dos portais, os aplicativos são isolados uns dos outros e difíceis de serem rastreados pelos mecanismos de busca. Por exemplo, se você inserir o título de um artigo de conta pública, o mecanismo de pesquisa não conseguirá encontrar o texto original e só poderá ver o canal de distribuição.
Ao mesmo tempo, nos motores de busca tradicionais, existem muitas distrações, como anúncios, e também há muito conteúdo de contas de marketing de baixa qualidade. Aos poucos nos acostumamos com isso. Para tutoriais do sistema, vá para a Estação B, para. faça perguntas sobre assuntos triviais da vida cotidiana, use o Xiaohongshu e pesquise artigos no WeChat.
Com cada vez mais produtos de pesquisa de IA e conteúdo gerado por IA, esta situação pode surgir novamente no futuro – o conteúdo da web se tornará cada vez mais misturado, com ganho de quantidade, enquanto o conteúdo de alta qualidade permanecerá fechado como sempre, transformando-se em pesquisa de IA vertical. fosso.
Além de pesquisas de IA multimodais grandes e abrangentes, podem surgir cada vez mais pesquisas verticais de IA excelentes.
Por exemplo, o mecanismo de busca acadêmico Consensus tem boa reputação, fontes de alta qualidade de mais de 200 milhões de artigos e, combinado com recursos de análise orientados por IA, a resposta sempre citará um determinado estudo.
Pergunte ao consenso "O exercício pode melhorar a capacidade cognitiva?" Não se apressou em tirar conclusões. Em vez disso, escreveu um resumo e forneceu uma tabela, em vez de respondê-la como uma simples pergunta "se".
Nossa expectativa para a pesquisa de IA é fornecer conteúdo melhor, mais diversificado, mais visual e mais personalizado com mais rapidez e responder a perguntas mais complexas e específicas durante o processo interativo de comunicação em linguagem humana.
No entanto, ao mesmo tempo, o conteúdo e a ecologia da pesquisa também estão a ser destruídos pela IA, o que parece ser uma metáfora para os dois lados da IA.
No futuro, certamente haverá cada vez mais conteúdo gerado por IA. Em meio à tensão entre prós e contras, se é mais difícil ou mais fácil encontrar informações mais úteis ainda é uma questão em aberto. O sonho de apenas usá-la ainda não se tornou realidade. Se tratarmos a IA como uma ferramenta e exercermos a nossa própria iniciativa subjetiva, os humanos não ficarão tristes e desapontados facilmente.
# Bem-vindo a seguir a conta pública oficial do WeChat do aifaner: aifaner (WeChat ID: ifanr). Mais conteúdo interessante será fornecido a você o mais rápido possível.