A IA está crescendo há dois anos e a tecnologia está se desenvolvendo rapidamente. O grande modelo rompeu o dilema da comercialização?

Desde o surgimento do ChatGPT, a mania da IA ​​vem varrendo há dois anos. Nos últimos dois anos, as pessoas comuns ficaram entusiasmadas com as capacidades dos grandes modelos de linguagem. Eles podem gerar texto suave e natural com apenas uma instrução. Cenas de filmes de ficção científica agora se tornaram uma realidade. 

O caminho dos grandes modelos também começou a entrar numa encruzilhada, como transformar novas tecnologias em novos produtos, satisfazer necessidades reais e desenvolver-se num novo ecossistema de negócios.

Assim como os pagamentos móveis, smartphones e LTE desencadearam conjuntamente a prosperidade da era da Internet móvel, a indústria de IA também está procurando ansiosamente por esse PMF (Product Market Fit) este ano.

A grande viagem de novas tecnologias já começou. A possibilidade de descobrir um novo continente determinará se o Big Model é outro jogo de capital para queimar dinheiro, uma recorrência acelerada da bolha .com ou o início de uma nova revolução industrial, como disse Huang Renxun. . A resposta estará disponível para nós mais rapidamente do que AGI. 

Grandes problemas com grandes modelos

Hoje, a competição de modelos básicos formou basicamente um padrão estável. Liderado pela OpenAI, seu ChatGPT também é líder de mercado. Anthropic, DeepMind, Llama e Grok também têm seus próprios pontos fortes.

Portanto, o mais emocionante deste ano não é quantos parâmetros a mais foram expandidos ou quantos segundos a velocidade de resposta foi melhorada, mas como a tecnologia do modelo grande foi transformada em um produto utilizável. 

Como implementar a tecnologia de grandes modelos de linguagem tem sido um problema difícil desde o início. Certa vez, a Harvard Business Review conduziu uma pesquisa e descobriu que existem até 100 tipos de aplicações generativas de IA.

No entanto, existem cinco categorias amplas: resolução de problemas técnicos, produção e edição de conteúdo, suporte ao cliente, aprendizagem e educação, criação artística e pesquisa. 

A conhecida empresa de investimentos a16z apresentou excelentes produtos de IA generativa na mente de sua equipe, muitos dos quais são familiares, como Perplexity, Claude e ChatGPT de uso geral. Existem também outros mais verticais, como os produtos de anotações Granola, Wispr Flow, Every Inc., Cubby, etc. Há também o NotebookLM, o maior vencedor deste ano na área educacional, ou os chatbots Character.ai, Replika, etc.  

Blooming Flowers é para usuários comuns: a maioria dos produtos acima são gratuitos e suficientes. O custo da versão de assinatura ou da versão pro não é necessário. Tão forte quanto o ChatGPT, a receita de assinaturas deste ano é de aproximadamente US$ 283 milhões por mês, o que triplicou em relação ao ano passado. Mas face aos enormes custos, este rendimento parece ser uma gota no oceano.

Aproveitar o desenvolvimento da ciência e da tecnologia é uma alegria para os usuários comuns, enquanto o óleo de cozinha sob o fogo é deixado para os profissionais: por mais excitante que seja a evolução tecnológica, ele não pode ficar no laboratório, mas deve entrar na sociedade comercial para ser testado . O modelo de assinatura não foi amplamente aceito e o momento da publicidade ainda não chegou. Resta muito pouco tempo para desperdiçar dinheiro em modelos grandes.

Em contraste, a tendência dos negócios toB é muito mais confiante.

O número de menções à IA nas teleconferências de resultados da Fortune 500 quase dobrou desde 2018. A IA generativa foi o tema mais mencionado em 19,7% de todas as teleconferências de resultados.

Este também é o consenso de toda a indústria. De acordo com o documento azul "Relatório de Desenvolvimento de Inteligência Artificial (2024)" divulgado pela Academia Chinesa de Tecnologia da Informação e Comunicação, em 2026, mais de 80% das empresas usarão APIs de inteligência artificial generativa ou implantarão aplicativos generativos.

As aplicações para o lado empresarial e para o consumidor mostram diferentes tendências de desenvolvimento: Para o lado do consumidor, as aplicações de modelos grandes concentram-se no baixo limiar e na criatividade. Para o lado empresarial, os aplicativos de modelos grandes prestam mais atenção à personalização profissional e ao feedback de benefícios.

Por outras palavras, melhorar a eficiência é, obviamente, o que todas as empresas procuram e pretendem alcançar, mas estas quatro palavras são demasiado vagas. Modelos grandes precisam provar que podem realmente resolver problemas em cenários de uso e realmente melhorar a eficiência. 

Encontre com precisão o ângulo de corte e deixe a tecnologia cair 

Quer se trate do investimento de recursos ou da intensidade do desenvolvimento do mercado, a concorrência nacional por grandes modelos será acirrada ao longo de 2024.

De acordo com dados do Ministério da Indústria e Tecnologia da Informação, a taxa de crescimento do grande mercado de modelos linguísticos da China excederá 100% em 2023, com o tamanho do mercado atingindo 14,7 bilhões de yuans. Vários fabricantes estão tentando ativamente o processo de comercialização. A primeira coisa a começar é a guerra de preços: os custos de faturamento de tokens, chamadas de API, etc. Os preços de muitos modelos grandes de uso geral convencionais e populares não estão mais longe de serem inúteis.

É melhor baixar preços e reduzir custos. Compreender o negócio e analisar os cenários é um caminho mais difícil.

No entanto, nem todas as empresas participam numa guerra de preços e dependem de preços baixos para vencer.

"Neste caso, é mais importante encontrar nossas características e aproveitar ao máximo nossas vantagens. Existem muitos cenários dentro da própria Tencent, que nos fornecem mais insights e aprimoram ainda mais nossas capacidades." O gerente de produto da ToB, Zhao Xinyu, pensa desta forma: “Olhe para fora, concentre-se em um setor, concentre-se em alguns cenários específicos desse setor e, em seguida, expanda lentamente”.

Entre os muitos modelos básicos, Hunyuan pode não ser o mais popular, mas sua força técnica não pode ser ignorada.

Em setembro, Hunyuan lançou o modelo de literatura geral Hunyuan Turbo, que adota uma nova estrutura de modelo híbrido de especialistas (MoE). Desde a compreensão e geração da linguagem, raciocínio lógico, reconhecimento de intenção, até codificação, contexto longo e tarefas de agregação, tem um desempenho bastante forte. Na versão de atualização dinâmica de novembro, ele foi atualizado para o modelo de melhor desempenho de toda a série. Atualmente, os recursos da Tencent Hunyuan estão sendo totalmente exportados através da Tencent Cloud. Ao fornecer modelos de vários tamanhos e tipos, combinados com outros produtos de IA e recursos da Tencent Cloud Intelligence, ajuda a modelar aplicativos a serem implementados em cenários.

Olhando para as atuais formas de implementação de aplicativos modelo, elas podem ser divididas em dois tipos: cenas sérias e cenas de entretenimento. Este último é semelhante a chatbots, aplicativos complementares, etc.

"Cenários sérios" referem-se a cenários de aplicação que exigem maior precisão e confiabilidade nas principais operações comerciais das empresas. Nestes cenários, grandes modelos são responsáveis ​​pelo processamento estruturado de informações e muitas vezes precisam seguir processos de negócios e padrões de qualidade predefinidos. Seus efeitos de aplicação estarão diretamente relacionados à eficiência operacional e aos resultados de negócios da empresa.

Certa vez, a Tencent Cloud ajudou um provedor de serviços de chamadas a construir um sistema de atendimento ao cliente . Este é um cenário típico e sério. Ao mesmo tempo, as chamadas de saída envolvem capacidades de diálogo em linguagem natural, compreensão de conteúdo e capacidades de análise, e parece que a linguagem natural tem um alto grau de adaptabilidade a grandes modelos de linguagem.

Na verdade, o desafio está nos detalhes. Naquela época, a equipe enfrentou dois desafios principais. O primeiro são problemas de desempenho Devido à enorme quantidade de parâmetros do modelo, atingindo uma escala de 70B ou 300B, como completar a resposta em 500 milissegundos e passá-la para o sistema TTS downstream tornou-se um problema técnico importante.

A segunda é a precisão da lógica do diálogo. O modelo dará respostas ilógicas em algumas conversas, afetando o efeito geral da conversa. Para superar esses desafios, a equipe do projeto adotou uma estratégia de iteração intensiva e manteve um ritmo rápido de iteração de uma versão por semana dentro de um ciclo de desenvolvimento de 1 a 2 meses.

Os clientes empresariais demonstraram interesse na tecnologia de modelos de linguagem de grande porte e estão dispostos a fazer tentativas inovadoras. No entanto, há sempre uma lacuna cognitiva na integração profunda da tecnologia e dos negócios. Isto não se deve à falta de compreensão da empresa sobre o seu próprio negócio, mas à necessidade de uma equipa técnica profissional para encontrar os cenários mais apropriados através de uma compreensão profunda dos pontos problemáticos da indústria e dos cenários de negócios, soluções de implementação de IA personalizadas para o empresa e alcançar a tecnologia e a melhor opção para o negócio.

"A abordagem tradicional pode exigir que os operadores construam (corpora) cena por cena", disse Xinyu, "Com modelos grandes, você só precisa dar um aviso para perceber os requisitos. Depois de descobrir os requisitos, a equipe Hunyuan atualiza a versão." quase todas as semanas, o que acelera a iteração. Depois de um ou dois meses, a precisão atingiu 95%.

Para este serviço de chamadas de saída, a tecnologia generativa é completamente nova. Hunyuan permitiu-lhes ver diretamente os benefícios trazidos pelos grandes modelos, reduzindo as despesas com mão de obra em três quartos.

“A melhor maneira é mostrar os efeitos”, disse Xinyu. Quando o cliente tem um pouco, mas não muito, de compreensão da tecnologia generativa, é mais eficaz mostrar os efeitos. Através da experiência comercial do cliente, podemos encontrar cenários que podem ser cortados, realizar testes e verificações diretas e demonstrar os efeitos que podem ser melhorados.

Uma experiência semelhante, refletida na cooperação com a Xiaomi, é uma cooperação chamada “corrida bidirecional”.

A outra parte espera introduzir grandes modelos nas interações de perguntas e respostas e aplicar recursos de pesquisa de IA ao lado do terminal. Isso atinge dois dos pontos fortes da Hunyuan: primeiro, o suporte fornecido pelo rico ecossistema de conteúdo da Tencent, em segundo lugar, as capacidades da Hunyuan em pesquisa de IA; Para perguntas e respostas, a precisão é muito crítica.

“Ainda havia muitas dificuldades no início”, lembrou Xinyu. “Da perspectiva deles , o formulário de negócios cobre vários cenários, incluindo conversa fiada, perguntas e respostas de conhecimento e outros tipos diferentes. Entre eles, o cenário de perguntas e respostas de conhecimento tem uma taxa de precisão relativamente alta. . Exigir."

Através de testes iniciais, a equipe Hunyuan esclareceu suas vantagens no cenário de pesquisa. As duas partes trabalharam juntas para refinar gradualmente a interação de perguntas e respostas em um sentido amplo, de acordo com os diferentes níveis de tópico. Esse tipo de subdivisão pode permitir que o modelo entenda mais claramente as necessidades específicas e os requisitos de efeito de cada cena, de modo a realizar uma otimização mais direcionada. 

A cena de curiosidades se tornou esse ponto de aterrissagem. Em termos de implementação subsequente, Hunyuan ainda tem muitos desafios a superar: Escusado será dizer que o problema do atraso, o tempo de resposta deve ser rápido, em segundo lugar, a integração do conteúdo de pesquisa; 

"Em todo o link, construímos um mecanismo de pesquisa autoconstruído e um modelo de classificação de intenção para determinar se é uma questão altamente urgente. Por exemplo, se é um tópico relacionado a notícias ou assuntos atuais e, em seguida, determinar se é uma pergunta que deve ser respondida ao modelo principal ou à pesquisa de IA."

Apenas as partes mais necessárias são chamadas, portanto a velocidade de resposta pode ser bastante melhorada. Uma descoberta importante é que 70% das consultas serão direcionadas para pesquisa de IA, o que significa que deve haver conteúdo rico o suficiente para o suporte de chamada mais básico.

Atrás de Hunyuan está todo o ecossistema de conteúdo da Tencent. Desde notícias, música, finanças e áreas ainda mais específicas, como assistência médica, você pode encontrar uma grande quantidade de conteúdo de alta qualidade no ecossistema da Tencent. Esses são dados que o modelo híbrido pode acessar e referenciar durante a pesquisa, e também são barreiras únicas. 

Após mais de dois meses de iteração intensiva, os requisitos foram finalmente totalmente atendidos em termos de qualidade de resposta, resposta e desempenho, e foi lançado no negócio real da Xiaomi.

Esta é a essência do negócio toB. Para conseguir gerar receita e conquistar confiança, ele precisa realmente agregar valor ao negócio do cliente.

Somente generalizando o “volume” poderemos avançar para mais cenários 

A implementação de grandes modelos em diferentes indústrias e produtos está, na verdade, promovendo o crescimento da própria tecnologia. 

Para alguns produtos de modelo grande, há uma consideração fundamental na escolha do caminho toC: usar feedback do lado C para otimizar o modelo. Os modelos grandes têm uma demanda infinita por ajustes, e o número e a atividade dos grupos de consumidores finais C fornecem alimento para as iterações do modelo. Desta forma, o volante iterativo pode começar a funcionar.

Na verdade, isso também pode ser alcançado nos negócios toB, e os requisitos são ainda maiores.

A função de correção de composição chinesa K12 de "Youth Get" aplica os recursos multimodais de Hunyuan. Combinado com a tecnologia OCR da Tencent Cloud Intelligence, o conteúdo das composições dos alunos é identificado e a composição é pontuada por um grande modelo de acordo com os padrões de pontuação definidos.

Normalmente, se a diferença entre o modelo grande e o professor real estiver dentro de cinco pontos, é bom – mas isso não é fácil de conseguir. No início, a diferença entre a avaliação de Hunyuan e a avaliação do professor real era inferior a cinco pontos em apenas 80% das vezes.

"O modelo possui certos métodos e capacidades e pode resolver problemas em alguns cenários. Mas focar no negócio de um cliente específico tem requisitos mais elevados para esse efeito . "Talvez 90% de precisão possa atingir as metas de negócios., mas apenas 70% e. 80% das vezes, há uma certa distância.” 

Isso significa que temos que continuar a “rolar”. À medida que a base de clientes das empresas de serviços continua a se expandir, novos requisitos também são apresentados para a própria tecnologia: Primeiro, a velocidade da iteração é bastante melhorada – quando se trata de usuários finais C, a iteração pode levar de um a dois meses. Agora, uma versão pode aparecer toda semana. Esse ritmo de iteração de alta frequência promoveu muito o crescimento e o progresso do modelo.

Em segundo lugar, ao servir continuamente diferentes cenários empresariais, a capacidade de generalização do modelo também foi significativamente melhorada. Isto mostra que o atendimento aprofundado às necessidades de empresas diversificadas não só acelera o ritmo de desenvolvimento e iteração do modelo, mas também melhora a praticidade e adaptabilidade do modelo, que pode ser expandido de cenários sérios para cenários orientados para o entretenimento. 

A plataforma de conteúdo de role-playing "Dream Dimension" , que acaba de receber dezenas de milhões de financiamento da Série A , aplicou o papel Hunyuan, um modelo exclusivo de role-playing do modelo Hunyuan. Ele está posicionado para atender jovens usuários e combina generativo. Tecnologia de IA para fornecer uma experiência interativa dramática com personagens virtuais.

O papel Hunyuan cria uma nova forma de interação humano-computador. Ao criar imagens de personagens virtuais ricas e diversificadas e com base em cenários de enredo e configurações de personagens predefinidos, podemos desenvolver diálogos interativos naturais e suaves com os usuários.

No nível técnico, tais cenários foram aplicados ao papel Hunyuan, que mostrou vantagens importantes no processamento de diálogos de texto longos e curtos, reconhecimento e resposta de intenções, etc., é capaz de diversos cenários de aplicação e demonstrou excelentes capacidades de antropomorfismo de conteúdo. —— Ele não apenas permite diálogo e interação calorosos, mas também promove o desenvolvimento do enredo e cria uma experiência de usuário envolvente.

Essas características tornam o papel Hunyuan uma ferramenta poderosa para aquisição de clientes de produtos e operações de usuários, desempenhando um papel importante na melhoria da retenção de usuários e na adesão ao uso. Também reflete que a capacidade de generalização formada por Hunyuan, que foi treinada e aprimorada em cenas sérias, pode abranger uma gama mais ampla de cenas e até mesmo ser aplicada no lado do dispositivo.

De cenas sérias à expansão gradual para entretenimento, criatividade e ainda mais cenas, é uma jornada que aplicações de grandes modelos devem embarcar.

À medida que a tecnologia amadurece e os custos diminuem, os grandes modelos tendem a expandir-se para uma gama mais ampla de cenários de aplicação. Originalmente, concentrou-se em cenários de negócios sérios, como escritórios corporativos, análise de dados, pesquisa científica e outras indústrias, porque esses cenários têm necessidades claras e alta disposição a pagar.

Para expandir ainda mais para o entretenimento, a criatividade, a produção de conteúdo e outras indústrias, precisamos ter um ponto de ancoragem em nosso pensamento: sempre focando na solução dos pontos de demanda em cenários específicos como o objetivo principal, e ancorando o ponto de entrada para a integração de grandes capacidades de modelos .

Além da cooperação com software aplicativo, também é necessário cooperar com fabricantes de hardware para que o modelo possa ser exibido e utilizado no terminal mais próximo dos consumidores, proporcionando uma experiência de atendimento mais conveniente, instantânea e mais próxima do dia a dia dos usuários. .

Neste processo, a consciência e a aceitação do mercado da tecnologia de IA generativa estão constantemente a melhorar, e a base de utilizadores também continua a expandir-se. Confrontado com este ambiente de mercado em rápida mudança, a capacidade de iterar modelos tornou-se particularmente importante. Isto não se reflete apenas no desempenho técnico, mas também inclui múltiplas dimensões, como a compreensão das necessidades do usuário e a adaptabilidade a diferentes cenários. Somente os modelos e equipes que conseguem aprender rapidamente, otimizar continuamente e se adaptar continuamente às novas necessidades podem manter uma vantagem na competição. 

À medida que continua a abranger mais cenários, também chega a mais consumidores finais. À medida que o mercado como um todo aceita a tecnologia generativa, o número de potenciais utilizadores continuará a aumentar. Apenas um modelo que possa iterar e melhorar rapidamente poderá adaptar-se às mudanças de forma aguçada e avançar de forma mais constante e mais avançada.

# Bem-vindo a seguir a conta pública oficial do WeChat de Aifaner: Aifaner (WeChat ID: ifanr). Mais conteúdo interessante será fornecido a você o mais rápido possível.

Ai Faner | Link original · Ver comentários · Sina Weibo |