Tencent lança modelo Hunyuan! Como é ter um “Jarvis” no WeChat?

O dia 31 de agosto está destinado a se tornar um ponto de viragem fundamental na história dos modelos nacionais de grande escala. Várias empresas modelo nacionais de grande escala ultrapassaram o recorde e gradualmente abriram seus serviços ao público.

Isto significa que os modelos nacionais de grande escala entraram numa nova fase: os modelos nacionais de grande escala podem fornecer serviços a centenas de milhões de utilizadores e também enfrentarão o mesmo escrutínio e desafios.

Agora mesmo, a Tencent também lançou oficialmente um modelo de linguagem grande de uso geral autodesenvolvido – modelo grande Hunyuan.

Atualmente, a Tencent tem mais de 50 produtos e serviços próprios conectados aos testes de modelo em grande escala da Hunyuan, incluindo Tencent Cloud, Tencent Advertising, Tencent Documents, WeChat Souyisou, QQ Browser, etc. acesso.

Em comparação com Baidu e Ali, a Tencent, como gigante nacional da Internet, parece ser mais cautelosa na aplicação de grandes modelos. Na verdade, AIGC tem uma prioridade muito alta dentro da Tencent. Ma Huateng também expressou diretamente a atitude da Tencent na reunião de relatório financeiro da Tencent em maio:

No início pensámos que esta era uma oportunidade única na vida para a Internet, mas quanto mais pensávamos nisso, mais sentíamos que esta era uma oportunidade que existia uma vez em centenas de anos, semelhante à revolução industrial. que inventou a eletricidade, então achamos que (IA) é muito importante… mas não temos pressa em fazê-lo cedo. Quando terminar, retire o produto semiacabado para exibição.

Ai Faner também obteve a qualificação de experiência e irá descobrir mais detalhes para você na primeira vez.

Modelo grande Hunyuan, por favor me dê mais conselhos

Para quem está misturado, a vitalidade não está dividida, e o caos é um só, que é o início da vitalidade. Pode-se perceber pelo nome que a Tencent, que está ansiosa para “abrir o mundo”, tem grandes esperanças no modelo Hunyuan.

Como um modelo de linguagem grande de uso geral desenvolvido pelo autodesenvolvimento full-link da Tencent, o grande modelo Hunyuan tem um corpus excelente, um algoritmo de modelo inovador em grande escala, uma estrutura de aprendizado de máquina Angel autodesenvolvida e uma poderosa infraestrutura de poder de computação .

Para os cenários de aplicação reais, Jiang Jie, representante da equipe principal de P&D do Tencent Hunyuan Large Model e vice-presidente do Grupo Tencent, também demonstrou na conferência de imprensa que está comprometido com um Hunyuan Large Model mais confiável e maduro.

O modelo grande Hunyuan é mais confiável.Depois de muitas pesquisas e testes, o modelo grande Hunyuan encontrou um método baseado em sondagem, que pode efetivamente reduzir a taxa de alucinação do modelo de linguagem grande em 30% -50%.

O modelo grande Hunyuan, mais confiável, também pode identificar "armadilhas", resistir à "indução" e deixar o modelo dizer "não" a questões inseguras.

Diante dos desafios, o modelo híbrido mais maduro pode dar conta da geração e continuação de textos superlongos, como escrever um artigo sobre patentes de dispositivos agrícolas.

O grande modelo Hunyuan propõe uma nova estratégia de cadeia de pensamento, que efetivamente fortalece a tendência do modelo de desmontar e pensar sobre os problemas. A visão de Jiang Jie é que grandes modelos podem fazer inferências razoáveis ​​em combinação com cenários de aplicação reais, como humanos.

Jiang Jie perguntou ao modelo Hunyuan sobre "Quem é você, qual é a estrutura central do modelo Hunyuan e quais são os parâmetros do modelo Hunyuan?" Pode-se ver que a resposta do modelo Hunyuan está cheia de perguntas. .

É importante notar que o modelo grande Hunyuan será atualizado até julho de 2023 e ainda está em iteração.

A fim de demonstrar a capacidade de raciocínio lógico do modelo grande Hunyuan, Jiang Jie fez ao modelo grande Hunyuan uma pergunta de pensamento lógico: “Comprei um monte de café, bebi metade pela manhã e bebi a metade restante à tarde . Ainda restam 30 xícaras. Quantas xícaras você bebeu?" Em muito pouco tempo, o grande modelo Hunyuan deu a resposta correta.

Em comparação com os modelos convencionais de grande escala que se concentram em parâmetros e avaliação, os modelos de grande escala da Tencent Hunyuan prestam mais atenção às aplicações.

Por exemplo, em combinação com a reunião da Tencent, o grande modelo Hunyuan pode gerar um resumo de toda a reunião e classificar os detalhes relevantes da reunião.

Combinando com os documentos da Tencent, a conferência de imprensa também demonstrou as capacidades de indução de texto, criação e edição de documentos e tradução do grande modelo Hunyuan, dominou dezenas de cenários de geração de texto e gerou facilmente gráficos Excel com base em centenas de fórmulas.

Em combinação com a Tencent Advertising, o Hunyuan Large Model se adapta às características industriais e regionais, atende às necessidades de milhares de pessoas e realiza a integração natural de texto, imagens e vídeos. O efeito de geração de publicidade excede o mainstream Midjourney com uma taxa de adoção do usuário de 42%.Muito além do modelo de difusão estável de código aberto.

Na pista dos grandes modelos de IA, o layout da Tencent é, na verdade, muito anterior.

Em 2019, a Tencent lançou um grande modelo MoE de recomendação publicitária, com um único parâmetro de modelo superior a 100 bilhões.

Em 2021, a Tencent lançará um grande modelo de PNL com escala de 100 bilhões, o que melhorará significativamente a eficiência do treinamento e raciocínio do modelo e reduzirá custos.

Entrando em 2022, o grande modelo Hunyuan, que acumulou muito tempo, inaugurou a temporada de colheita.Em maio, o grande modelo Hunyuan AI liderou simultaneamente as três listas de classificações gerais do CLUE, compreensão de leitura e gráficos de conhecimento em grande escala, quebrando três recordes de uma só vez.

Um mês depois, o grande modelo de IA multimodal da Tencent foi aplicado pela primeira vez à publicidade e, naquela época, trouxe um aumento cumulativo de 15% no GMV para os anunciantes.

Estas acumulações lançaram as bases para o grande modelo Hunyuan.

Primeira experiência do modelo grande Tencent Hunyuan

A página inicial do "Tencent Hunyuan Assistant" consiste em duas guias, "Chat" e "Inspiration Discovery". A função "Chat" é semelhante aos produtos de IA de conversação. Ao contrário do ChatGPT, o "Tencent Hunyuan Assistant" integrou muitos comandos ao mesmo tempo. , algumas perguntas serão recomendadas a você na página inicial.

Eu estava correndo para escrever o manuscrito na coletiva de imprensa e também tentei deixá-lo escrever o manuscrito para ver se isso poderia me poupar algum tempo (moyu).

Em "Inspiration Discovery", integra as aplicações de muitos cenários comuns em diferentes setores, incluindo trabalho, programação, marketing, vida, role-playing, entretenimento e outros campos.

Você pode deixá-lo gerar código diretamente, escrever uma cópia grama ou deixá-lo desempenhar diferentes funções. Por exemplo, para pais novatos, você pode clicar diretamente em "Especialista em Educação" e vários problemas encontrados por crianças em diferentes estágios podem receber conselhos práticos. sugestão.

Os registros em “Chat” e “Inspiration Discovery” podem ser visualizados clicando no ícone do menu no canto superior esquerdo da página inicial. Em relação à questão dos dados do usuário, também vimos no acordo de privacidade que a Tencent promete não gravar essas conversas para treinamento do modelo real do usuário.

Para obter mais funções e detalhes do "Tencent Hunyuan Assistant", preste atenção ao nosso acompanhamento de experiência mais detalhada, em qual experiência de função você está mais interessado, e seja bem-vindo para nos contar na área de comentários.

Grande modelo doméstico corre solto

Todos os empresários da Internet nacional transfronteiriça querem aproveitar esta oportunidade que pode ser maior do que a Internet móvel, e o boom do empreendedorismo em grande escala está a aumentar.

Desde que Wang Huiwen, cofundador da Meituan, publicou uma postagem de herói de IA para construir a OpenAI da China, todas as principais empresas de Internet e tecnologia estão agora totalmente envolvidas nesta competição.

Wenxin Yiyan do Baidu, Tongyi Qianwen de Ali, modelo grande Hunyuan da Tencent e ByteDance também testaram publicamente o aplicativo de modelo grande "Doubao" não muito tempo atrás. Nas recentes conferências de imprensa dos fabricantes de telemóveis, no lançamento do Huawei Hongmeng 4 e no discurso anual de Lei Jun, os grandes modelos também se tornaram protagonistas.

No entanto, seja ChatGPT ou um grande número de modelos grandes no país e no exterior, não apareceu realmente um "aplicativo matador" para usuários comuns, e o caminho de comercialização ainda não amadureceu. Atualmente, o lucro óbvio do AIGC wave ainda está “vendendo pás” da NVIDIA.

Portanto, a Tencent, que tem 1,33 bilhão de usuários ativos mensais do WeChat, naturalmente atrai mais atenção sobre como combinar aplicativos de modelo em grande escala com uma enorme experiência do usuário final C. Esse volume também é uma razão importante pela qual a Tencent não pode se apressar em lançar produtos semi-acabados.

Quanto aos dois produtos da Tencent com mais usuários – WeChat e QQ, ainda é incerto se e quando eles serão conectados ao modelo Hunyuan, mas Jiang Jie disse que a equipe já está avançando.

Na verdade, o layout da Tencent em modelos de grande escala não é lento.Atualmente, as duas maiores empresas start-up de modelos de grande escala com a maior avaliação na China – Light Years Beyond e MiniMax também cooperam com a Tencent.

Entre eles, MiniMax, que foi estabelecido há menos de 2 anos, lançou uma plataforma API aberta para usuários corporativos em março deste ano, suportando chamadas de serviço para modelos de texto e voz. Tornou-se o grande modelo subjacente do Douyin Volcano Engine e Kingsoft WPS. AI. Uma das maiores empresas modelo já registradas, com uma avaliação de US$ 1,2 bilhão.

Antes de lançar o modelo Hunyuan, a Tencent Cloud lançou um modelo industrial para clientes B-end em junho, cobrindo 10 setores importantes, como finanças, turismo cultural, assuntos governamentais, mídia e educação, e fornecendo mais de 50 soluções.

Lu Qi, fundador e CEO da Qiji Chuangtan, acredita que existem apenas dois países e regiões no mundo que possuem as capacidades básicas da indústria modelo em grande escala, nomeadamente a América do Norte e a China. No seu discurso anterior, ele mencionou que existem três elementos-chave para o grande modelo da China alcançar o OpenAI:

A primeira é construir o modelo básico, que é subir para o GPT-3.5.

A segunda é construir a capacidade de industrializar modelos.

O terceiro é o desenvolvimento de plataformas e o estabelecimento ecológico.

Se você prestar atenção aos desenvolvimentos recentes do ChatGPT, o OpenAI também está trabalhando em três direções. Depois que o primeiro lote de produtos chineses de modelo em grande escala for aprovado no depósito, o segundo e terceiro lotes podem não estar longe.Todas as empresas estão correndo para modelos em grande escala e encenaram a "Guerra dos Cem Regimentos" do modelo em grande escala era, mas esta corrida de longa distância apenas começou.

Quer se trate do padrão da indústria tecnológica da Internet ou do futuro dos trabalhadores migrantes comuns, talvez no ano de 2023, cobras e linhas cinzentas tenham sido estabelecidas.

#Bem-vindo a seguir a conta pública oficial do WeChat da Aifaner: Aifaner (WeChat ID: ifanr), mais conteúdo interessante será apresentado a você o mais rápido possível.

Ai Faner | Link original · Ver comentários · Sina Weibo