Tencent lança modelo grande Hunyuan! Como é ter “Jarvis” no WeChat?

O dia 31 de agosto está destinado a se tornar um ponto de viragem fundamental na história dos grandes modelos nacionais. Várias empresas modelo nacionais de grande escala abriram sucessivamente os seus serviços ao público através do registo.

Isto significa que os grandes modelos nacionais entraram numa nova fase: os grandes modelos nacionais podem fornecer serviços a centenas de milhões de utilizadores e também enfrentarão o mesmo escrutínio e desafios múltiplos.

Agora mesmo, a Tencent também lançou oficialmente seu modelo de linguagem grande de uso geral autodesenvolvido – Hunyuan Large Model.

Atualmente, a Tencent tem mais de 50 produtos e serviços próprios conectados ao grande modelo Hunyuan para teste, incluindo Tencent Cloud, Tencent Advertising, Tencent Documents, WeChat Search, QQ Browser, etc. acesso futuro.

Em comparação com Baidu e Ali, a Tencent, como gigante nacional da Internet, parece ser mais cautelosa em aplicações de modelos em grande escala. Na verdade, AIGC tem uma prioridade muito alta dentro da Tencent. Ma Huateng também declarou diretamente a atitude da Tencent na conferência de relatórios financeiros da Tencent em maio:

Inicialmente pensámos que esta era uma oportunidade única para a Internet, mas quanto mais pensávamos nisso, mais percebíamos que era uma oportunidade que nunca surgiria em centenas de anos, semelhante à Revolução Industrial. que inventou a eletricidade. Então achamos que (IA) é muito importante… mas não temos pressa em fazê-lo cedo. Quando terminar, retire o produto semi-acabado e exiba-o.

Aifan'er também obteve qualificações de experiência e pode obter mais detalhes para você o mais rápido possível.

Modelo grande Hunyuan, por favor me dê mais conselhos

Em Hunyuan, a vitalidade não está dividida e o caos se torna um, que é o início da vitalidade. Pode-se perceber pelo nome que a Tencent, que está ansiosa para “criar coisas novas”, tem grandes esperanças no modelo Hunyuan.

Como um modelo universal de linguagem grande autodesenvolvido pela Tencent em todos os links, o grande modelo Hunyuan tem um corpus excelente, algoritmos de modelo grande inovadores, estrutura de aprendizado de máquina Angel autodesenvolvida e infraestrutura de computação poderosa.

Em resposta aos cenários reais de aplicação, Jiang Jie, principal representante da equipe de P&D do modelo Hunyuan da Tencent e vice-presidente do Grupo Tencent, também demonstrou o modelo Hunyuan, que está comprometido em ser mais confiável e maduro, na conferência de imprensa.

O grande modelo Hunyuan é mais confiável. Depois de muitas pesquisas e tentativas, o grande modelo Hunyuan encontrou um método baseado na detecção da verdade, que pode efetivamente reduzir a taxa de alucinação de grandes modelos de linguagem em 30% -50%.

O grande modelo Hunyuan, mais confiável, também pode identificar "armadilhas" e resistir a "induções", permitindo que o modelo diga "não" a questões inseguras.

Enfrentando o desafio, o grande modelo Hunyuan mais maduro pode lidar com a geração e continuação de textos muito longos, como escrever um artigo sobre patentes de dispositivos agrícolas.

O grande modelo Hunyuan propõe uma nova estratégia de cadeia de pensamento, que efetivamente fortalece a tendência do modelo de pensar na desmontagem e distribuição de problemas. A visão de Jiang Jie é que grandes modelos podem razoavelmente fazer inferências com base em cenários de aplicação reais, como humanos.

Jiang Jie fez perguntas ao Hunyuan Big Model como "Quem é você, qual é a arquitetura central do Hunyuan Big Model e quais são os parâmetros do Hunyuan Big Model?" Pode-se ver que as respostas do Hunyuan Big Model estão cheias de perguntas. razão .

É importante notar que o modelo grande Hunyuan será atualizado até julho de 2023 e ainda está em iteração.

A fim de demonstrar a capacidade de raciocínio lógico do modelo Hunyuan, Jiang Jie fez ao modelo Hunyuan uma pergunta de raciocínio lógico: “Comprei um monte de café, bebi metade pela manhã e bebi a metade restante à tarde. ainda faltam 30 xícaras. Comprei um total de Quantas xícaras você bebeu?" Em um período muito curto de tempo, o grande modelo Hunyuan deu a resposta correta.

Comparado com os grandes modelos convencionais que se concentram em parâmetros e avaliação, o grande modelo Hunyuan da Tencent se concentra mais em aplicações.

Por exemplo, quando combinado com a Conferência Tencent, o grande modelo Hunyuan pode gerar um resumo de toda a conferência e organizar os detalhes relevantes da conferência.

Em combinação com a Tencent Documents, a conferência de imprensa também demonstrou a indução de texto, criação e edição de documentos, tradução e outros recursos do grande modelo Hunyuan, que pode dominar dezenas de cenários de geração de texto e gerar facilmente gráficos Excel com base em centenas de fórmulas.

Em combinação com a Tencent Advertising, o grande modelo Hunyuan se adapta às características industriais e regionais, atende às necessidades de milhares de pessoas e realiza a integração natural de texto, imagens e vídeos. O efeito de geração de publicidade excede o mainstream Midjourney com a adoção do usuário taxa de 42%, de longe. Muito mais do que o modelo de difusão estável de código aberto.

Na trilha do grande modelo de IA, o layout da Tencent é, na verdade, muito anterior.

Em 2019, a Tencent lançou um grande modelo de recomendação de publicidade MoE, com parâmetros de modelo único superiores a 100 bilhões.

Em 2021, a Tencent lançou um modelo de PNL em grande escala com uma escala de 100 bilhões, que melhorou significativamente a eficiência do treinamento e do raciocínio do modelo e reduziu custos.

Entrando em 2022, o grande modelo Hunyuan que foi acumulado por um longo tempo inaugurou a temporada de colheita.Em maio, o grande modelo Hunyuan AI liderou simultaneamente a classificação geral do CLUE, compreensão de leitura e listas de gráficos de conhecimento em grande escala, quebrando três registros de uma só vez.

Um mês depois, o grande modelo de IA multimodal da Tencent foi usado pela primeira vez em publicidade, o que trouxe um aumento cumulativo de GMV de 15% para os anunciantes.

Estas acumulações lançaram as bases para o grande modelo Hunyuan.

Primeira experiência do grande modelo Tencent Hunyuan

A página inicial do "Tencent Hunyuan Assistant" consiste em duas guias: "Chat" e "Inspiration Discovery". A função "Chat" é semelhante aos produtos de IA de conversação. Diferente do ChatGPT, "Tencent Hunyuan Assistant" integrou muitos comandos. coleção, e recomendarei algumas perguntas para você na página inicial.

Eu estava trabalhando no manuscrito na coletiva de imprensa, então também tentei deixá-lo escrever o manuscrito para ver se isso poderia me poupar algum tempo (moyu).

"Inspiration Discovery" integra aplicativos para muitos cenários comuns em diferentes setores, incluindo trabalho, programação, marketing, vida, role-playing, entretenimento e outros campos.

Você pode deixá-lo gerar código diretamente e escrever uma cópia inicial, ou também pode deixá-lo desempenhar diferentes funções. Por exemplo, para novos pais, você pode clicar diretamente em "Especialista em Educação" para fornecer conselhos práticos sobre vários problemas que as crianças encontram em diferentes estágios. … sugestão.

Os registros em "Chat" e "Inspiration Discovery" podem ser visualizados clicando no ícone do menu no canto superior esquerdo da página inicial. Em relação à questão dos dados dos usuários, também vimos no acordo de privacidade que a Tencent prometeu não gravar essas conversas para o treinamento real do modelo dos usuários.

Para mais funções e detalhes do "Tencent Hunyuan Assistant", preste atenção à nossa experiência mais detalhada no futuro. Em qual experiência de função você está mais interessado? Você também pode nos contar na área de comentários.

Grande modelo doméstico correndo descontroladamente

Todos os empresários nacionais transfronteiriços da Internet esperam aproveitar esta oportunidade que pode ser maior do que a Internet móvel, e a mania do empreendedorismo em grande escala está a aumentar.

Começando com a ampla postagem de herói de IA do cofundador da Meituan, Wang Huiwen, para construir o OpenAI da China, as principais empresas de Internet e tecnologia estão agora totalmente envolvidas nesta competição.

Wenxinyiyan do Baidu, Tongyi Qianwen do Alibaba, modelo Hunyuan da Tencent e ByteDance também testaram recentemente publicamente o aplicativo de modelo grande “Doubao”. Nas recentes conferências de fabricantes de telefones celulares, no lançamento do Huawei Hongmeng 4 e no discurso anual de Lei Jun, os modelos grandes também se tornaram protagonistas.

No entanto, seja ChatGPT ou um grande número de grandes modelos no país e no exterior, não houve realmente um "aplicativo matador" para usuários comuns. O caminho para a comercialização ainda não está maduro. Atualmente, o lucro óbvio do AIGC wave ainda está “vendendo pás” da NVIDIA.

Portanto, como a Tencent, que tem 1,33 bilhão de usuários ativos mensais do WeChat, combina aplicativos de modelo em grande escala com uma enorme experiência do usuário final C, naturalmente atraiu mais atenção.Esse tamanho também é uma razão importante pela qual a Tencent não pode se apressar em lançar produtos semi-acabados. produtos.

Quanto aos dois produtos da Tencent com mais usuários, WeChat e QQ, ainda não se sabe se e quando eles serão conectados ao modelo Hunyuan, mas Jiang Jie disse que a equipe já está fazendo progressos.

Na verdade, a Tencent não é lenta na implantação de grandes modelos.Atualmente, as duas startups de grandes modelos mais valorizadas da China, Lightyear Beyond e MiniMax, também cooperam com a Tencent.

Entre eles, MiniMax, que foi estabelecido há menos de 2 anos, lançou uma plataforma aberta API para usuários corporativos em março deste ano, suportando chamadas de serviço de modelos de texto e fala. Tornou-se o grande modelo subjacente do Douyin Volcano Engine e Kingsoft WPS AI, e também está entre o primeiro lote a passar pelo Uma das grandes empresas modelo cadastradas, com avaliação de US$ 1,2 bilhão.

Antes de lançar o grande modelo Hunyuan, a Tencent Cloud lançou um grande modelo industrial para clientes B-end em junho, cobrindo 10 grandes setores, como finanças, turismo cultural, assuntos governamentais, mídia e educação, e fornecendo mais de 50 soluções.

Lu Qi, fundador e CEO da Qiji Chuangtan, acredita que existem apenas dois países e regiões no mundo que possuem as capacidades básicas da grande indústria modelo, nomeadamente a América do Norte e a China. Ele mencionou em seu discurso anterior que existem três fatores-chave para que os grandes modelos da China alcancem o OpenAI:

A primeira é construir um modelo básico, que é subir para o GPT-3.5.

A segunda é construir a capacidade de industrializar modelos.

O terceiro é o desenvolvimento de plataformas e o estabelecimento ecológico.

Se você prestar um pouco de atenção aos desenvolvimentos recentes do ChatGPT, a OpenAI também está se esforçando em três aspectos. Depois que o primeiro lote de modelos chineses em grande escala for registrado, o segundo e o terceiro lotes podem não estar longe.Cada empresa está correndo em direção a modelos em grande escala e encenou a "Guerra dos Cem Regimentos" na era dos modelos em grande escala , mas esta corrida de longa distância apenas começou.

Quer se trate do padrão da indústria tecnológica da Internet ou do futuro de um trabalhador comum, talvez no ano de 2023, as pistas já foram lançadas.

# Bem-vindo a seguir a conta pública oficial do WeChat de aifaner: aifaner (WeChat ID: ifanr).Mais conteúdo interessante será fornecido a você o mais rápido possível.

Ai Faner | Link original · Ver comentários · Sina Weibo