A primeira geração do Core Ultra da Intel é lançada oficialmente, construindo uma base para AI PC e capaz de executar grandes modelos de IA sem rede

dezembro 16, 2023 gurinho

Quando usamos ferramentas de IA suportadas por grandes modelos de linguagem como ChatGPT, Wenxinyiyan e Tongyi Qianwen, existe uma condição necessária: a Internet deve estar conectada.

Porque a computação das ferramentas de IA está na nuvem, não localmente no computador. No entanto, do ponto de vista dos fabricantes de chips upstream e dos fabricantes de terminais, grandes modelos em um ambiente de rede são poderosos, mas também precisam ser complementados por grandes modelos finais que possam funcionar sem rede. solução perfeita.

Assim, no evento oficial de lançamento oficial do Core Ultra da primeira geração da Intel em 15 de dezembro, vimos que o grande modelo do Alibaba Cloud Tongyi Qianwen foi adaptado com sucesso à plataforma Intel Core Ultra e pode ser implantado em PCs e outros dispositivos no futuro.

Graças à plataforma Core Ultra de primeira geração (codinome Meteor Lake), ele apresenta a mudança de arquitetura de processador mais significativa da Intel em 40 anos, ou seja, uma arquitetura de módulo separada e a primeira unidade de processamento de rede neural integrada (NPU), que é implantada no Intel Core Dispositivos de plataforma Ultra O grande modelo Tongyi Qianwen na Internet pode reduzir significativamente o tempo de resposta de inferência do modelo, com uma aceleração média de até 3 vezes.

Além disso, a Intel também testou anteriormente o bom desempenho do modelo grande LLaMa2-7B da Meta em execução sem rede no lado do dispositivo.O conceito de AI PC tornou-se claro devido à implementação gradual do modelo grande no lado do dispositivo .

Desde o lançamento do ChatGPT no final do ano passado, os aplicativos AIGC suportados pela tecnologia de grande modelo de linguagem alcançaram grande desenvolvimento.A principal posição desta onda de IA está no PC, porque o PC é mais adequado para a maioria dos usuários em termos de interação e apresentação As aplicações AIGC, sejam elas ChatGPT ou MidJourney, precisam estar conectadas à Internet. Quando não houver rede, seremos desconectados da IA.

Portanto, se um PC quiser realmente evoluir para um PC de IA, não apenas os aplicativos AIGC podem ser facilmente executados nele, mas ele próprio também precisa ter poderosos recursos de processamento de IA.

Portanto, a notícia de que o grande modelo Qwen-7B do Alibaba Cloud Tongyi Qianwen se adaptou com sucesso à plataforma Intel Core Ultra e pode ser implantado em PCs e outros terminais no futuro tem dois significados e um significado simbólico.

O primeiro nível de significado é: em que a Intel confia quando grita o slogan AI PC?

Na Conferência de Inovação Tecnológica realizada no Vale do Silício em setembro deste ano, o CEO da Intel, Pat Gelsinger, propôs o conceito revolucionário de PC-AI PC.

Se você deseja realizar cálculos de IA com eficiência e executar aplicativos de IA em um PC, a arquitetura tradicional CPU + GPU não é a solução ideal.Portanto, na plataforma Core Ultra de primeira geração, a Intel adotou de forma inovadora uma arquitetura de módulo separada, que também é a história da Intel A maior mudança estrutural de processador do mundo, o processador será composto por quatro módulos independentes: módulo de computação, módulo SoC, módulo gráfico e módulo IO, e será conectado através da tecnologia de empacotamento 3D Foveros:

Módulo de computação (Compute Tile): adota a última geração de núcleo de eficiência energética e microarquitetura de núcleo de desempenho e funções aprimoradas. Este módulo utiliza a tecnologia de processo Intel 4 de nova geração e alcançou um progresso significativo na taxa de consumo de energia.

Módulo SoC (SoC Tile): O design inovador de ilha de baixo consumo de energia (Low Power Island) integra uma unidade de processamento de rede neural (NPU), trazendo desempenho de função de IA com eficiência energética para o PC e é compatível com interfaces de programa padronizadas, como OpenVINO. o desenvolvimento e popularização de aplicações de IA. O novo núcleo de eficiência energética de baixo consumo otimiza ainda mais o equilíbrio entre economia de energia e desempenho. O módulo SoC também integra um controlador de memória, processamento de codec de mídia e unidade de exibição, suportando codecs 8K HDR e AV1, bem como padrões HDMI 2.1 e Display Port 2.1. Wi-Fi e Bluetooth também são suportados, incluindo Wi-Fi 6E.

Módulo gráfico (GPU Tile): Este processador integra a arquitetura gráfica Intel Sharp, que pode fornecer desempenho de nível de placa gráfica independente na placa gráfica integrada e suporta ray tracing e Intel XeSS. Com um salto nas capacidades gráficas e maior eficiência energética, o Meteor Lake oferece excelente desempenho por watt.

Módulo IO (IO Tile): Contém conectividade superior, integrando Thunderbolt 4 e PCIe Gen 5.0.

Tomando o processador Core Ultra 7 165H (TDP 28W) como exemplo, a Intel disse que seu desempenho multithread é mais de três vezes maior que o do Qualcomm Snapdragon 8cx Gen 3 e 1,11 vezes maior que seu concorrente direto AMD 7840U.

Ao mesmo tempo, a Intel disse que com melhor desempenho multi-threading, a eficiência energética do Core Ultra 7 165H em vários cenários também é melhor que a do AMD 7840U.

Além disso, a ilha de baixo consumo de energia tem um design muito interessante, possui 2 núcleos LPE-Cores de ultra baixo consumo de energia, que podem executar tarefas que não exigem velocidade de resposta, como reprodução online, etc., reduzindo ainda mais o consumo de energia. . O que torna esse design interessante é que esses dois núcleos de consumo ultrabaixo estão localizados no módulo SoC, não no módulo de computação.

Claro, a atualização mais importante e significativa é que o novo módulo NPU será o principal responsável pela computação de IA.Por ser uma unidade de computação especial para aceleração da inteligência artificial, a vantagem dos modelos NPU na computação de IA é o alto desempenho e o baixo consumo de energia. ., Além disso, CPUs de baixa latência e alta resposta e GPUs de alto desempenho e alto rendimento também suportarão a demanda por poder de computação de IA.A cooperação dos três forma um poderoso poder de computação de IA no terminal.

Ainda em comparação com o processador AMD 7840U vizinho, a Intel disse que o poder geral de computação de IA do Core Ultra 7 165H não apenas supera seu produto da geração anterior, o Core i7-1370P, mas também esmaga o AMD 7840U.

Para dar um exemplo de aplicação prática, a ferramenta de edição de vídeo Jianying da Intel e da ByteDance trabalhou em conjunto para otimizar a função de "chaveamento inteligente" que os usuários usam com frequência e mudou os requisitos de computação dessa função para os produtos Core Ultra de primeira geração. Depois do NPU, descobrimos que o processamento de material de vídeo não só leva menos tempo, mas também reduz o consumo de energia.Neste momento, o poder de computação livre da CPU e GPU pode ser usado para outras necessidades de edição.

Portanto, o chamado AI PC pode não apenas executar melhor as funções de IA, mas também melhorar a eficiência e reduzir o consumo de energia.

O segundo significado é: o que um modelo grande como Tongyi Qianwen pode fazer?

Agora podemos realizar uma variedade de operações de IA no PC, incluindo, entre outras, Wenshengwen, Wenshengtu, Wenshengmusic, bem como recorte de IA, reconhecimento de gestos, captura de movimento e, mais detalhadamente, dublagem de IA e mudança de voz e videoconferência. Correção ocular, etc.

Alguns deles são experiências totalmente novas baseadas em grandes modelos de linguagem, e alguns já foram implementados em PCs há muito tempo. Por exemplo, o Core de 10ª geração foi o primeiro a introduzir suporte de desempenho de IA, que pode trazer aprimoramento automático de imagem e vídeo aprimoramento de resolução para PCs., redução inteligente de ruído e outras funções de IA.

A tecnologia de modelo de linguagem grande é considerada o caminho para a inteligência artificial geral (AGI, Artificial General Intelligence). AGI refere-se a um sistema de inteligência artificial com uma ampla gama de níveis de inteligência e habilidades semelhantes aos humanos. Em comparação, atualmente grandes modelos de linguagem A maioria Os sistemas de IA concentram-se em uma tarefa ou domínio específico.

Sob esta premissa, o novo modelo de código aberto Tongyi Qianwen de 72 bilhões de parâmetros (Qwen-72B) do Alibaba Cloud pode ser chamado de o modelo grande de código aberto mais poderoso do momento.Qwen-72B alcançou os melhores resultados entre os modelos de código aberto em 10 avaliações de benchmark autorizadas. O desempenho excede o benchmark de código aberto Llama 2-70B e a maioria dos modelos comerciais de código fechado, e já possui certas capacidades gerais.

Com base nos quatro grandes modelos de linguagem Qwen-72B, Qwen-14B, Qwen-7B e Qwen-1.8B de código aberto do Alibaba Cloud, bem como no grande modelo de compreensão visual Qwen-VL e no grande modelo de compreensão de áudio Qwen-Audio, Alibaba A nuvem alcançou código aberto de "tamanho total, modalidade completa".

Isso significa que para desenvolvedores de todas as esferas da vida, esses grandes modelos de código aberto podem ter uma variedade de pacotes para escolher, incluindo PCs, telefones celulares e até mesmo dispositivos IoT que não estão familiarizados com os dispositivos.

O grande modelo de Tongyi Qianwen é implantado na plataforma Intel Core Ultra e é uma das possibilidades de implantação em terminais como PCs no futuro.

Além disso, a equipe do Laboratório XD da Universidade de Ciência e Tecnologia do Leste da China desenvolveu uma série de grandes modelos industriais baseados nos modelos de código aberto Qwen-7B e Qwen-14B de Tongyi Qianwen, incluindo o grande modelo de saúde mental MindChat (Man Tan) , o grande modelo de saúde médica Sunsimiao (Sun Simiao), e o modelo de educação /Exame grande modelo GradChat (Koi) e assim por diante.

A Universidade de Zhejiang e a Higher Education Press desenvolveram o modelo vertical de educação Zhihai-Sanle baseado em Qwen-7B. Ele foi aplicado em 12 universidades em todo o país e pode fornecer perguntas e respostas inteligentes, geração de perguntas de teste, navegação de aprendizagem, avaliação de ensino e outros recursos O modelo foi usado no Alibaba A plataforma Yunlingji fornece serviços externos, que podem ser chamados com uma linha de código.

Rompendo com o mundo dos bits, no mundo real, Zhejiang Youlu Robot Technology Co., Ltd. integrou Qwen-7B ao robô de limpeza de estradas, permitindo que o robô interaja com os usuários em tempo real em linguagem natural, entenda as necessidades colocadas encaminhado pelos usuários e execute as instruções de alto nível do usuário.Analisar e desmontar, fazer análise lógica de alto nível e planejamento de tarefas e concluir tarefas de limpeza.

Em suma, a fase da IA não se trata apenas de PCs, e os PCs não se tratam apenas de aplicações de IA, mas estão a começar a ter enormes intersecções, criando cenários que irão mudar os nossos hábitos de utilização de PCs.

Ao desenhar, você deve usar um tablet digital e uma caneta sensível à pressão para criar, ou deve usar um desenho vicentino?

Ao escrever, você usa um teclado para digitar as palavras uma por uma ou usa o chinês para escrever?

Esses problemas já surgiram e cada usuário com um PC com IA enfrentará gradualmente mudanças nas escolhas e nos hábitos de uso.

Liu Xuewen

Na estufa de plástico do destino, todo repolho que foi pulverizado com muitos pesticidas já sonhou em se tornar um vegetal orgânico livre de poluição.

E-mail Sina Weibo 1

# Bem-vindo a seguir a conta pública oficial do WeChat de aifaner: aifaner (WeChat ID: ifanr).Mais conteúdo interessante será fornecido a você o mais rápido possível.

Ai Faner | Link original · Ver comentários · Sina Weibo