A “arquitetura de memória compartilhada” da Qualcomm visa ajudar os laptops com Windows a alcançarem o desempenho do MacBook Pro.

Um laptop de 14 ou 16 polegadas pode integrar dezenas ou até mesmo centenas de gigabytes de memória diretamente em um SoC, atingindo uma largura de banda de memória de alto desempenho superior a 200 GB/s, mantendo um design fino e leve, além de um desempenho silencioso e poderoso.

Você pode pensar que este é um MacBook Pro, mas e se eu lhe dissesse que é um laptop Windows fino e leve com arquitetura ARM?

No dia 27 de abril, a ASUS lançou a versão Snapdragon do ZenBook 16 Air, que vem equipado com a plataforma Qualcomm Snapdragon X2 Elite Extreme, também conhecida como a segunda geração do processador Windows on ARM da Qualcomm, lançada no ano passado.

Esta é a primeira plataforma Snapdragon para PCs topo de linha a integrar memória LPDDR5X em um pacote SoC, uma solução paralela consistente e similar em implementação ao conceito de "arquitetura de memória unificada" da Apple. Embora não tenha atingido 100% do desempenho do chip M, continua sendo a tentativa mais importante da Qualcomm nesse novo caminho.

Este ASUS ZenBook 16 Air Snapdragon Edition pesa 1,2 kg, tem 13,9 mm de espessura, 48 GB de RAM (9523 MT/s) e oferece de 20 a 30 horas de duração da bateria. Foi lançado inicialmente no JD.com em 28 de abril, com preço de 13.999 yuans. A ASUS também oferece uma versão de 14 polegadas.

Também foi apresentado o laptop 2 em 1 ProArt X 2026 para criadores, com peso de 0,82 kg, oferecendo 22 horas de duração da bateria e uma tela OLED de 2,8K com taxa de atualização de 144 Hz. Juntos, esses modelos formam a nova linha de produtos 2026 da ASUS com Windows para ARM.

Retomando a arquitetura de memória compartilhada do X2 Elite Extreme, o modelo topo de linha: a integração da memória no mesmo chip, próxima à CPU, GPU e NPU, não se resume a uma simples mudança no layout da placa de circuito. Na verdade, todo o método de gerenciamento de recursos computacionais passou por uma transformação significativa.

A partir do chip M1, lançado em 2020, a Apple não apenas integrou a memória em um chip de classe PC, como também tornou o agendamento mais flexível, reduzindo o número de leituras e gravações repetidas na memória. Isso resultou em um aumento drástico na largura de banda da memória — um recurso conhecido como Arquitetura de Memória Unificada (UMA). O M5 Pro e o M5 Max, lançados em março deste ano, elevaram ainda mais a largura de banda da memória para 307 GB/s e 614 GB/s, respectivamente.

O Snapdragon X2 Elite Extreme é o primeiro laptop com Windows on ARM a usar o conceito de encapsulamento em memória (in-memory packaging), permitindo que um laptop leve, com cerca de 1,2 kg, desfrute de benefícios semelhantes aos de uma arquitetura de memória unificada.

Por trás disso está a tentativa da Qualcomm, ASUS e outras grandes fabricantes de equipamentos originais (OEMs) de colocar os laptops com Windows em pé de igualdade com o MacBook Pro.

Torne a transferência de memória ainda mais rápida.

Vale ressaltar que "arquitetura de memória unificada" é o termo usado pela Apple, enquanto a Qualcomm chama oficialmente sua solução de SiP (System-in-Package).

Os dois termos não se referem exatamente à mesma coisa: UMA descreve a arquitetura de acesso à memória, enquanto SiP se refere a tecnologias de encapsulamento específicas. No entanto, seus efeitos e objetivos de implementação são altamente consistentes — pools de memória física compartilhados e cache de blocos consistente entre IPs.

A quantidade máxima de memória de vídeo disponível para tarefas computacionalmente intensivas (como inferência de IA) é diretamente igual à quantidade máxima de RAM em toda a máquina. Mesmo um laptop fino e leve com 48 GB de memória dedicada pode, teoricamente, executar modelos grandes com centenas de bilhões de parâmetros localmente, algo que as arquiteturas tradicionais exigem placas gráficas dedicadas de nível profissional, tornando difícil para laptops finos e leves com gráficos integrados alcançarem. (A versão mais completa do X2 Elite Extreme possui 128 GB de memória compartilhada.)

O cache em nível de sistema (SLC) pode ser alocado dinamicamente entre a CPU, a GPU Adreno X2 e a NPU Hexagon, oferecendo 70% mais largura de banda do que a geração anterior; o barramento de memória de 192 bits, combinado com LPDDR5X-9523, permite até 228 GB/s de largura de banda de memória compartilhada entre a CPU, a GPU e a NPU.

As cargas de trabalho tradicionais de computação híbrida (que dependem simultaneamente de CPU, GPU e NPU), que eram prejudicadas por problemas de transferência de memória, também foram bastante atenuadas. Além disso, o consumo geral de energia pode ser mantido em um nível aceitável para laptops finos e leves.

Mais notavelmente, esta geração da NPU Hexagon atualizou a unidade DMA para endereçamento virtual de 64 bits, permitindo que a NPU finalmente acesse mais de 4 GB de memória, o que, em certa medida, supera o gargalo das grandes tarefas de inferência de modelos na área de trabalho da NPU.

Esta não é, de fato, a primeira vez que a Microsoft tenta uma solução semelhante de arquitetura de memória unificada. A Intel e a AMD já fizeram tentativas parecidas antes (mais detalhes adiante).

No entanto, hoje, o modelo topo de linha ASUS ZenBook 16 Air Snapdragon Edition é o primeiro no universo Windows a alcançar uma solução o mais próxima possível do efeito de uma arquitetura de memória unificada, conseguindo também o mesmo desempenho em um laptop ARM fino e leve com cerca de 1,2 kg.

Permitir que mais laptops com Windows usem a nova arquitetura.

No que diz respeito à arquitetura de memória compartilhada/unificada, cada gigante do setor de semicondutores adota uma perspectiva diferente. Primeiramente, trata-se de uma questão de engenharia e, em um nível mais profundo, de uma questão comercial.

Um especialista que trabalha para uma gigante de semicondutores disse ao iFanr que ninguém na indústria questiona a excelência de uma arquitetura de memória unificada, mas o debate sobre adotá-la ou não, e sobre se devemos continuar a fazê-lo, reside no equilíbrio entre as metas de desempenho e os custos para os fabricantes.

A visão atual da Qualcomm sobre o modelo topo de linha X2 é que o poderoso desempenho desbloqueado pela arquitetura de memória unificada deve ser disponibilizado para usuários avançados que realmente precisam dele, especialmente profissionais e criadores cujos fluxos de trabalho dependem fortemente de modelos/funções de IA. Isso justifica o investimento.

Analisando a Intel, eles fizeram uma tentativa semelhante com a arquitetura Lunar Lake da geração anterior, mas os custos dispararam e se tornaram incontroláveis, forçando-os a descontinuá-la. O ex-CEO da Intel, Pat Gelsinger, definiu explicitamente essa tentativa como "única" durante uma teleconferência de resultados, argumentando que a embalagem da memória havia reduzido demais as margens brutas.

Os modelos Panther Lake lançados em janeiro deste ano retornaram à abordagem tradicional de memória externa, e acredita-se que a arquitetura Nova Lake subsequente também dará continuidade a essa estratégia antiga. A Intel ainda mantém um espaço no mercado de laptops de IA de ponta, mas é seguro afirmar que não buscará novamente uma arquitetura de memória unificada em curto prazo.

Do lado da AMD, o Ryzen AI Max+ 395 (Strix Halo) também utiliza uma arquitetura de memória compartilhada semelhante, com até 128 GB de LPDDR5X integrada, que pode atingir uma largura de banda de memória de até 256 GB/s, ainda mais agressiva que a do X2 Elite Extreme.

Por esse motivo, a AMD define o Strix Halo como um chip para estações de trabalho móveis, usado em laptops mais caros e volumosos, ou em mini estações de trabalho, e que não está dentro da faixa de preço para consumidores de laptops pessoais.

Três fabricantes de chips, três respostas diferentes. O notebook para consumidor Snapdragon X2 Elite Extreme foi lançado oficialmente neste momento. Embora seja difícil dizer que coincidiu com uma janela de oportunidade (dado o quão cara a memória está este ano), pelo menos preenche uma lacuna no mercado consumidor.

Quando é que ele vai alcançar o MacBook Pro?

Sinceramente, o Snapdragon X2 Elite Extreme só consegue competir com o M5 básico da Apple atualmente, e ainda está longe dos processadores "top de linha" para estações de trabalho, como o M5 Pro/Max.

A diferença mais direta reside na largura de banda máxima da memória: a largura de banda anunciada do X2 Elite Extreme é de 228 GB/s, o que representa cerca de um terço da do M5 Max e pouco mais de um terço da do M5 Pro.

Claro, ainda precisamos resgatar a reputação do X2, já que esta geração ainda usa um único chip e a largura de banda da memória tem um limite físico.

A Apple utilizou uma nova tecnologia de "embalagem por fusão" na geração M5 Pro/Max, que combina dois chips para estender o barramento de memória a um nível superior.

Nas tarefas de inferência de modelos em larga escala mais diretas, a diferença na largura de banda da memória se traduz diretamente na diferença na velocidade de processamento de tokens; essa diferença também será evidente em tarefas de edição de vídeo em ultra-alta definição e processamento de IA, como 4K/8K, ou em tarefas computacionalmente intensivas de outros softwares de engenharia.

No entanto, pelo menos a plataforma Windows é melhor que o macOS em termos de compatibilidade com esses softwares profissionais/industriais…

Acredito que a importância da Snapdragon em trazer a arquitetura de memória compartilhada para o mercado de laptops Windows para o consumidor não deve se limitar a discutir quem supera quem em termos de números de desempenho.

A questão é que os usuários da plataforma Windows não devem continuar a ser tratados como "cidadãos de segunda classe".

Mesmo um laptop fino e leve com tela grande, pesando no máximo 1,5 kg, ainda pode fornecer poder de computação de IA muito superior a outros laptops de alto desempenho com Windows, mantendo a vantagem de consumo de energia que laptops finos e leves devem ter — e isso é o mais importante.

É claro que os vários problemas que envolvem o Windows em ARM, como o ecossistema de software, a estabilidade da camada de emulação x86 e a adaptação de software profissional, ainda não podem ser resolvidos de uma vez por todas pela memória compartilhada.

Desde fabricantes de chips até a Microsoft e fornecedores independentes de software (ISVs), todos estão intensificando seus esforços. Por exemplo, o Photoshop e o Lightroom já podem ser executados de forma estável em versões nativas para ARM; o DaVinci Resolve também concluiu o suporte nativo para Windows em ARM há dois anos, até mesmo antes da Adobe.

No entanto, a compatibilidade do ecossistema de software ainda é imperfeita. Por exemplo, alguns renderizadores e fluxos de trabalho do Adobe After Effects só podem ser usados ​​na plataforma x86; algumas funções de renderização do Blender também sofrem degradação de desempenho na arquitetura ARM.

Esta é uma era em que o software está correndo atrás do hardware. Somente quando a geração X2 conseguir conquistar um número suficiente de usuários, especialmente criadores de conteúdo e profissionais, a ponto de considerarem os laptops Snapdragon como seus dispositivos principais, o ecossistema ARM entrará em um ciclo de feedback positivo do tipo "quanto mais usuários, mais adaptações, e quanto mais adaptações, mais usuários".

A Apple já passou pelo mesmo processo, então essa não é de forma alguma uma tarefa impossível.

#Siga a conta oficial do iFanr no WeChat: iFanr (ID do WeChat: ifanr), onde você encontrará conteúdo ainda mais interessante o mais breve possível.