Análise prática do Apple AIPC de 50.000 yuans: melhor do que esperávamos Análise do MacBook Pro com M5 Max

Se você tivesse um orçamento de 50.000 yuans para montar um computador pessoal, qual escolheria?
No passado, você provavelmente investia a maior parte do seu orçamento na placa de vídeo — afinal, seja para "jogar" ou "jogar depois do trabalho", ter uma GPU potente nunca é demais.

▲ Imagem | Internet
Mas agora, o problema se tornou mais complicado.
O orçamento que antes era distribuído de forma ordenada entre CPU, GPU, placa-mãe, memória, disco rígido e periféricos foi repentinamente interrompido pela memória, esse "monstro devorador de dinheiro".
Agora, não importa o que você planeje fazer com seu computador, você vai se deparar com o problema de negligenciar uma coisa em detrimento de outra —
Muita memória RAM, muita memória de vídeo e muito disco rígido são essenciais, mas cada um deles vai pesar no seu bolso.
O Mac, que surgiu como uma opção inesperada em meio ao caos da memória, é precisamente a melhor solução para o problema mencionado acima.
O Mac com IA mais poderoso até hoje
No recente evento de lançamento da primavera, a Apple apresentou o MacBook Pro com processador M5 atualizado, como esperado, juntamente com os processadores M5 Pro e M5 Max que o acompanham.

Como resultado da reformulação completa do processo N3P de 3nm da TSMC pela Apple Silicon, os dois novos processadores certamente não decepcionaram em termos de especificações.
O M5 Pro está disponível em duas configurações: 15+16 e 18+20 núcleos. Ambas são equipadas com o acelerador de rede neural do M5 do ano passado, que é a "versão da Apple do Tensor Core".

▲ Imagem|Maçã
O M5 Max oferece opções de 18+32 e 18+40 núcleos, além de um acelerador de rede neural de 16 núcleos. Em termos de tamanho do processador, tanto o M5 Pro quanto o M5 Max são, sem dúvida, focados principalmente na GPU .
Essa tendência também se reflete no projeto da microarquitetura dos novos processadores.
Atualmente, todos os processadores da série M5 foram atualizados com memória unificada LPDDR5X 9600. De acordo com a Apple, o M5 Pro tem uma largura de banda máxima de memória de 307 GB/s, enquanto o M5 Max tem 614 GB/s .

▲ Imagem|Maçã
Como o M5 Pro e o M5 Max vêm de fábrica com uma CPU de 18 núcleos, a diferença na largura de banda da memória provavelmente se deve às especificações da GPU.
Com base em previsões anteriores ao lançamento, essa discrepância sugere que o controlador de memória da série M5 provavelmente está localizado no cluster do núcleo da GPU .
Essa estratégia é notavelmente semelhante à arquitetura Panther Lake que a iFanr viu durante sua visita à fábrica da Intel no ano passado:

Os benefícios disso são óbvios: posicionar a GPU mais perto do controlador de memória pode reduzir efetivamente a latência da comunicação de dados de memória entre os núcleos, melhorando indiretamente a eficiência da GPU.
Para que servem as GPUs, que são mais rápidas e têm mais VRAM,? Para aplicações de IA local, é claro.

Essa é uma das razões pelas quais a Apple mencionou "IA" com tanta frequência em seu site oficial desta vez.
Tomemos como exemplo este protótipo de MacBook Pro de 14 polegadas da iFanr. O modelo que recebemos é a versão topo de linha deste ano, com GPU M5 Max de 40 núcleos, 128 GB de memória unificada e um disco rígido de 8 TB — um monstro de desempenho que custa mais de 55.000 yuans.

De modo geral, quando executamos um modelo local em um PC com Windows, o maior gargalo geralmente não é a "memória da placa-mãe", que tem um preço exorbitante, mas sim a VRAM (memória de vídeo) dentro da placa gráfica.
A maior vantagem da memória unificada da Apple é que ela pode ser acessada diretamente pela GPU.
Por exemplo, nossa unidade de teste M5 Max de 128 GB pode, teoricamente, fornecer à GPU quase 100 GB de memória de vídeo:

Agora que temos tanta memória disponível, devemos, como anuncia a Apple, executar aqueles modelos de IA locais de grande escala que não podíamos executar antes.
No llmfit, você pode ver que um M5 Max de 128 GB consegue executar todos os modelos de até 125 bytes perfeitamente.
Apenas dispositivos como o MiniMax M2.5, o Qwen3 e o DeepSeek v2.5 (com especificações de 220b ou superiores) ficarão "funcionando precariamente" (com desempenho marginal).

▲ M5 Max 128GB
Em comparação, um M1 Max com 32 GB de RAM, segundo a LLMfit, só consegue executar modelos com quantização de 2 ou 4 bits, de no máximo cerca de 35 bits .

▲ M1 Max 32GB
Considerando a facilidade de implantação e o espaço para compreensão do contexto, optamos por testar os modelos qwen3.5-35b-a3b e qwen3-next-80b, que suportam MLX, usando o LM Studio. Ambos são modelos MoE quantizados de 8 bits .

Para modelos MoE como o qwen3.5-35b-a3b, que têm "um pequeno número total de iterações e um pequeno número de inferências", o M5 Max muitas vezes termina a execução antes mesmo de ter a chance de aquecer .

▲ qwen3.5-35b-a3b
Mesmo diante de um texto original de quase 3.000 palavras, após maximizar manualmente o limite de tokens do modelo, o tempo de resposta da primeira palavra do M5 Max em cada rodada de reescrita e imitação foi de cerca de 1,7 segundos , ou cerca de 1,7s para TTFT e cerca de 65 tps para TPOT. Não houve estouro de capacidade mesmo após acumular quase 10.000 palavras de pensamento e escrita.

▲ qwen3.5-35b-a3b
O qwen3-next-80b, com sua otimização MLX, quantização de 8 bits e maior número de parâmetros, é ainda mais poderoso no M5 Max.
Embora exija o carregamento manual de um modelo de quase 80 GB, ignorando os avisos de memória, os resultados obtidos são verdadeiramente notáveis:
Em qwen3.5-35b-a3b, leva-se quase 30 segundos para pensar na mesma palavra-chave, enquanto em qwen3-next-80b, é quase instantâneo, com TTFT de cerca de 3 segundos e TPOT de cerca de 72 tps.

▲ qwen3-next-80b
Isso se deve em parte ao fato de os parâmetros de 80 bits já serem suficientemente grandes em comparação com os parâmetros ativos de 3 bits e, mais importante, por se tratar de uma versão otimizada com base na estrutura de código aberto MLX da Apple , que pode maximizar as vantagens do Apple Silicon.
Além do modelo MoE, como o M5 Max se comporta com modelos densos como o Llama 3.3?

▲ Imagem|Tom's Guide
Embora o modelo Llama 3.3 70b quantizado em 8 bits tenha apenas cerca de 75 GB de tamanho, o enorme cache KV necessário para o contexto de 128k ainda causa estouro, fazendo com que o LM Studio não consiga carregá-lo.
Após a troca para a versão menor, Llama 3.3 70b Q4_K_M , o M5 Max finalmente carregou normalmente. Após executar o comando acima, a carga do sistema era de aproximadamente 95 GB e a velocidade de geração era de 9,95 tokens/s.

Em outras palavras, ao lidar com modelos densos de tamanho semelhante, o M3 Ultra com mais memória ainda é necessário .
No entanto, o maior consumo de recursos que observamos no M5 Max desta vez não foi proveniente do Llama 3.3 denso, mas sim do deepseeek-r1 em execução no Msty Studio:

No Msty Studio, carregamos um arquivo deepseek-r1 70b-llama-distill-q8_0 de 75 GB e, em dois minutos, ele usou 122 GB de memória para escrever um haicai para você:

▲ deepseek-r1 70b-llama-distill-q8_0
Este é apenas o resultado para o modelo de idioma local. Mesmo em alguns projetos tradicionais de performance, o desempenho do M5 Max não nos decepcionou.
No Cinebench 2026, o M5 Max alcançou uma pontuação de GPU de 79.295 , o que representa um aumento de mais de 15% em relação ao M4 Max e apenas cerca de 5% em relação ao atual melhor modelo, o M3 Ultra.

▲ Após testes de estresse contínuos, a pontuação caiu para cerca de 77.000.
Como um resultado desses seria percebido em um jogo?
Jogamos Cyberpunk 2077 novamente no M5 Max, usando os mesmos parâmetros que utilizamos quando analisamos a versão padrão do M5 no ano passado.
Ao usar a predefinição padrão "para este Mac", a M5 Max consegue manter uma taxa de quadros estável em torno de 59 quadros por segundo. Comparada à M5 padrão, a predefinição não só oferece uma resolução mais alta e mais detalhes, como também mais que dobra a taxa de quadros .

Após otimizar manualmente as configurações (alta resolução de 1.5K com ray tracing, FSR e geração de quadros MetalFX), o M5 Max consegue manter uma taxa de quadros estável de 50 a 60 FPS em cenas complexas, mesmo com a ventoinha em plena carga.

Este desempenho está certamente longe do de um laptop para jogos, mas o Windows 2077 é um jogo muito exigente, e ainda é bastante surpreendente que o M5 Max consiga executá-lo neste nível em um chassi de 14 polegadas sem estar conectado à tomada.
Já para outros jogos menores e melhor otimizados, como Control: Ultimate Collection e Escape from Durkoff, contanto que você não mexa nas configurações, o M5 Max geralmente consegue manter 60 quadros por segundo estáveis.
Seja para fluxos de trabalho de IA ou jogos, este MacBook Pro com o chip M5 Max é, sem dúvida, uma máquina poderosa .
A melhor tela da Apple até hoje.
Além do M5 Pro/Max, outro novo produto de nível "profissional" lançado no evento de lançamento de produtos desta primavera foi a tão aguardada nova geração do Studio Display.
Mais especificamente, trata-se dos novos Studio Display e Studio Display XDR.

Após a descontinuação do Pro Display XDR, o Studio Display XDR assumiu seu lugar, tornando-se o principal monitor profissional da Apple, com preço inicial de 24.999 dólares.
Nossa experiência inicial com o Studio Display XDR foi consistente com a do evento da Apple:
O impacto do tamanho menor da tela não é óbvio; em vez disso, o ProMotion prende nossa atenção desde o primeiro segundo.

Graças a um painel mini-LED com 2304 zonas, além de um brilho máximo de 1000 nits em SDR e 2000 nits em HDR, é impossível dizer que "não chama a atenção".

▲ O efeito halo dos mini-LEDs só é visível em condições muito extremas.
Além do tema já bastante explorado da criação de conteúdo HDR com ampla gama de cores, o Studio Display XDR também se destaca no entretenimento audiovisual.
Principalmente se você tiver alguns filmes de grande sucesso com HDR em mãos, a experiência de usar um MacBook Pro com o Studio Display XDR é incomparável na linha atual de produtos da Apple:

A mesma avaliação se aplica à nova Exposição de Estúdio deste ano.
Na verdade, além do ProMotion, do brilho máximo e da potência de carregamento, a qualidade do painel da tela do Studio Display está totalmente em pé de igualdade com o novo Studio Display XDR.

Afinal, a Apple já havia avisado: 5K a 120Hz não é algo que qualquer processador consiga lidar. Se o seu Mac usa um processador da série M1, M2 ou M3 (versão padrão), a taxa de atualização máxima para 5K é de apenas 60Hz quando você conecta um Studio Display XDR.
Isso está em consonância com a nossa experiência com o Studio Display XDR.
Mesmo que sua versão do macOS seja muito antiga, pode não ser possível exibir uma imagem, mesmo que o dispositivo esteja conectado a um monitor e possa ser carregado.

Curiosamente, quando o iFanr conversou com funcionários da Apple no evento de lançamento, eles mencionaram que ambas as telas são equipadas com o chip SoC do iPhone .
O MacRumors, um veículo de mídia estrangeiro, descobriu, ao analisar o código de atualização de firmware dos dois novos monitores, que a Apple os equipou com os processadores A19 e A19 Pro, respectivamente.

Como era de se esperar, isso se destina à decodificação de vídeo 5K, controle de luz de fundo, câmera Center Stage e outros recursos de exibição.
Mas isso também levou a um número cada vez maior de "piadas sobre processadores" da Apple:
Logo no início de 2026, você poderá comprar um iPad Pro com chip M5, um MacBook Neo com chip A18 Pro e um monitor com chip A19 Pro.
No geral, o Studio Display XDR deste ano é uma atualização muito oportuna.
Sua importância mais fundamental reside em preencher a lacuna na linha de produtos profissionais da Apple com o ProMotion, além de tornar a experiência de interação com o produto mais fluida.

Quando a Apple começou a falar sobre IA
Neste evento de lançamento da primavera, além de mudar o formato de lançamento dos anos anteriores, a Apple também começou a discutir abertamente a inteligência artificial.

Essa IA não é a Inteligência Artificial da Apple, que vem sendo constantemente adiada, nem o Aprendizado de Máquina que a Apple vem enfatizando repetidamente; é simplesmente e diretamente inteligência artificial geral .
A julgar pelo desempenho atual de seus produtos, a Apple está de fato preparada quando começa a falar sobre IA.
Quando a Apple adotou o Apple Silicon e uma arquitetura de memória unificada em 2020, provavelmente não previu o crescimento explosivo da demanda por modelos de IA e a consequente crise de memória.

O exemplo mais simples é a memória unificada de 128 GB deste M5 Max:
- Se considerarmos apenas memórias DDR5 6400 de nível consumidor, não é difícil comprar 128 GB por cerca de 10.000 yuans , mas elas nunca atingirão a largura de banda de 614 GB/s.
- Se você quiser usar sua placa de vídeo para obter 128 GB de VRAM e não puder comprar uma placa de vídeo profissional, precisará comprar cinco placas RTX 5090D . Isso sem considerar a latência de comunicação entre as placas de vídeo.
Nessas situações, pequenas equipes empresariais, desenvolvedores individuais, profissionais de IA e outros com necessidades locais de IA se encontrarão em um dilema:
Alternativamente, com um orçamento limitado, você pode alocá-lo para memória, placa gráfica, CPU, disco rígido, etc., ao montar um PC, diluindo assim o desempenho geral do computador.
Alternativamente, eles poderiam cerrar os dentes e aumentar seu orçamento, investindo dezenas ou até centenas de milhares de yuans para entrar no campo dos servidores construídos por eles mesmos.

▲ Imagem|Servermall
Atualmente, um MacBook Pro com preço inferior a 60.000 yuans, com 128 GB de memória de alta largura de banda, tela e alto-falantes HDR de última geração e disco rígido de 8 TB, tornou-se a opção mais econômica para usuários individuais e profissionais de estúdio .

Mesmo que você não precise dos "periféricos" mencionados anteriormente, ou que suas necessidades locais de IA sejam baixas, você pode optar por um Mac Studio ou Mac mini como segunda opção.
Este último já desfrutou de sua própria primavera durante o recente "auge da lagosta".

▲ Imagem|Apple Must
Embora a Apple Intelligence possa parecer risível, o potencial do Apple Silicon e da memória unificada nesta "grande era da IA" é apenas a ponta do iceberg.
#Siga a conta oficial do iFanr no WeChat: iFanr (ID do WeChat: ifanr), onde você encontrará conteúdo ainda mais interessante o mais breve possível.

