No auge do desenvolvimento massivo de GPUs, este fabricante chinês de GPUs pretende levar o poder computacional para a sala de estar.

A história do poder computacional da IA está seguindo em duas direções opostas.
No âmbito da computação em nuvem, clusters com dezenas de milhares ou centenas de milhares de placas são o padrão da indústria, e o poder computacional está aumentando, tudo porque o consumo diário de tokens dos principais aplicativos ultrapassou um trilhão.
Para as pessoas comuns, os modelos inteligentes treinados na nuvem muitas vezes se transformam em uma janela de bate-papo no celular, que exige conexão com a internet e alguns segundos para responder.
Como deveria ser a última etapa para integrar o poder da computação às nossas vidas?
Uma empresa que fabrica GPUs para uso doméstico lançou recentemente vários novos produtos de ponta em sua conferência de imprensa, incluindo um hub doméstico inteligente, um PC com IA, um agente e trabalhos relacionados à inteligência incorporada.

No evento de lançamento do Moore Threads 2026, nesta segunda-feira, além das atualizações usuais de placas gráficas GPU e iterações do cluster de computação inteligente Quaor 1000, uma pequena caixa, não maior que a palma da mão e esculpida em uma única peça de liga de magnésio-alumínio usando usinagem CNC, foi trazida ao palco.

Chama-se MTT AICUBE, oficialmente descrito como "um centro de computação de IA para o lar". Em termos mais simples, o AICUBE é um "computador de IA" capaz de executar modelos localmente e gerenciar dados familiares. Ele consegue entender nossas diversas necessidades, executar modelos locais e até mesmo armazenar fotos e vídeos da família.

Pelo menos três produtos de hardware apresentados neste evento de lançamento foram voltados para a computação de borda: o AICUBE para a sala de estar, o AIBOOK para desenvolvedores e o módulo E300 para a indústria.
Zhang Jianzhong, fundador, presidente e CEO da Moore Threads, disse no palco: " No passado, falávamos muito sobre IoT como Internet das Coisas, mas a IoT de hoje deveria ser chamada de Inteligência das Coisas. "
Então, por que uma empresa de GPUs que fabrica clusters com várias placas estenderia seu alcance para a sala de estar?
Existem muitas empresas que fabricam GPUs, mas qual caminho escolher?
Existem muitos participantes na indústria de GPUs, mas os diferentes caminhos que eles seguem são, na verdade, bastante claros.
Um tipo de empresa, como Biren e Tianshu Zhixin, adota uma abordagem puramente focada em treinamento e inferência de IA, explorando ao máximo o poder computacional, embora praticamente não possua recursos de renderização gráfica. Outro tipo, como Jingjia Micro e Lisuan, oferece recursos gráficos sólidos, mas apresenta deficiências evidentes em inferência de IA. A Muxi segue uma estratégia semelhante à da AMD, concentrando-se em treinamento e inferência para data centers, com os recursos gráficos sendo uma adição posterior à sua linha de produtos e ainda em desenvolvimento.
Cada uma dessas abordagens possui sua própria lógica de negócios clara, mas todas têm um limite invisível. A abordagem determina onde um chip pode ou não ser instalado.
Desde sua concepção, a Threadripper de Moore optou por uma lógica diferente: uma GPU completa . Sua arquitetura MUSA não separa nem faz concessões entre "gráficos" e "computação", e o mesmo chip pode suportar simultaneamente cinco capacidades: computação de IA, renderização gráfica, computação científica, simulação física e processamento de vídeo em ultra-alta definição.

Essa integração de múltiplas funcionalidades é exatamente o que se precisa em cenários reais de computação de borda.
Um chip que só entende operações matriciais dificilmente conseguirá executar simultaneamente jogos em nuvem 4K na sala de estar, humanos digitais em tempo real ou os robôs inteligentes incorporados atualmente populares, onde a tomada de decisões por IA e a compreensão do mundo físico ocorrem em paralelo. Fabricantes que se concentram na aceleração pura de IA podem maximizar o poder de computação, mas é difícil para eles entrarem em milhares de residências e indústrias, e em cenários de exibição onde múltiplas necessidades de computação ocorrem simultaneamente.
Em outras palavras, "funcionalidade completa" é uma afirmação que só pode ser verdadeiramente testada no dispositivo em si.
A arquitetura do Threads de Moore exige que ela se expanda além do data center, em direção à borda e aos terminais. Esses três dispositivos de hardware de borda marcam o início dessa expansão.
Coloque o centro de dados na sua sala de estar.
O AICUBE é um pouco mais alto que um Mac mini quando colocado sobre uma mesa. Esculpido a partir de uma única peça de liga de magnésio-alumínio por meio de usinagem CNC, ele pode ser conectado a TVs e monitores via portas HDMI ou USB-C. Além disso, o AICUBE é equipado com um conjunto de quatro microfones e alto-falantes estéreo, sendo perfeito para interações por voz.

Este produto é posicionado como um "hub de IA doméstico", com especificações que incluem 32 GB ou 64 GB de memória unificada, começando com um SSD all-flash de 1 TB e suportando expansão até 12 TB. Seu poder de computação vem do SoC "Yangtze River" desenvolvido pela Moore Threads — uma integração heterogênea de CPU, GPU, NPU e VPU, atingindo 50 TOPS de poder de computação de IA.
Trata-se da "trindade" das necessidades atuais de IA: a capacidade de execução de um Agente de IA, o poder computacional de um PC de IA e o armazenamento privado de um NAS de IA.
Durante a demonstração no local, o gerente de produto usou o AICUBE para executar funções como reprodução de filmes por comando de voz, planejamento de viagens, salvamento automático de arquivos e legendas geradas por IA para o WeChat Moments. Desse ponto de vista, o AICUBE é muito semelhante a um Mac mini, mas com um sistema de interação por voz Siri integrado e um NAS.

Mas o que é realmente interessante é que integra o "centro de dados" em um formato aceitável para uso doméstico.
Em casa, podemos nos deparar com diversos cenários, seja usando um alto-falante inteligente ou um NAS. A importância do AICUBE reside no fato de ser um teste de estresse para uma arquitetura de GPU completa sob as condições mais adversas.
Possui poder de processamento suficiente para executar grandes modelos locais, seu tamanho permite que seja facilmente guardado em um gabinete de TV, seu consumo de energia é baixo o suficiente para funcionar silenciosamente 24 horas por dia, 7 dias por semana, seus dados são armazenados localmente e não na nuvem, e sua operação pode ser feita diretamente por comando de voz por idosos e crianças.
Cada uma dessas cinco restrições não é difícil de entender individualmente. No entanto, todas elas devem ser verdadeiras simultaneamente, e isso precisa ser verdade em um produto de consumo com preço acessível para a família média. Esse é o objetivo de design de uma GPU de borda completa.
Os centros de dados não enfrentam essas restrições. Eles podem contornar as limitações físicas com refrigeração a água, fontes de alimentação de alta tensão e operação e manutenção profissionais; a privacidade dos dados pode ser gerenciada com isolamento de rede e controle de acesso; e a questão de "quem usará os dados" é inexistente, visto que a capacidade de computação de IA em centros de dados está atualmente em falta.
Atualmente, a maioria dos serviços de IA para residências ainda depende da nuvem. Comandos de voz, fotos e vídeos precisam ser enviados para servidores. Dispositivos que sejam locais, capazes de gerenciar armazenamento simultaneamente, executar modelos e se conectar com vários aplicativos são praticamente inexistentes no mercado consumidor.

O AICUBE não só supera essas limitações, como seu agente integrado "Wheat" já vem com mais de 60 habilidades pré-instaladas, permitindo o controle de mais de 36 aplicativos. Dados oficiais da Moore's Threads mostram que o "Wheat" atinge uma taxa de sucesso superior a 95% para ferramentas frequentemente usadas e executa tarefas 7 vezes mais rápido do que agentes de uso geral.
O MTT AICUBE estará disponível para pré-venda no JD.com em 18 de junho. Esses números serão em breve verificados em cenários reais e chegarão às nossas salas de estar.

Do ponto de vista arquitetônico, no entanto, o AICUBE é um teste de estresse para uma GPU completa sob o cenário mais desafiador. Afinal, os recursos do data center podem ser alocados facilmente, enquanto a borda requer apenas um único chip.
O SoC "Yangtze River" da Moore Threads executa inferência de IA, renderização de gráficos 3D, codificação e decodificação de vídeo 4K e agendamento de armazenamento NAS simultaneamente em um único chip, alcançando verdadeiramente o agendamento em tempo real de múltiplas unidades de computação em um espaço físico compacto.
Zhang Jianzhong também afirmou no palco: "A inferência não se resume a um único chip; trata-se mais de uma solução." O AICUBE é provavelmente o primeiro exemplo dessa solução em um ambiente doméstico.
Por onde flui o rio Yangtzé?
Como um SoC inteligente desenvolvido internamente, o "Changjiang" e a Moore Threads compartilham uma arquitetura MUSA em toda a sua linha de produtos, incluindo GPUs em nuvem, apenas compactada no formato físico da borda.
O processador "Yangtze" possui oito núcleos de CPU de 2,65 GHz, uma GPU completa e uma NPU de alta eficiência com integração heterogênea, suportando até 64 GB de memória unificada LPDDR5X.

Em torno desse SoC, o Threads de Moore também está acelerando a implantação de vários outros produtos na borda.
O AIBOOK é voltado para desenvolvedores e é definido como um laptop "nascido para agentes inteligentes".
O sistema subjacente é executado no MTT AIOS, um sistema Linux nativo baseado no Ubuntu. Ele vem pré-instalado com o agente de IA "OpenClaw" e pode executar de forma estável mais de uma dúzia de agentes de IA localmente. Conecta-se a mais de 90 interfaces de ferramentas de linha de comando e suporta múltiplos sistemas, incluindo Windows virtualizado e Android em contêineres.


A missão da AIBOOK é construir um conjunto de ferramentas de circuito fechado para GPUs domésticas, desde o desenvolvimento e depuração até a implementação, fora do CUDA da NVIDIA, para que o ecossistema MUSA possa passar de "utilizável" para "usado pelas pessoas" — começando pelo formato mais básico de laptop.
MUSA é a arquitetura de GPU da Moore Threads, que inclui um sistema de arquitetura unificado, desde chips, hardware e pilha de software até o ecossistema, e é totalmente comparável ao CUDA.
Nos últimos anos, a Moore Threads tem otimizado a pilha de software MUSA: agora ela oferece suporte perfeito a modelos nacionais líderes como DeepSeek, Qwen, Kimi e MiniMax, o backend oficial do vLLM foi integrado, o código principal do SGLang oferece adaptação nativa e a cobertura de operadores do PyTorch atingiu 100%.
A compatibilidade do MUSA é bastante sólida e alcançou significativamente o CUDA.

No entanto, para que um ecossistema prospere, a adaptação por si só não basta. O crescimento da comunidade MUSA requer uma excelente promoção na base e um profundo envolvimento dos desenvolvedores. A Moore Threads espera que o AIBOOK possa desempenhar um papel fundamental na popularização do conjunto de ferramentas e na promoção do MUSA. O conjunto completo de software MUSA permite que desenvolvedores de modelos complexos concluam, sem problemas, muitas etapas essenciais do treinamento de modelos diretamente neste laptop.
Essencialmente, o AIBOOK marca o início da estratégia da Moore Threads para competir com a linha de produtos de desktop DGX da NVIDIA.

Reduzir os custos de migração no setor de apostas.
Apesar do longo caminho a percorrer, o ecossistema MUSA está demonstrando seu potencial para iteração contínua.
Do AIBOOK ao AICUBE, das placas gráficas em nuvem às plataformas de simulação, esses produtos juntos formam o quebra-cabeça completo dos Fios de Moore: somente quando o treinamento em nuvem, a inferência na borda e a interação com o terminal compartilharem a mesma arquitetura MUSA, os custos de migração, as barreiras de adaptação e os problemas de fragmentação do ecossistema da capacidade computacional doméstica poderão ser resolvidos sistematicamente.
Relembrando a história iterativa da arquitetura Threads de Moore, a placa de vídeo para jogos MTT S80, lançada em 2022, evoluiu de uma capacidade exclusiva de rodar DX9 para a de executar "Black Myth: Wukong", alcançando 100% de compatibilidade com os 50 jogos mais populares da China, com otimizações dedicadas para 44 deles. Isso foi possível graças à reconstrução da infraestrutura e à iteração contínua dos drivers. Essa capacidade de engenharia também foi aplicada ao produto de ponta atual.
Em uma perspectiva mais ampla, a Threads de Moore aposta em algo completamente diferente: quando o poder computacional estiver presente simultaneamente em data centers, desktops de desenvolvedores, instalações industriais e salas de estar residenciais, quem tiver um ponto de entrada em todos os cenários terá uma vantagem sobre aqueles que se limitarem a controlar apenas os data centers.
Custos de migração, barreiras de adaptação e desenvolvimento do ecossistema são considerações essenciais na estratégia da Moore's Threads voltada para seus clientes.

Com as iterações contínuas de placas gráficas de hardware e a melhoria gradual do ecossistema MUSA, desde a compatibilidade total com o ecossistema CUDA convencional no nível subjacente até a adaptação completa aos 5 principais modelos de código aberto na China, essa velocidade e capacidade de otimização em nível de sistema são claramente importantes vantagens competitivas para os Moore Threads, conferindo-lhes uma vantagem significativa em seus esforços na borda da computação.
No palco, Zhang Jianzhong disse: "Para os usuários, se eles não puderem comprar chips de computação estrangeiros, não terão nenhuma preocupação em usar as GPUs Moore Threads."
Por trás dessa confiança reside o caminho inevitável para que o poder computacional doméstico amadureça e ganhe espaço em todas as formas e em todos os cenários.
A Internet das Coisas (IoT) do passado era a Internet das Coisas. Na narrativa de Threads, de Moore, a futura Internet de Tudo evoluirá completamente para a Inteligência das Coisas (IoT).
Pelo menos no que diz respeito à ponta final, a Moore's Threads está levando a sério a ideia de seguir esse caminho.
Por Du Chen e Zhang Zihao
#Siga a conta oficial do iFanr no WeChat: iFanr (ID do WeChat: ifanr), onde você encontrará conteúdo ainda mais interessante o mais breve possível.

