A Terra não consegue mais sustentar a IA, forçando o Google e a Nvidia a irem para o espaço, o que acaba beneficiando Musk.

O Google acaba de lançar oficialmente sua missão lunar de data center, com o objetivo de colocar todo o seu poder computacional no espaço. Eles deram ao projeto um nome bem legal: Projeto Suncatcher.

A ideia do Google é simples: em vez de competir por recursos cada vez mais escassos na Terra, por que não se conectar diretamente à energia solar no espaço? Esta nova missão lunar tem um único objetivo: estabelecer uma infraestrutura de IA escalável e alimentada por energia solar no espaço .

Há alguns dias, o CEO da OpenAI, Altman, e o CEO da Microsoft, Satya Nadella, afirmaram em um podcast que…

Meu problema hoje não é a falta de chips; o fato é que não tenho carcaças quentes suficientes para inseri-los.

Parece coisa de Versalhes, afinal, antes dessa onda de IA, sempre pensamos que o poder computacional era tudo.

▲Ultraman e Nadella

Mas, como Ultraman disse no programa, o futuro da IA ​​exige mais avanços na área de energia. Encomendar muitos chips de IA é inútil se os centros de dados e o fornecimento de energia que os suportam não conseguirem acompanhar a demanda.

Quão exorbitante é o consumo de energia da IA? De acordo com a Agência Internacional de Energia (IEA), até 2030, o consumo de energia da infraestrutura global de dados deverá ser equivalente ao consumo de energia de todo o Japão.

Não se trata apenas de eletricidade, mas também de água. Dados do Fórum Econômico Mundial mostram que um centro de dados de 1 megawatt consome a mesma quantidade de água por dia que aproximadamente 1.000 habitantes de países desenvolvidos.

▲Um único chip NVIDIA H100 pode consumir até 700 W de energia, aproximadamente a mesma potência de um forno de micro-ondas doméstico. Um centro de dados normalmente utiliza dezenas de milhares de placas gráficas H100 funcionando continuamente.

Nos últimos cinco anos, porém, a demanda por centros de dados disparou, mas a taxa de crescimento ultrapassou em muito a taxa na qual a nova capacidade de geração de energia foi planejada.

Para resolver o mesmo problema, o Google planeja lançar uma constelação de satélites movidos a energia solar, equipados com chips TPU desenvolvidos pela própria empresa (usados ​​para computação, semelhantes às GPUs da Nvidia), para criar um "centro de dados de IA orbital" no espaço .

Será que o espaço é necessariamente mais barato e mais eficiente do que a Terra?

Por que o espaço? O raciocínio do Google é simples e direto.

1. 8 vezes mais eficiente: Se um satélite que transporta um chip estiver na órbita correta, a eficiência de seus painéis solares será 8 vezes maior que a da Terra.

2. Fornecimento de energia ininterrupto 24 horas por dia, 7 dias por semana: O espaço não tem escuridão nem nuvens, ao contrário dos painéis solares na Terra, que podem gerar eletricidade continuamente.

▲ Musk publica um X dizendo que satélites com IA no espaço podem proteger a Terra.

3. Consumo zero de recursos: No espaço, os centros de dados não precisam consumir os recursos limitados da Terra nem grandes quantidades de água para refrigeração.

▲ Empresas como Apple, Huawei, Tencent e China Mobile estabeleceram centros de dados em Guizhou. Fonte da imagem: Agência de Notícias Xinhua

Os centros de dados em todo o mundo estão cada vez mais próximos de gargalos energéticos. Na Islândia e na Noruega, são construídos para refrigeração, enquanto no deserto de Nevada, para geração de eletricidade. Na China, a maioria das grandes empresas localiza seus centros de dados em lugares como Guizhou e Zhongwei, em Ningxia, dependendo do ambiente para refrigeração.

No entanto, o ambiente no espaço é muito mais complexo do que na Terra. Em seu artigo de pesquisa, o Google detalha os desafios que enfrenta atualmente e os métodos que está utilizando para resolvê-los.

Para que a IA "alcance o céu", o Google precisa resolver três grandes desafios.

Desafio 1: Uma "Rede de Área Local" no Espaço?

O treinamento de IA exige um número enorme de chips trabalhando em conjunto, com requisitos extremamente altos de largura de banda e latência de conexão. Na Terra, conseguimos transmissão de dados em alta velocidade usando fibra óptica, mas como fazemos isso no espaço?

A solução do Google: voo em formação + comunicação a laser.

Eles planejam fazer com que os satélites "voem muito próximos uns dos outros", a quilômetros ou menos de distância.

Em sua constelação simulada de 81 satélites, cada satélite está equipado com um painel solar, um sistema de resfriamento por radiação e um módulo de comunicação óptica de alta largura de banda; e a distância entre os satélites varia dinamicamente entre 100 e 200 metros .

A uma distância tão curta, eles podem alcançar interconexões de alta velocidade por meio de enlaces ópticos intersatélites em espaço livre (FSO ISL). O Google revelou em seu artigo que sua demonstração alcançou com sucesso uma taxa de transmissão bidirecional de 1,6 Tbps .

Problema Dois: Radiação Cósmica?

O ambiente espacial é extremamente hostil. Embora o Sol forneça energia, ele também emite partículas mortais de alta energia (radiação), que podem ser devastadoras para chips de última geração.

▲ Fonte da imagem: NASA

A solução do Google: aguentar firme.

Eles enviaram seu próprio chip Cloud TPU v6e (Trillium) para o laboratório e o bombardearam com um feixe de prótons de 67 MeV.

O resultado foi "surpreendentemente resistente à radiação", com a memória de alta largura de banda (HBM) mais sensível do TPU começando a apresentar mau funcionamento somente após ser exposta a uma dose de 2 krad(Si), que é quase três vezes a dose de radiação esperada para a missão de 5 anos (750 rad(Si)).

Isso significa que a TPU do Google pode operar continuamente em órbita terrestre baixa por 5 anos sem sofrer danos permanentes.

O Google planeja fazer uma parceria com a Planet para lançar dois satélites protótipos até 2027, a fim de testar ambientes operacionais do mundo real .

▲ Site oficial da Planet, que se concentra principalmente na análise de imagens de satélite e dados da Terra.

Desafio 3: Feedback de Dados

No espaço, a transferência de dados entre GPUs é rápida e eficiente, mas mesmo que os cálculos sejam concluídos no espaço, como os dados podem ser transmitidos de volta à Terra em alta velocidade?

Este é um grande desafio que o Google reconhece em seu artigo e que ainda precisa ser resolvido.

Problema de latência : A "órbita do pôr do sol" escolhida pelo Google, embora maximize a energia solar, aumentará a latência em determinados locais terrestres, segundo o artigo.

Gargalo de largura de banda : O recorde atual para comunicação óptica "terra-ar" ainda é de 200 Gbps , estabelecido pela NASA em 2023.

200 Gbps parece rápido, mas para um centro de dados de IA espacial, essa conexão está longe de ser suficiente.

No entanto, acima de todas essas dificuldades técnicas desafiadoras (redes locais, radiação, comunicação terrestre), existe um obstáculo fundamental e fatal que determina se vale a pena resolver tudo isso: o custo de ir para o espaço .

Antigamente, esse era o maior obstáculo: enviar algo pesando um quilograma para o espaço era mais caro do que o mesmo peso em ouro.

▲ Comparação dos custos de lançamento para uma gama de satélites em órbita terrestre baixa

O Google calculou em seu estudo que, se o custo de lançamento da SpaceX puder ser reduzido para US$ 200/kg (estimado por volta de 2035), o custo unitário de energia dos data centers espaciais poderá se equiparar ao dos data centers terrestres, em torno de US$ 810/kW/ano, sobrepondo-se completamente à faixa de US$ 570 a US$ 3.000/kW/ano dos data centers nos Estados Unidos.

Em outras palavras, quando os foguetes se tornarem suficientemente baratos, o espaço será mais adequado do que a Terra para a construção de centros de dados.

No entanto, a realidade é que o preço de lançamento atual é mais de dez vezes superior ao preço ideal.

Quem pode fazer isso acontecer? SpaceX

Em seu artigo, o Google adotou explicitamente a premissa da curva de aprendizado da SpaceX: sempre que a massa total de lançamento dobra, o custo unitário de lançamento diminui em 20% .

▲ Desde o primeiro lançamento bem-sucedido do Falcon 1, a massa da carga útil da SpaceX, calculada ao menor preço possível, tem mudado gradualmente para diferentes tipos de foguetes.

Do Falcon 1 ao Falcon Heavy, a SpaceX reduziu os custos de lançamento de US$ 30.000/kg para US$ 1.800/kg; e a meta para a Starship é de US$ 60/kg com 10 vezes mais reutilização, podendo, em casos extremos, ser reduzida para US$ 15/kg.

Isso significa que a SpaceX muito provavelmente se tornará a empresa que sustentará o modelo econômico de data centers espaciais do Google.

Se a Nvidia monopolizar as GPUs na Terra, então a SpaceX poderá um dia monopolizar o poder computacional no espaço.

Na Terra, a Nvidia vende GPUs; no espaço, a SpaceX vende órbitas.

Apenas alguns dias antes da publicação do artigo do Google, em 2 de novembro, a poderosa GPU H100 da Nvidia foi enviada ao espaço pela "primeira vez" .

O H100, transportado por um satélite por uma startup chamada Starcloud, possui 100 vezes a capacidade de processamento de qualquer computador espacial anterior.

▲A Starcloud foi fundada em 2024 com o objetivo inicial de construir centros de dados no espaço e recebeu investimentos da Nvidia, Y Combinator e outros.

A missão deles é mais direta: processar dados em tempo real em órbita. O CEO da Starcloud deu um exemplo: os dados brutos de um satélite SAR (radar de imagens) são extremamente grandes. Em vez de baixar centenas de gigabytes de dados brutos, é melhor analisá-los em órbita usando o H100 e enviar de volta apenas um resultado de 1 KB , como "uma nave está em determinada localização e sua velocidade é tão alta".

Ao ser questionado sobre como tudo isso foi alcançado, o CEO da Starcloud também apontou para Musk: a visão deles depende inteiramente da "redução de custos proporcionada pela Starship da SpaceX" .

O satélite Starcloud-1, equipado com uma GPU NVIDIA H100, foi lançado ao espaço através do voo Bandwagon 4 do foguete Falcon 9 da SpaceX.

Nos últimos cinco anos, a Nvidia quebrou repetidamente seu próprio recorde de maior capitalização de mercado, principalmente porque fornece as unidades de computação mais poderosas (GPUs); controla o ecossistema CUDA (Nvidia General Computing Platform), criando um domínio de software; e se tornou a principal fonte de poder computacional para todas as empresas de IA (OpenAI, Anthropic, Google).

Na era da computação espacial, esses três fatores podem ser redistribuídos e, nesse momento, a computação espacial será o próximo grande benefício.

Os limites da IA ​​podem estar apenas começando a ser explorados.

#Siga a conta oficial do iFanr no WeChat: iFanr (ID do WeChat: ifanr), onde você encontrará conteúdo ainda mais interessante o mais breve possível.

ifanr | Link original · Ver comentários · Sina Weibo