A grande aposta de Jen-Hsun Huang da Nvidia: caminhar à beira da falência para construir um “traficante de armas” de IA de um trilhão de dólares

dezembro 1, 2023 gurinho

A receita triplicou para US$ 18,1 bilhões e os lucros dispararam para US$ 9,2 bilhões, de US$ 680 milhões no mesmo período do ano passado.

Sob a onda da IA, a Nvidia superou as expectativas no último trimestre, tirando a coroa da TSMC e se tornando o “Rei dos Chips” com seu desempenho “explosivo”.

Há uma guerra na inteligência artificial e a Nvidia é o único traficante de armas.

Um analista de Wall Street comentou certa vez.

O “dividendo de IA” que a Nvidia desfruta hoje vem da “grande aposta” de Huang Renxun há mais de dez anos. Através de um recente relatório aprofundado na The New Yorker, podemos ver mais detalhes por trás desta “aposta” decisiva.

O sucesso nunca é garantido e a falência está sempre à beira.

O momento do “big bang” que acendeu a inteligência artificial

Foi o primeiro console de videogame com resolução 8K e ocupava toda a parede. Era tão lindo.

Em 2000, o estudante de Stanford Ian Buck construiu seu próprio console de jogos de alta definição conectando 32 placas gráficas Nvidia GeForce e adicionando 8 projetores para jogar "Quake".

Inicialmente, o sucesso da NVIDIA GeForce veio da ajuda do jogo “Quake”. No modo “Deathmatch” do jogo, a computação paralela da GPU dá aos jogadores uma vantagem de velocidade, de modo que cada vez que a GeForce lança um novo produto, os jogadores acompanham.

Buck também estava curioso para saber o que a GeForce poderia fazer além de lançar granadas mais rápido.

Mais tarde, Buck invadiu com sucesso a ferramenta de programação original "shader" da placa gráfica e usou sua computação paralela para transformar o GeForce em um supercomputador de baixo custo.

Não demorou muito para que Buck se tornasse funcionário da NVIDIA.

▲Ian Buck é agora o vice-presidente da Nvidia

Huang Renxun queria que Buck fizesse um conjunto de software que transformasse cada GeForce em um supercomputador. Ao mesmo tempo, a equipe de hardware também pode realizar modificações correspondentes na estrutura do chip.

Em 2006, o CUDA de Buck para NVIDIA foi lançado oficialmente, permitindo que pesquisadores e programadores usassem linguagens de programação para utilizar de forma mais pessoal e eficiente o poder computacional das GPUs.

No entanto, os consumidores têm pouco interesse no supercomputador que Huang Renxun quer popularizar. "Acquired", um podcast de tecnologia popular no Vale do Silício, comentou:

Eles gastaram enormes somas de dinheiro nesta nova arquitetura de chip.
Eles gastaram bilhões de dólares com o objetivo de atender uma área de nicho da computação acadêmica e científica, que era um mercado pequeno na época — certamente menor do que os bilhões que investiram.

Naquela época, a NVIDIA também estava lançando uma ampla rede e tentando encontrar clientes-alvo. Tentei corretores de ações, empresas de exploração de petróleo, biólogos moleculares, etc., mas não considerei o campo da inteligência artificial.

Nem parecia que o “Padrinho da IA” tomou a iniciativa de “bater na sua porta”.

Não admira.

▲ "Padrinho da IA" Geoffrey Hinton

Hoje, chamaríamos Geoffrey Hinton de “Padrinho da IA”.

Porém, em 2009, Hinton estava na área de IA que não era apreciada pelo capital, e sua pesquisa nessa área ainda era considerada um nicho de “rede neural”.

Hinton escreveu este e-mail para a Nvidia naquele ano:

Acabei de dizer a milhares de pesquisadores de aprendizado de máquina que todos deveriam comprar placas gráficas NVIDIA. Você pode me enviar um gratuitamente?

resultado? Claro que foi rejeitado.

Antes disso, Hinton havia tentado usar a plataforma NVIDIA CUDA para treinar uma rede neural para reconhecer a linguagem humana. Ele descobriu que a qualidade dos resultados era muito melhor do que o esperado, então decidiu apresentá-los em uma conferência do setor.

Embora a Nvidia tenha se recusado a enviar uma placa gráfica para Hinton, Hinton ainda incentivou os alunos a usá-la.

Os mais críticos entre eles são seus dois excelentes programadores, Alex Krizhevsky e Ilya Sutskever.

▲(da esquerda para a direita) Ilya Sutskever, Alex Krizhevsky e Geoffrey Hinton

Leitores atentos deveriam ter descoberto que este último é o cientista-chefe da OpenAI, a pessoa que lidera a tecnologia por trás do ChatGPT.

Em 2012, Sutskever e Krizhevsky compraram duas placas gráficas NVIDIA GeForce, alimentaram milhões de dados de imagem na rede neural em uma semana e treinaram o "AlexNet". Sutskever lembrou depois:

A GPU apareceu e pareceu um milagre.

Seu suspiro não foi sem razão.

Também no mesmo ano, o Google comprou mais de 16.000 CPUs para treinar sua rede neural para que pudesse reconhecer vídeos de gatos.

No entanto, AlexNet pode identificar corretamente imagens de veículos elétricos, chitas, navios de carga, etc., usando apenas duas GPUs.

Em 2012, no ImageNet Large Scale Visual Recognition Challenge, que ainda era bastante confiável naquele ano, AlexNet venceu o campeonato com um erro de 15,3% entre os 5 primeiros, muito melhor do que o segundo colocado e os competidores anteriores. que ele já foi suspeito de trapacear. Hinton comentou:

Foi uma espécie de momento de grande estrondo. Uma mudança de paradigma.

Embora não tenha sido intencional, a NVIDIA deu início ao momento do “big bang” da inteligência artificial.

Torne-se uma empresa de IA

(Huang Renxun) Ele enviou um e-mail na noite de sexta-feira dizendo que tudo na empresa girará em torno do aprendizado profundo e que não somos mais uma empresa de imagem.
Na manhã de segunda-feira seguinte, nos tornamos uma empresa de IA.
Realmente, é muito rápido.

O vice-presidente da Nvidia, Greg Estes, disse ao The New Yorker.

Após a estreia do AlexNet, em poucos anos, quase todos os participantes de desafios de reconhecimento visual em grande escala escolheram a forma de redes neurais.

Em meados da década de 2010, a precisão do reconhecimento de imagens de redes neurais treinadas com GPUs atingiu 96%, um nível de precisão que superou até mesmo o dos humanos.

A visão do supercomputador de Huang Renxun se tornou realidade e ele começou a procurar seu próximo objetivo:

O fato de podermos resolver um problema de visão computacional, um problema completamente desestruturado, aponta para a pergunta: "O que mais você pode ensinar?"

A resposta interna de Huang Renxun parece ser – tudo.

Ele acredita que as redes neurais mudarão a sociedade e também poderá usar CUDA para monopolizar o mercado do hardware necessário por trás delas.

Ele deu um salto e iniciou a jornada de IA da Nvidia.

Desta vez, os líderes da indústria de IA não precisam mais escrever e-mails para a Nvidia solicitando placas gráficas gratuitas.

Em agosto de 2016, Huang Renxun entregou pessoalmente o primeiro DGX-1 do mundo ao escritório da OpenAI.

Musk, que ainda não havia rompido com a OpenAI na época, desembalou pessoalmente o produto que levou três anos para ser construído por 3.000 pessoas.

No comunicado de imprensa oficial, Huang disse brincando:

Se este fosse o único produto enviado, o projeto custaria US$ 2 bilhões.

Quem diria que no ano seguinte o Google anunciaria uma nova arquitetura de treinamento de rede neural, o Transformer.

Este novo avanço foi capturado por Sutskever, liderando a OpenAI na construção do primeiro modelo GPT, todo construído em supercomputadores NVIDIA.

Há um ano, a OpenAI lançou oficialmente o ChatGPT ao público, mudando tudo, inclusive a Nvidia.

Os pedidos são infinitos e a oferta excede a demanda.

Em 2023, o preço das ações da Nvidia disparou mais de 200%, tornando-se o primeiro fabricante mundial de chips com um valor de mercado superior a um trilhão de dólares americanos.

CUDA, que antes não era otimista, também reuniu 4 milhões de desenvolvedores e se tornou outro “fosso” para a NVIDIA no campo de IA.

Quer se trate de pesquisas nas áreas aeroespacial, biociência, maquinaria, exploração de energia e outras áreas, a maioria delas é conduzida em CUDA.

O mais recente produto de IA da NVIDIA, o DGX H100, é uma caixa de metal que pesa 370 libras e custa US$ 500.000.

Comparado com o DGX-1 enviado ao escritório da OpenAI naquela época, o novo produto funciona cinco vezes mais rápido.

Se quiser treinar AlexNet, você pode fazer isso em um minuto.

O vencedor que está sempre “à beira da falência”

Em setembro deste ano, Huang foi convidado a voltar ao restaurante Denny's em San Jose, Califórnia.

Naquela época, ele elaborou documentos com seus sócios no estande deste restaurante e fundou a Nvidia.

Eles queriam projetar um chip que deixasse os concorrentes “verdes de inveja”. Jen-Hsun Huang criou o nome “Nvidia”, incorporando a palavra latina “invidia”.

Hoje em dia a Nvidia certamente tem inveja de seus concorrentes, até o CEO da rede de restaurantes Denny's fez especialmente para eles uma placa comemorativa, para que a luz da Nvidia brilhe no restaurante.

No entanto, o sucesso da Nvidia não é uma história de “vencedor” particularmente típica.

Quando a NVIDIA foi criada, Huang Jen-Hsun, que adorava videogames, acreditava que o mercado de jogos merecia placas gráficas melhores e lançou seu primeiro produto, NV1, em 1995.

No entanto, o NV1 não foi realmente aceito pelo mercado convencional, uma das razões é que a Microsoft lançou a API D3D no mesmo ano, mas o NV1 não suporta D3D. O produto da próxima geração, NV2, também falhou.

Huang Renxun, que perdeu sua "aposta" uma vez, não se convenceu: em 1996, ele demitiu metade de seus funcionários, restringiu os fundos e apostou tudo em novos produtos não testados:

As probabilidades são de 50/50, mas de qualquer forma já estamos à beira da falência.

Quando o RIVA 128 foi lançado oficialmente, a NVIDIA só tinha dinheiro suficiente para cobrir as despesas de um mês. Felizmente, o RIVA 128 foi um sucesso, com milhões de unidades vendidas em 4 meses.

Desde então, Huang incentivou os funcionários a trabalharem com esse “desespero”.

Para Jen-Hsun Huang, dificuldades e fracassos não são estranhos:

Acho que penso com mais clareza quando estou em uma situação difícil.
Minha frequência cardíaca até cairia.

Ele até insistiu que “as falhas devem ser compartilhadas”.

Anteriormente, a Nvidia havia enviado uma placa gráfica problemática com um ventilador muito barulhento.

Huang Renxun não demitiu o gerente responsável por este produto. Em vez disso, ele realizou uma reunião, reuniu centenas de pessoas e pediu ao gerente que descrevesse cada decisão que levou a essa farsa.

Mostrar “fracasso” virou um “costume” dentro da NVIDIA.

Você também pode dizer rapidamente quem pode ficar aqui e quem não pode.
Se alguém começar a se defender, sei que não ficará por aqui por muito tempo.

disse Dwight Diercks, chefe de software da Nvidia.

Huang também gosta de incentivar os funcionários a buscarem “mercados de zero bilhão de dólares” – áreas experimentais onde não há concorrentes nem clientes claros.

Afinal, como disse Huang Renxun:

Sempre pensei que estávamos a apenas 30 dias da falência. Isso nunca mudou.

Não há razão para não tentar.

# Bem-vindo a seguir a conta pública oficial do WeChat de aifaner: aifaner (WeChat ID: ifanr).Mais conteúdo interessante será fornecido a você o mais rápido possível.

Ai Faner | Link original · Ver comentários · Sina Weibo