DeepSeek: tudo o que você precisa saber sobre a IA que destronou o ChatGPT

Uma startup chinesa com um ano de existência está conquistando a indústria de IA depois de lançar um chatbot que rivaliza com o desempenho do ChatGPT , usando uma fração das despesas de energia, resfriamento e treinamento exigidas pelos sistemas OpenAI, Google e Antrópico. Aqui está tudo o que você precisa saber sobre os modelos V3 e R1 da Deepseek e por que a empresa poderia derrubar fundamentalmente as ambições de IA da América.

O que é DeepSeek?

DeepSeek (tecnicamente, “Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co., Ltd.”) é uma startup chinesa de IA que foi originalmente fundada como um laboratório de IA para sua empresa-mãe, High-Flyer, em abril de 2023. Em maio daquele ano, DeepSeek foi desmembrada em sua própria empresa (com a High-Flyer permanecendo como investidora) e também lançou seu modelo DeepSeek-V2. A V2 ofereceu desempenho equivalente ao de outras empresas chinesas líderes em IA, como ByteDance, Tencent e Baidu, mas a um custo operacional muito menor.

A empresa lançou o V3 em dezembro de 2024. V3 é um modelo de 671 bilhões de parâmetros que supostamente levou menos de 2 meses para ser treinado . Além do mais, de acordo com uma análise recente de Jeffries, o “custo de treinamento do DeepSeek é de apenas US$ 5,6 milhões (assumindo o custo de aluguel de US$ 2/H800 horas). Isso é menos de 10% do custo da Lhama da Meta.” Essa é uma pequena fração das centenas de milhões a bilhões de dólares que empresas norte-americanas como Google, Microsoft, xAI e OpenAI gastaram treinando seus modelos.

Os testes de benchmark colocam o desempenho do V3 no mesmo nível do GPT-4o e Claude 3.5 Sonnet. Um artigo de opinião de dezembro de 2024 no The Hill categorizou o sucesso do DeepSeek como o “Momento Sputnik” da América.

DeepSeek lançou seu modelo R1-Lite-Preview em novembro de 2024, alegando que o novo modelo poderia superar a família o1 de modelos de raciocínio da OpenAI (e fazê-lo por uma fração do preço). A empresa estima que o modelo R1 seja entre 20 e 50 vezes mais barato de executar, dependendo da tarefa, do que o o1 da OpenAI. DeepSeek posteriormente lançou DeepSeek-R1 e DeepSeek-R1-Zero em janeiro de 2025. O modelo R1, ao contrário de seu rival o1, é de código aberto, o que significa que qualquer desenvolvedor pode usá-lo.

Como tal, V3 e R1 explodiram em popularidade desde seu lançamento, com o AI Assistant da DeepSeek com tecnologia V3 substituindo o ChatGPT no topo das lojas de aplicativos . O capitalista de risco Marc Andreesen, em uma postagem recente nas redes sociais, chamou o chatbot da DeepSeek de “uma das inovações mais incríveis e impressionantes que já vi” e um “profundo presente para o mundo”.

O que o DeepSeek pode fazer?

Como um modelo de linguagem grande de código aberto, os chatbots do DeepSeek podem fazer essencialmente tudo o que ChatGPT, Gemini e Claude podem. Isso inclui geração de texto, áudio, imagem e vídeo. Além do mais, a família de modelos multimodais recém-lançada da DeepSeek, apelidada de Janus Pro , supostamente supera o DALL-E 3, bem como o PixArt-alpha, o Emu3-Gen e o Stable Diffusion XL, em dois benchmarks do setor. DeepSeek-R1, rivalizando com o1, foi projetado especificamente para realizar tarefas complexas de raciocínio, ao mesmo tempo em que gera soluções passo a passo para problemas e estabelece “cadeias lógicas de pensamento”, onde explica seu processo de raciocínio passo a passo ao resolver um problema . 

ah cara #deepseek

— Alexios Mantzarlis (@mantzarlis.com) 2025-01-27T16:50:40.640Z

O que os produtos da DeepSeek não podem fazer é falar sobre a Praça Tienanmen. Ou os protestos da Yellow Umbrella. Ou a semelhança do presidente Xi Jinping com o Ursinho Pooh. Basicamente, se for um assunto considerado proibido pelo Partido Comunista Chinês, os chatbots do DeepSeek não abordarão o assunto nem se envolverão de forma significativa.

Quem pode usar o DeepSeek?

Proibição temporária de inscrição do DeepSeek
Andrew Tarantola / DeepSeek / Tendências Digitais

Como um LLM de código aberto, o modelo do DeepSeek pode ser usado por qualquer desenvolvedor gratuitamente. OpenAI cobra US$ 200 por mês pela assinatura Pro necessária para acessar o1. Os modelos da DeepSeek estão disponíveis na web, por meio da API da empresa e por meio de aplicativos móveis. Você precisará se inscrever para uma conta gratuita no site do DeepSeek para usá-lo, no entanto, a empresa pausou temporariamente novas inscrições em resposta a “ataques maliciosos em grande escala aos serviços do DeepSeek”. Os usuários existentes podem entrar e usar a plataforma normalmente, mas ainda não há informações sobre quando novos usuários poderão experimentar o DeepSeek por si próprios.

Por que o DeepSeek de repente se tornou tão importante?

Desde o lançamento do ChatGPT em novembro de 2023, as empresas americanas de IA têm se concentrado na construção de modelos de linguagem grandes maiores, mais poderosos, mais expansivos, mais poderosos e com uso intensivo de recursos. Em vez de procurar construir LLMs mais econômicos e energeticamente eficientes, empresas como OpenAI, Microsoft, Anthropic e Google acharam por bem simplesmente forçar o avanço da tecnologia com força bruta, na tradição americana, simplesmente jogando quantias absurdas de dinheiro e recursos no problema. Só em 2024, esperava-se que o CEO da xAI, Elon Musk, gastasse pessoalmente mais de US$ 10 bilhões em iniciativas de IA. A OpenAI e seus parceiros acabam de anunciar uma iniciativa do Projeto Stargate de US$ 500 bilhões que aceleraria drasticamente a construção de concessionárias de energia verde e data centers de IA nos EUA. O Google planeja priorizar o dimensionamento da plataforma Gemini ao longo de 2025 , de acordo com o CEO Sundar Pichai, e espera-se que gaste bilhões este ano na busca desse objetivo. A Meta anunciou em meados de janeiro que gastaria até US$ 65 bilhões este ano no desenvolvimento de IA.

DeepSeek acabou de mostrar ao mundo que nada disso é realmente necessário – que o “AI Boom” que tem ajudado a impulsionar a economia americana nos últimos meses e que tornou empresas de GPU como a Nvidia exponencialmente mais ricas do que eram em outubro de 2023, pode ser nada mais do que uma farsa. Também questiona até que ponto os EUA realmente têm liderança em IA, apesar de proibirem repetidamente os envios de GPUs de última geração para a China no ano passado.

“O resultado final é que o desempenho superior dos EUA foi impulsionado pela tecnologia e pela liderança que as empresas americanas têm em IA”, disse Keith Lerner, analista da Truist, à CNN . “A implementação do modelo DeepSeek está levando os investidores a questionar a liderança que as empresas americanas têm e quanto está sendo gasto e se esses gastos levarão a lucros (ou gastos excessivos).”

Em suma, o DeepSeek acabou de vencer a indústria americana de IA no seu próprio jogo, mostrando que o mantra atual de “crescimento a todo custo” não é mais válido. “O DeepSeek claramente não tem acesso a tanta computação quanto os hiperscaladores dos EUA e de alguma forma conseguiu desenvolver um modelo que parece altamente competitivo”, disse Srini Pajjuri, analista de semicondutores da Raymond James, à CNBC . Se uma startup chinesa pode construir um modelo de IA que funcione tão bem quanto o mais recente e melhor da OpenAI, e fazê-lo em menos de dois meses e por menos de US$ 6 milhões, então para que serve Sam Altman?

“O tempo dirá se a ameaça DeepSeek é real – começou a corrida para saber qual tecnologia funciona e como os grandes players ocidentais responderão e evoluirão”, disse Michael Block, estrategista de mercado da Third Seven Capital, à CNN. “Os mercados ficaram muito complacentes no início da era Trump 2.0 e podem estar procurando uma desculpa para recuar – e eles encontraram uma ótima desculpa aqui.”