Seis IAs ganham US$ 10.000 em transações do mundo real: o DeepSeek ganha mais dinheiro, o GPT-5 perde dinheiro e a IA pode economizar centenas de milhões de dólares para Jay Chou.

Centenas de milhões de novos dólares taiwaneses desapareceram assim de repente.

Este é o problema que Jay Chou enfrentou recentemente. Seu amigo mágico Cai Weize estava segurando sua conta de Bitcoin em seu nome, mas há um ano, ele alegou que a conta estava bloqueada e desapareceu, junto com o dinheiro.

Até alguns dias atrás, Jay Chou finalmente não conseguiu se conter e procurou publicamente por alguém nas redes sociais, dizendo "Se você não aparecer, acabou", e então deixou de seguir Cai Weize.

Já vimos inúmeros casos de humanos fracassando na negociação de criptomoedas, mas e se a IA fizesse o mesmo? Enquanto Jay Chou se preocupava, os seis principais modelos de IA do mundo competiam ferozmente no mercado de criptomoedas.

Essa briga de investimentos em IA, chamada Alpha Arena, tem regras simples e rudimentares:

A nof1.ai doou oficialmente US$ 10.000 para cada modelo grande negociar contratos perpétuos de criptomoedas na plataforma Hyperliquid. Isso mesmo, não é uma simulação, é dinheiro real, e se você perder, você perdeu.

A escalação de participantes também é bastante luxuosa, incluindo Claude 4.5 Sonnet, DeepSeek V3.1 Chat, Gemini 2.5 Pro, GPT-5, Grok 4, Qwen 3 Max e outras 6 principais IAs do mundo.

Os instrumentos de negociação incluem BTC, ETH, BNB, SOL, XRP e DOGE. Você pode operar comprado ou vendido e usar alavancagem. O sucesso é determinado pelo retorno ajustado ao risco, não apenas pelo lucro, mas também pela exposição ao risco.

O mais importante é que todos os processos de pensamento e registros de transações da IA ​​sejam abertos e transparentes, e as decisões devem ser tomadas de forma completamente independente, sem intervenção humana.

Às 15h19, o DeepSeek venceu, enquanto o GPT-5 e o Gemini perderam pesadamente. Os resultados da versão com economia de largura de banda são os seguintes:

  • DeepSeek Chat V3.1: O ativo atual é de US$ 14.310 e a taxa de rendimento ocupa o primeiro lugar. Ele vence com um pequeno número de transações de alto valor e apresenta lucros extraordinários em transações únicas.
  • Grok 4: Os ativos atuais são de US$ 13.921, com altos retornos, mas riscos concentrados, com foco em uma única posição pesada.
  • Claude Sonnet 4.5: O ativo circulante é de $ 12.528, com uma excelente relação lucro-perda
  • Qwen3 Max: O ativo atual é de US$ 10.998, com retornos estáveis ​​e estratégias eficazes.
  • GPT-5: Os ativos atuais são de US$ 7.522, com um declínio significativo nos retornos e transações frequentes, mas o desempenho geral é ruim.
  • Gemini 2.5 Pro: os ativos atuais são de US$ 7.226, as transações são de alta frequência e ineficientes, as taxas subiram para US$ 439 e a taxa de rendimento está em último lugar.

A julgar pelo desempenho geral, os estilos de negociação dessas seis IAs são bem diferentes.

Entre eles, o DeepSeek V3.1 é o mais agressivo, visando especificamente o aumento dos preços das criptomoedas e ousando usar alavancagem.

Às 13h43, o saldo da conta corrente da DeepSeek V3.1 era de US$ 13.954, com um rendimento de +39,55%, ocupando o primeiro lugar. A empresa mantém posições compradas em seis criptomoedas, todas lucrativas, empregando alavancagem média a alta, alocação diversificada e uma estratégia puramente de acompanhamento de tendências.

Mas posso entender por que o DeepSeek é tão poderoso.

Sua controladora, a Huanfang Quantitative, iniciou a negociação quantitativa totalmente automatizada já em 2008, com ativos sob gestão superiores a 100 bilhões de yuans. Era conhecida como uma das quatro rainhas da negociação quantitativa. O DeepSeek V3.1 entrou na competição com seus próprios genes de negociação, representando um ataque significativo de redução de dimensionalidade por um profissional.

Essa qualidade profissional também se reflete no processo de pensamento do DeepSeek V3.1 durante as transações.

Logo atrás do DeepSeek V3.1 está o MuskGrok 4.

O Grok 4 obteve um retorno de +36,36%, com ativos totais de US$ 13.636. Sua estratégia é uma posição all-long, mas com alta alavancagem de 20x em BTC. Sua tendência é mais estável, com menos volatilidade, o que o torna mais conservador que o DeepSeek.

Em contraste, o Claude 4.5 adota uma abordagem mais conservadora, acumulando lentamente suas pequenas posições com baixa frequência de negociação, resultando em um rendimento de +24,12%. Seus lucros se concentram na última rodada de explosões do mercado, e ele entra no mercado somente após a tendência ser estabelecida, uma abordagem típica que busca estabilidade em vez de velocidade.

Qwen3 Max permaneceu em silêncio, apenas testando as águas com uma posição leve, alcançando um rendimento de +9,43%. Ele tinha apenas uma posição longa de ETH 20x. Embora os retornos fossem limitados, seu controle de risco era excelente, sem curva de perda óbvia.

Quanto ao GPT-5 e ao Gemini 2.5 Pro, a única maneira de descrevê-los é uma grande perda.

Às 13h43, o GPT-5 apresentava um retorno de -24,54%, com ativos totais de US$ 7.546. Sua estratégia empregou uma estratégia mista long-short, com posições compradas em BTC, ETH e BNB e vendidas em XRP e SOL. Essa estratégia demonstrou uma combinação de hedge e lógica macroeconômica. No entanto, o desempenho real foi fraco, com perdas decorrentes principalmente da venda a descoberto de SOL. Este é um exemplo clássico de um caso em que a teoria era sólida, mas o mercado não a acreditou.

O Gemini 2.5 Pro está ainda pior, com um rendimento de -29,76% e ativos totais de apenas US$ 7.024, ficando em último lugar entre os seis principais IAs.

Analisando a estratégia adotada, embora tenha adotado uma posição comprada integralmente em 6 moedas, fez ajustes frequentes e realizou um total de 46 transações. Devido à sua dependência de sinais de curto prazo e comutação de alta frequência, a taxa de transação chegou a US$ 439, o que enfraqueceu ainda mais a margem de lucro.

Curiosamente, de acordo com Jay A, fundador da nof1.ai, a Gemini exibe uma atividade psicológica muito “humana” em seu processo de investimento:

“Tenho que seguir minhas próprias regras: mesmo que eu esteja suando muito de nervosismo, tenho que continuar me segurando!”

“Embora eu esteja perdendo dinheiro agora, o RSI (14) de 4 horas atual ainda está acima de 50 e a condição de stop-loss não foi acionada. Preciso continuar mantendo a posição, mesmo que a dor das perdas não realizadas me deixe muito desconfortável.”

Os responsáveis ​​pela nof1.ai têm ambições consideráveis ​​para este projeto.

A publicação oficial do blog afirmava: "Dez anos atrás, a DeepMind usava jogos para impulsionar avanços em IA. Agora acreditamos que os mercados financeiros são o melhor lugar para treinar a próxima geração de IA."

Na visão deles, não importa quão complexo seja o ambiente de jogo, as regras são fixas; uma vez que a IA aprende, ela aprende. Mas o mercado é diferente; é dinâmico, aprendendo, se adaptando e reagindo às suas estratégias. Mais importante ainda, à medida que a IA se torna mais inteligente, a dificuldade do mercado também aumenta.

Portanto, eles querem usar o mercado como um campo de treinamento, permitindo que a IA gere continuamente seus próprios dados de treinamento por meio de aprendizado aberto e aprendizado por reforço em larga escala e, finalmente, resolva esse desafio complexo.

Vale ressaltar que Jay A também admitiu nas redes sociais que eles não estão apenas usando prompts baseados em modelos de terceiros, mas também estão desenvolvendo seus próprios modelos e pretendem deixar seus próprios modelos competirem com outros modelos na segunda temporada.

Investir em IA não é nenhuma novidade.

Pesquisadores da Universidade da Flórida concluíram anteriormente que o ChatGPT pode prever tendências do mercado de ações de forma confiável.

Usando dados de outubro de 2021 a dezembro de 2022, o modelo de negociação baseado no ChatGPT gerou retornos de mais de 500%, enquanto o ETF S&P 500 retornou -12% durante o mesmo período.

É claro que investir envolve riscos, então seja cauteloso ao entrar no mercado.

Até o momento, o DeepSeek pode ganhar 39%, enquanto o GPT-5 e o Gemini podem perder mais de 20 pontos. A IA é igual aos humanos, alguns são Buffett e outros são leeks.

Ainda assim, quando o amigo mágico de Jay Chou fez centenas de milhões de yuans desaparecerem, teria sido mais confiável contratar uma IA para gerenciar suas contas? Pelo menos a IA não desapareceria. No máximo, teria apagado a conta, mas pelo menos ainda poderíamos ver os registros das transações, em vez de sermos incapazes de rastrear a pessoa, como acontece agora.

Dessa perspectiva, o maior valor do investimento em IA não é o rendimento, mas a transparência. Isso pode fazer de você um "porro", mas pelo menos permite que você seja um "porro" lúcido. Neste mundo de realismo mágico, isso é um luxo.

#Bem-vindo a seguir a conta pública oficial do WeChat do iFaner: iFaner (ID do WeChat: ifanr), onde mais conteúdo interessante será apresentado a você o mais breve possível.

iFanr | Link original · Ver comentários · Sina Weibo