O GPT 5.1, sob um nome diferente, está agora em beta aberto, gratuito para uso e pronto para entrar na disputa das principais atualizações de fim de ano.

Gemini 3 ainda não foi visto, mas o GPT 5.1 já está a caminho. No final do dia 7, um novo modelo anônimo foi lançado na plataforma OpenRouter. Alguns internautas atentos e ágeis já o testaram e acreditam que se trata do GPT 5.1 disfarçado, provisoriamente chamado de Polaris Alpha.

Atualmente, as chamadas de API estão disponíveis (incluindo OpenRouter). A base de conhecimento expira em outubro de 2024 e o modo de inferência não é suportado. O tamanho máximo do contexto é de 256 KB e a saída máxima por ciclo é de 128 KB.

O desenvolvedor manteve as informações confidenciais, mas graças aos esforços incansáveis ​​dos internautas, eles conseguiram "quebrar" o sistema, fazendo com que o Polaris Alpha revelasse sua existência.

▲ Imagem do usuário X @ LarryAtherton1

Isso não é exatamente uma evidência concreta; pode ser apenas um problema com os dados de treinamento — muitos modelos usam dados de fornecedores proprietários. A menos que seja explicitamente declarado nas instruções do sistema ou repetidamente inserido por meio de ajustes manuais, esses modelos realmente não "sabem" o que são.

De qualquer forma, ainda não há nenhum anúncio oficial, então vamos chamá-lo de Polaris por enquanto. A APPSO também fez um teste rápido. Como utiliza uma API, algumas funções, como o processamento de materiais de áudio, estão temporariamente limitadas. Tirando isso, o desempenho do Polaris nos deixa bastante animados para o GPT 5.1.

Trabalho de escritório: Tranquilo, como sempre.

Primeiro, havia algumas tarefas básicas e simples: escrever e-mails conforme necessário. Este era um e-mail de desculpas, informando os convidados sobre a nova data do evento. Eu enfatizei especificamente que o tom deveria ser ao mesmo tempo de desculpas e amigável, para que Polaris pudesse ter uma ideia de como seria.

É bastante padrão, com informações completas, lógica clara e um tom que não parece excessivamente "humano-máquina". O que é surpreendente é que, com o modo de busca ativado, o Polaris pesquisa por formatos de cartas de desculpas e suas informações citadas incluem até mesmo verbetes da Enciclopédia do Taobao… Parece que o Polaris está abrangendo cada vez mais fontes de informação, e fontes cada vez mais específicas.

Depois, há a tarefa de redação publicitária que exige ideias criativas. Dei instruções muito vagas, exigindo apenas que o texto fosse relevante para a internet e adequado para compartilhamento no Xiaohongshu.

A Polaris forneceu três estilos diferentes, com textos muito completos. Eles também incluíram um plano de implementação detalhado para o evento. Já fica claro, por isso, que a linguagem tem um estilo que lembra o do grupo GPT. Alguns internautas até compilaram estatísticas de similaridade — seus disfarces estão começando a ruir.

O estilo de texto continua sendo a base de qualquer modelo de linguagem de grande porte, visto que sua aplicação mais comum atualmente é o trabalho de escritório. Com 2026 se aproximando rapidamente, fornecer um texto com uma sensação "humano-máquina" é imperdoável. Atualmente, o estilo de escrita do Polaris tem um toque bastante típico de "GPT", uma opinião compartilhada por muitos usuários.

Entretanto, para cenários de aplicação como chatbots, bate-papo e companhia, a capacidade do estilo de escrita de se adaptar rapidamente ao ritmo do usuário e "aprender" de forma flexível um tom personalizado também será um desafio para o GPT 5.1 — a demanda global pelo retorno da versão 4.0 é algo que a OpenAI provavelmente não quer vivenciar novamente.

Como não consegui processar os arquivos de áudio diretamente, carreguei a transcrição do podcast e pedi ao Polaris para organizar e extrair as informações principais, fazendo os ajustes necessários nas partes coloquiais. O objetivo principal era criar um esboço bem estruturado com base em diferentes dimensões temáticas, preservando também os marcadores de tempo.

A entrada parece exceder 10.000 caracteres (mensagem única). No entanto, devido à limitação do OpenRouter de armazenar apenas oito mensagens por janela, entradas extremamente longas afetarão a estabilidade da saída até certo ponto. Mesmo assim, sua capacidade de autocorreção é bastante boa; ele gerou um timestamp inexistente na primeira execução, mas o corrigiu após uma nova execução.

Desde o GPT 5, a capacidade de uma única janela no ChatGPT aumentou significativamente. O feedback das redes sociais sugere que o número máximo de tokens chegou a 600.000-800.000 antes de atingir o limite. Isso é um sinal muito positivo para a personalização das informações do usuário, mas inevitavelmente, com tempos de contexto tão longos, ocorrerão problemas de agendamento de memória e diminuição da estabilidade da saída.

Isso apresenta ao GPT 5.1 um desafio completamente novo: como manter um agendamento de memória flexível e preciso mesmo após aumentar ainda mais a capacidade da janela. Para os usuários, essa é uma experiência decisiva que pode ser sentida quase imediatamente.

Programação: Super simples, super tranquila

O OpenRouter oferece diversas implementações básicas de programação e pré-visualizações. Rapidamente o utilizei para testar a capacidade do Polaris de criar pequenos jogos.

A impressão mais imediata é que leva um pouco mais de tempo, cerca de cinco minutos. No entanto, não preciso fornecer instruções complicadas; basta dizer "crie um código para um jogo da cobrinha" para gerar um pequeno jogo jogável.

Ele oferece até diferentes modos e configurações, e a jogabilidade na prévia foi muito fluida. Eu também joguei um jogo de bater em toupeiras, que também foi concluído com sucesso.

O design do site também ficou ótimo. Enviei o texto gerado para a cafeteria de volta para a Polaris e pedi que eles criassem uma página de destino para o evento.

A Polaris analisou todo o texto e adicionou alguns detalhes, resultando em um bom efeito visual. Gostei particularmente do efeito luminoso dos botões, que parece ser um "diferencial" do produto, já que também foi observado em testes realizados por outros usuários.

▲ Imagem do usuário X

A julgar por outros testes online, seu desempenho estético é promissor.

▲ Imagem do usuário X @ HarshithLucky3

Essas tarefas fundamentais transcorrem, em grande parte, sem grandes problemas, mas, francamente, o campo da programação de IA é extremamente competitivo atualmente, e os produtos baseados em GPT nunca se destacaram particularmente em programação. Resta saber se o GPT 5.1 trará um avanço significativo no desempenho de programação após sua implementação.

Sam Altman afirmou recentemente que o ChatGPT implementará um modo NSFW (Modo Adulto) até o final do ano, e parece que já é possível observar indícios disso no Polaris.

Se for esse o caso, então temos mais uma evidência de que o Polaris é o GPT 5.1, especialmente considerando que a OpenAI tem realizado recentemente verificações de idade em pequena escala. Não se trata de uma operação em larga escala, mas sim de uma ação direcionada a usuários cuja idade real é incerta.

O modo adulto é altamente controverso e sua implementação prática não é tão simples quanto se imagina. Além da verificação, há uma série de problemas relacionados à identificação e ao armazenamento de informações de privacidade. Resta saber se será possível encontrar uma solução que equilibre as demandas de todas as partes, dependendo de como o GPT 5.1 abordará essas questões.

Com outra batalha acirrada se aproximando no final do ano, o Gemini 3 vem sendo anunciado há algum tempo (embora tenha sido adiado repetidamente), e o Nano Banana 2 surgiu repentinamente. Sem mencionar o lançamento anterior do Kimi K2 Thinking, que atraiu muita atenção tanto nacional quanto internacionalmente, com um custo de treinamento de apenas US$ 4,6 milhões.

A OpenAI continua a ter despesas exorbitantes e, apesar da sua impressionante base de utilizadores ativos, a rentabilidade permanece difícil de alcançar. Perante a concorrência de uma série de modelos chineses poderosos e económicos, conseguirá o GPT 5.1 corresponder às expectativas?

Saberemos em breve. Os rumores sugerem que será lançado em meados de novembro, e talvez tenhamos a resposta então.

#Siga a conta oficial do iFanr no WeChat: iFanr (ID do WeChat: ifanr), onde você encontrará conteúdo ainda mais interessante o mais breve possível.

ifanr | Link original · Ver comentários · Sina Weibo