O DeepSeek acaba de receber uma grande atualização, a versão 4 está chegando rapidinho com detalhes da experiência do usuário

Acaba de receber uma grande atualização a versão web do DeepSeek.
Não houve conferência de imprensa, nem postagem em blog, nem mesmo um tweet oficial. Dois novos ícones apareceram acima da caixa de entrada na interface web do DeepSeek: um raio e um diamante, correspondendo ao "Modo Rápido" e ao "Modo Especialista", respectivamente.

Ao posicionar o cursor sobre a tela, uma mensagem aparece: Modo Rápido "Ideal para conversas do dia a dia, resposta instantânea", Modo Especialista "Avançado para problemas complexos, pode exigir espera em horários de pico".
Com base em testes reais e análises de usuários, as diferenças entre os dois modos são aproximadamente as seguintes:
O modo rápido consegue reconhecer texto em imagens e documentos de forma rápida e instantânea. A desvantagem é que provavelmente utiliza um modelo V4 Lite mais leve em segundo plano, mas é otimizado para velocidade.
O modo especialista parece ter migrado para um modelo maior e mais poderoso — provavelmente uma variante da versão oficial DeepSeek V4. No entanto, atualmente ele não oferece suporte a uploads de arquivos nem recursos multimodais. Espere um minuto, um modelo mais poderoso com menos recursos?
Realizamos também um teste simples.
Por exemplo, peça a cada um dos dois modos que escrevam um programa em p5.js para simular uma bola quicando dentro de um hexágono giratório, sujeita aos efeitos da gravidade e do atrito. Os resultados são bastante intuitivos — o modo especialista proporciona um comportamento físico mais intuitivo, pontos de aterrissagem mais precisos e uma trajetória de quique mais realista.


Essa diferença é bastante reveladora. Simulações físicas exigem fortes habilidades de raciocínio matemático, e modelos mais fracos tendem a produzir resultados que "parecem fisicamente corretos, mas na verdade estão errados". O modo especialista, nesse contexto, reflete uma diferença genuína de habilidade.
No entanto, o resultado do jogo Space Invaders criado por internautas foi um tanto inesperado: o desempenho no Modo Especialista e no Modo Rápido não apresentou diferenças significativas.

Um usuário que realizou o teste ofereceu a seguinte avaliação: "Estimo que o modo especialista ainda esteja utilizando uma versão V4 Lite. Talvez tenhamos que esperar um pouco mais para ver a versão completa da V4 disponível na web." Em outras palavras, essa implementação em tons de cinza do "modo especialista" pode não ser a versão final.
Em termos de escrita criativa, criei um exercício de redação para debate, adequado para ambas as modalidades: "Defenda o tédio e argumente que ele é um luxo para as pessoas modernas". A modalidade avançada produziu um texto mais extenso, com uma linha de raciocínio mais completa, enquanto o estilo de escrita da modalidade rápida foi relativamente natural e simples.


Curiosamente, a diferença de velocidade entre os dois modos não foi significativa nesta tarefa; na verdade, o modo especialista apresentou um tempo de raciocínio menor. Isso é um tanto contraintuitivo, mas pode estar relacionado à natureza da tarefa — a escrita criativa é muito menos sensível ao tamanho do modelo do que as tarefas de raciocínio matemático.
Para tarefas simples, a diferença entre os dois modos é limitada; no entanto, quanto mais complexo o cenário, mais óbvia se torna a vantagem do modo especialista.
No problema de lógica matemática "Uma corda é enrolada ao redor da Terra e então alongada em 1 metro e distribuída uniformemente. Qual é a altura do vão?", embora ambos os modos forneçam a mesma resposta, os processos são completamente diferentes. O modo rápido fornece uma resposta muito breve; o modo especialista detalha o processo passo a passo, explicando cada dedução claramente, o que se assemelha mais à instrução de "escrever o raciocínio".
Vale mencionar que, atualmente, apenas os modos Rápido e Especialista estão disponíveis na versão web, mas vazamentos anteriores sugerem que uma terceira opção — o "Modo Visão" — está a caminho.
KOL Teortaxes, que acompanha o roteiro tecnológico da DeepSeek, acredita que listar o Vision como uma classe separada é uma estratégia incomum. Ele mencionou que a DeepSeek anteriormente se recusou a lançar a série DS-VL na web porque ela "ainda não estava madura". Se o modo Vision for de fato lançado, provavelmente será compatível com um VLM "totalmente funcional".
Em sua extensa análise, Teortaxes apresentou uma conjectura ainda mais ousada: este modelo visual pode não ser um VLM convencional, mas sim algum tipo de "modelo de mundo unificado profundo", a próxima evolução da série Janus, ou alguma outra arquitetura mais não convencional.
Claro, isso é apenas especulação dele e deve ser encarado com cautela. Mas uma coisa é certa: a DeepSeek vem investindo em soluções multimodais há muito tempo, talvez apenas esperando o momento certo. E ao colocar pontos de entrada rápidos e especializados à disposição dos usuários, há, na verdade, uma direção mais promissora:

A DeepSeek começou a implementar a divisão de produtos em níveis.
Desde sua popularidade explosiva no início do ano passado, a lógica de produto da DeepSeek tem sido altamente "anticomercial" — preços baixos de API, interface web totalmente gratuita e diferenciação mínima em funcionalidade. Essa estratégia realmente funcionou. A ascensão da DeepSeek no início deste ano agitou toda a indústria de IA.
No entanto, surgem problemas: manter esse modelo operacional "totalmente gratuito, sem níveis de detalhamento" a longo prazo não é comercialmente sustentável.
Agora, a DeepSeek está tornando os "modelos mais robustos" e os "modelos mais básicos" dois pontos de entrada separados. O modo especialista é gratuito atualmente, mas, uma vez que essa arquitetura esteja construída, desenvolver um sistema pago sobre ela não será mais um problema técnico.

Teortaxes também mencionou um detalhe nos comentários: o limite de upload de arquivos é temporário; a DeepSeek está integrando o sistema para que os usuários possam posteriormente pagar por um "modo especialista" mais robusto. Considerando tudo isso, forma-se um caminho preparatório bastante completo.
Primeiro, uma implementação gradual de níveis de acesso → permitindo que os usuários percebam as diferenças → integrando recursos multimodais e de arquivos → desbloqueando modos visuais → preços mais vantajosos baseados em modos de acesso. Claro, isso é apenas uma especulação minha, e ficarei feliz em estar errado, já que a DeepSeek nunca segue as regras.
É verdade que o DeepSeek recebeu muitos rótulos — idealismo tecnológico, anticomercialismo e IA para as massas. Mas os custos de inferência das GPUs, as contas de luz dos servidores e assim por diante são reais e tangíveis todos os meses. Não importa quão substanciais sejam os lucros quantitativos da Magic Cube, é difícil preencher a lacuna de um serviço global de IA indefinidamente gratuito apenas vendendo APIs.
O DeepSeek abalou toda a comunidade de IA, mas a realidade acabará por abalar também o DeepSeek.
#Siga a conta oficial do iFanr no WeChat: iFanr (ID do WeChat: ifanr), onde você encontrará conteúdo ainda mais interessante o mais breve possível.

