O assistente móvel Doubao causou sensação no exterior, com estrangeiros afirmando: “Este é o primeiro smartphone verdadeiramente útil”.

Surpreendentemente, na semana seguinte ao lançamento da série Mate 80 da Huawei e do primeiro celular dobrável da Samsung, o dispositivo mais popular foi o ZTE nubia M153, que apresenta uma versão prévia da tecnologia de assistente móvel Doubao.
Não só esgotaram imediatamente após o lançamento, como o primeiro lote de protótipos de engenharia também foi revendido em plataformas de segunda mão por várias centenas de yuans a mais. Comparado ao preço oficial de 3499 yuans, a procura do mercado foi de facto elevada.
Apesar da equipe oficial do Doubao Mobile Assistant enfatizar repetidamente que a versão atual de pré-visualização técnica não se destina ao consumidor comum, ela se posiciona mais como um campo de testes para demonstração de tecnologia e exploração do ecossistema, atraindo desenvolvedores e entusiastas de tecnologia para participar e experimentá-la.

Mas isso não conseguiu diminuir o entusiasmo do público em experimentá-lo. Além de operações básicas como pedir comida para viagem e postar nas redes sociais, alguns internautas chegaram a usá-lo para enviar 30 currículos em 10 minutos.
No entanto, surgiu uma controvérsia, com o WeChat, o Taobao e outros aplicativos começando a excluir o Doubao Mobile Assistant, configurando mecanismos de "detecção de anomalias" e outras barreiras.
A resposta oficial também foi ajustar algumas das capacidades da IA para operar telefones celulares. A declaração oficial indica que o objetivo é "promover a formação de regras mais claras e previsíveis" e evitar uma negação generalizada do direito dos usuários de usar a IA de forma razoável.
Luo Yonghao publicou uma mensagem de apoio, afirmando que esta é uma revolução tecnológica imparável e que as pessoas se lembrarão deste dia histórico. A Honor expressou suas boas-vindas, enquanto a Meizu manifestou sua expectativa de uma cooperação aprofundada para criar um ecossistema ainda mais próspero.

Após ganhar popularidade na China, o Doubao Mobile Assistant também se tornou um sucesso no exterior. Na plataforma X, muitos estrangeiros o comentavam freneticamente, e alguns até o chamaram de "outro momento DeepSeek".
Internautas estrangeiros: O primeiro smartphone verdadeiramente significativo
Essa avaliação não foi feita de forma leviana.
Taylor Ogan, CEO da Snow Bull Capital, publicou uma longa resenha na plataforma, com sua empolgação praticamente transbordando da tela.
Sua avaliação foi direta: este é o primeiro smartphone verdadeiramente relevante do mundo.

Com a ajuda do Doubao Mobile Assistant, a IA pode controlar completamente o telefone — ela consegue "entender" a interface, selecionar ou baixar aplicativos, clicar em botões, inserir texto, fazer chamadas e até mesmo executar uma série de tarefas complexas.
Após receber o telefone, ele experimentou vários truques criativos. Por exemplo, ele podia tirar uma foto casual de uma estação de troca de baterias da NIO e perguntar: "O que é isso?", e a IA respondia instantaneamente.

Com uma simples foto da entrada do hotel, o Doubao consegue não só identificar qual hotel é, mas também reservar um quarto de acordo com as necessidades de Ogan e verificar a política para animais de estimação.

Para chegar ao parque em um táxi autônomo, Doubao pode planejar a rota e reservar a viagem no ponto de embarque mais próximo. Ogan só precisa expressar suas intenções verbalmente; Doubao cuida de todo o resto.

Após fazer o pedido de duas bebidas, o drone de entrega levou rapidamente o pedido até um armário próximo.

Caminhando pela rua, Ogan tirou uma foto de uma loja recém-inaugurada e perguntou se era uma marca local. Doubao pôde verificar o registro da empresa e as informações da marca registrada e, então, respondeu com convicção: "Sim".

A inteligência artificial faz todo o trabalho, enquanto os humanos apenas relaxam.
Após uma série de manobras bem-sucedidas, os internautas estrangeiros ficaram extremamente surpresos.

Uma rápida olhada na seção de comentários revela um mar de curtidas. Um internauta comentou: "Neste momento, o sistema operacional se tornou um gerente e o celular se tornou um executor, não mais apenas uma ferramenta." Outro confessou inesperadamente: "Eu já gostava de doubao (um tipo de pãozinho cozido no vapor), mas agora gosto ainda mais."
Alguns internautas chegaram ao ponto de se autodenominarem "Wow Bro":
Isso é algo de outro nível. Já vi coisas semelhantes no âmbito empresarial, onde um agente controla seu PC e executa tarefas, mas é realmente interessante ter essa tecnologia em um celular. Imagine o que acontecerá quando o Google começar a fazer isso nos dispositivos Pixel e em praticamente todos os celulares Android…

Pixel pensou consigo mesma: "Tem algo errado. Por que tenho a sensação de que alguém está clicando em mim?"
É claro que também houve vozes discordantes. Uma pessoa perguntou: "Mas será que é realmente inteligente? Esse modelo pode ser executado localmente no dispositivo?" Taylor Ogan respondeu: "É incrivelmente inteligente. Você pode optar por executá-lo no dispositivo ou na nuvem."

A discussão foi igualmente acalorada no Reddit.
Um internauta comentou: "Desde que essas funções sejam locais ao dispositivo (sem usar serviços em nuvem) e seu uso seja opcional, eu apoio isso." Outro internauta apontou com perspicácia o verdadeiro significado da IA: "É isso que a IA deveria fazer: economizar tempo para as pessoas, não tentar eliminar o valor individual."

Para ser justo, após o lançamento do Assistente Móvel Doubao, as formas como os internautas compartilhavam conteúdo na plataforma X tornaram-se cada vez mais inusitadas. Alguns usavam o Doubao para pedir café, enquanto outros faziam com que a IA do Doubao operasse telefones Android, simulando gestos humanos com as mãos em páginas, visando a automação completa.
Outro internauta usou o assistente virtual do Doubao para pedir um coco. Como o pedido não atingiu o valor mínimo, o Doubao gentilmente ajudou o blogueiro a escolher um pacote de sal de mesa de 1,99 yuan para atingir o valor mínimo.

Em sua análise anterior do Doubao Mobile Assistant, a APPSO mencionou que sua impressão mais imediata foi que o telefone havia ficado "mais fino" e que havia "simplificado" as funcionalidades de vários aplicativos, tornando a interação mais natural, intuitiva e eficiente.
A questão é: como isso é feito? E qual a diferença para o agente de "uso do telefone"?
Após usar o Doubao Mobile Assistant por uma semana, a APPSO também descobriu mais detalhes técnicos sobre ele.
Descobri os segredos de como usar o Doubao Mobile Assistant para controlar seu telefone.
Antes do lançamento do Doubao Mobile Assistant, a indústria de telefonia móvel já vinha experimentando com IA+ há algum tempo.
Os fabricantes de hardware para celulares estão tentando eliminar as barreiras entre aplicativos e alcançar o "acesso com um clique" aproveitando os recursos de IA em nível de sistema. Por exemplo, agentes de IA de fabricantes de celulares populares, como Huawei, Xiaomi, Vivo e Honor, demonstraram funções como o envio automático de mensagens e a execução de tarefas complexas em vários cenários.
Embora essas demonstrações difiram ligeiramente em cenários específicos e métodos de implementação, a lógica central permanece a mesma: compreender a intenção do usuário por meio de grandes modelos de IA e combiná-la com operações de usuário simuladas para alcançar a execução automatizada de tarefas em diversos aplicativos.
Parece algo bastante improvável, mas na realidade… bem, ainda há muito espaço para melhorias.

O destino do Doubao Mobile Assistant alimentou ainda mais as discussões online. Mais importante, com base na minha experiência anterior, o Doubao Mobile Assistant realmente eleva a operação do telefone com inteligência artificial a um nível utilizável, não se limitando a alguns cenários, mas sendo capaz de concluir tarefas longas e complexas de forma fluida e natural por meio de uma interface gráfica.
A APPSO descobriu um relatório técnico publicado pela equipe da ByteDance na conhecida plataforma de pré-publicações ArXiv, cujas informações podem explicar os princípios fundamentais por trás do projeto.
Aqui está o link: https://arxiv.org/abs/2509.02544

As funcionalidades da interface gráfica do usuário do Doubao Mobile Assistant provêm do modelo UI-TARS, desenvolvido pela equipe Seed da ByteDance. Ele integra compreensão visual da tela, raciocínio lógico, localização de elementos da interface e operação, e sua versão de código aberto é atualmente o modelo de agente inteligente multimodal de código aberto mais popular.
De acordo com o relatório técnico do UI-TARS 2.0, a força deste modelo reside no fato de não ser uma simples montagem modular, mas sim adotar uma abordagem de aprendizagem de ponta a ponta que integra percepção, raciocínio, ação e memória.

Os dados não mentem; em testes de benchmark de interface gráfica, o UI-TARS-2 apresenta um desempenho notavelmente bom.
- O Online-Mind2Web obteve uma pontuação de 88,2.
- Pontuação OSWorld: 47,5
- O WindowsAgentArena obteve uma pontuação de 50,6.
- Pontuação do AndroidWorld: 73,3
Esses resultados não apenas superam significativamente o modelo da geração anterior, como também ultrapassam modelos de referência robustos, como Claude e OpenAI, em diversos cenários. Em particular, a pontuação de 73,3 no AndroidWorld é mais de 20 pontos superior à do modelo OpenAI CUA-o3, demonstrando forte competitividade.

Em um ambiente de jogos, o UI-TARS-2 alcançou uma pontuação padronizada média de 59,8 em um conjunto de testes de 15 jogos, aproximadamente 60% do desempenho humano. Comparado ao OpenAI CUA e ao Claude Computer Use, o UI-TARS-2 demonstrou melhorias de desempenho de 2,4x e 2,8x, respectivamente.
O que isso significa? Significa que a IA está quase no nível de um jogador humano médio quando se trata de jogos.

No LMGame-Bench, ele ainda consegue competir com os modelos proprietários mais avançados, comprovando ainda mais sua robustez no raciocínio de jogos a longo prazo.
Mais impressionante ainda, o UI-TARS-2 não só consegue lidar com tarefas de interface gráfica, como também expande suas capacidades através do GUI-SDK, integrando-se com recursos de sistema como terminais e ferramentas externas. Ele se mostra competitivo em tarefas de recuperação de informação (BrowseComp 29,6 pontos) e em tarefas de engenharia de software (Terminal Bench 45,3 pontos, SWE-Bench Verified 68,7 pontos).
Um único modelo pode ser usado em qualquer lugar; isso demonstra sua versatilidade.
Vale mencionar que, segundo fontes próximas à equipe do Doubao, o Doubao Mobile Assistant utiliza uma versão proprietária do UI-TARS, que apresenta desempenho superior em comparação com a versão de código aberto e é otimizada especificamente para dispositivos móveis. Isso pode explicar a fluidez da experiência do usuário oferecida pelo Doubao Mobile Assistant.
O Assistente Móvel Doubao realmente possui algumas habilidades notáveis.
Em conclusão: Poderíamos ter mais casos atípicos na indústria de tecnologia.
Como editora que há muito tempo se dedica a produtos tecnológicos, este ano tem sido bastante notável para mim. Em uma indústria que parece querer colocar tudo em um único telefone, dois produtos se destacaram, cada um ultrapassando os limites do design e da interação .
Um exemplo é o iPhone Air. À medida que a série Pro inevitavelmente se aproxima do fim da era de acumulação de recursos, essa obsessão por leveza e finura pode não ter outra utilidade aos olhos dos entusiastas de especificações, podendo até mesmo impedir que as pessoas distingam se trata de uma regressão ou de uma evolução, até que o aparelho seja segurado em suas mãos e se perceba que a leveza em si é uma função.

O Doubao Mobile Assistant, por outro lado, representa o extremo oposto em termos de design de interface do usuário. Ele não exige que você procure por serviços; em vez disso, permite que os serviços venham até você. Ele pode até mesmo revolucionar o paradigma da GUI (Interface Gráfica do Usuário), o que significa que um dia essa tela poderá nem ser necessária.

Um é hardware, o outro é software, mas ambos levam ao mesmo objetivo. O iPhone Air reduziu o volume físico, enquanto o Assistente Móvel Doubao eliminou interações complicadas.
Você perceberá que, quando empresas de IA se envolvem no design de hardware, sua abordagem ao design de interação difere daquela dos fabricantes de hardware tradicionais.
A OpenAI também está trabalhando com Jony Ive, um lendário ex-designer da Apple, para criar hardware com IA. Sam Altman revelou certa vez que esse dispositivo visa redefinir a interação: em vez de um conjunto de aplicativos, a IA servirá como a principal interface e camada operacional.
É claro que a história nos ensina que a implementação de novas tecnologias como essas inevitavelmente enfrentará dificuldades iniciais: adaptação, privacidade, ecossistema… e a interação de interesses entre as diversas partes envolvidas. A "corrida de duas vias" entre tecnologia avançada e aplicação em larga escala levará tempo, mas é uma tendência inevitável.

Andrej Karpathy, cofundador da OpenAI, expressou recentemente suas previsões sobre o futuro da interação:
Na era da profunda colaboração entre humanos e máquinas, produtos com interfaces de usuário (IUs) extremamente complexas (com um grande número de controles deslizantes, interruptores e menus), que não suportam scripts e que são construídos em formatos binários personalizados e opacos estão fadados ao fracasso (ngmi).
No futuro, a IA se tornará cada vez mais hábil em compreender e manipular interfaces gráficas humanas (UI/UX) (como visto em projetos de ponta como o Operator). No entanto, suspeito que produtos que simplesmente esperam que esse futuro se materialize, sem se adaptarem proativamente ao nível atual de desenvolvimento tecnológico, não terão um bom desempenho.
A coragem de ser pioneiro é admirável por si só, e esperamos ver mais pessoas com esse perfil inovador na indústria de tecnologia.
#Siga a conta oficial do iFanr no WeChat: iFanr (ID do WeChat: ifanr), onde você encontrará conteúdo ainda mais interessante o mais breve possível.

