Após experimentar o Marvis Assistant da Tencent, percebi que a forma definitiva de IA pessoal é o sistema operacional.

Em 1995, a Microsoft realizou internamente uma experiência bastante utópica.

Eles achavam que o sistema Windows da época era muito complicado de usar, então queriam transformar a área de trabalho do computador em uma espécie de "sala" que as pessoas comuns pudessem entender. Se você quiser digitar, clica no laptop sobre a mesa; se quiser ver as horas, clica no relógio na parede, sem precisar pensar nesses caminhos de operação pouco intuitivos.

Este produto chamava-se Microsoft Bob, mas foi descontinuado pouco tempo depois do seu lançamento. Os motivos foram variados, mas, fundamentalmente, ele não conseguia penetrar nas camadas mais profundas do sistema. Enquanto as necessidades dos usuários fossem minimamente complexas, ele se mostrava incapaz de atendê-las.

Trinta anos depois, muitos assistentes de IA ainda não se livraram completamente desse dilema.

Recentemente, experimentei a nova assistente de IA da Tencent, Marvis, e finalmente notei algumas diferenças.

Enquanto outros discutem sobre quem é o chatbot de IA, a Marvis pretende transformar o computador inteiro em um parceiro que você pode comandar à vontade. Seu posicionamento oficial é bastante formal: "Um assistente pessoal de IA no nível do sistema operacional" (site: marvis.qq.com).

No entanto, quando soube que o projeto era apoiado pela equipe que trabalhou na App Store por 14 anos, não fiquei surpreso: essa experiência de trabalho árduo no ecossistema subjacente de PCs e dispositivos móveis significa que eles não apenas entendem de IA, mas também entendem de dispositivos e sistemas.

Atualmente, o Marvis está disponível para PCs com Windows e celulares Android, com versões para iOS e macOS em desenvolvimento. A APPSO também preparou alguns códigos de convite gratuitos na seção de comentários, então aproveite!

Seis agentes e uma equipe privada de IA de prontidão.

O processo de instalação não é complicado, mas requer algumas configurações de dispositivo. Os requisitos mínimos para Windows são um processador de 8 núcleos, 16 GB de RAM e um SSD. Além disso, de acordo com fontes oficiais, a compatibilidade com processadores de 6 núcleos será adicionada gradualmente no futuro.

Muitos produtos de agentes no mercado exigem que os usuários criem seus próprios fluxos de trabalho e instalem plugins, enquanto o Marvis está pronto para uso imediato, com seis agentes que podem ser configurados sem nenhuma configuração adicional, tornando-o muito fácil de usar para usuários comuns. Ao acessar a interface, seis agentes já estão prontos para operar 24 horas por dia, 7 dias por semana.

Cada um dos seis agentes tem sua própria estação de trabalho. Quando não estão com uma tarefa atribuída, alguns estão cochilando, outros estão circulando pelo escritório, alguns estão se exercitando, alguns estão tomando café e alguns até estão indo ao banheiro. Assim que você der uma instrução, a tarefa será dividida e atribuída ao membro correspondente.

Esta é uma equipe com uma clara divisão de trabalho: o Gerente de Projeto é responsável por entender suas necessidades, detalhar as tarefas e atribuí-las a níveis inferiores; o Agente de Arquivos lida com a busca, leitura e conversão de formatos de arquivos; o Agente de Computadores é especializado em configuração de sistemas, verificação de hardware e ajuste do modo noturno; o Agente de Aplicativos é responsável por executar operações em diversos aplicativos de software, como verificar passagens aéreas ou comparar preços em plataformas de comércio eletrônico; o Agente de Busca é responsável por localizar rapidamente respostas em recursos públicos e fornecer referências importantes; e, por fim, há um Agente de Navegador, posicionado como especialista em interação com a web, responsável pela interação com a web e pela extração de dados.

Quando a sequência de missões é longa, assistir a essas animações pode ser bem interessante.

O mais interessante é que esses agentes podem trabalhar em paralelo. Por exemplo, eu poderia primeiro apresentar uma solicitação: "Meu computador está inicializando muito lentamente. Você pode verificar quais programas de inicialização são desnecessários e desativá-los?"

Note que o registro de atividades também exibe o consumo de tokens. A cota diária gratuita é de 20 milhões de tokens, o que é suficiente.

Os resultados mostraram que o sistema forneceu a cada programa uma explicação amigável ao usuário, sugerindo quais softwares de terceiros poderiam ser mantidos, conforme necessário. E, o mais importante, para operações que envolviam alterações na configuração principal, o sistema confirmava proativamente com o usuário antes da execução. Esse mecanismo, em que a "IA não age por conta própria", é extremamente confiável.

Depois de usar um computador por um tempo, você inevitavelmente encontrará alguns probleminhas irritantes e recorrentes. "Verifique a saúde da bateria." "Minha velocidade de internet parece mais lenta; você poderia testar meu upload, download e latência?" "Quero jogar um jogo novo; você poderia verificar a configuração do meu hardware e compará-la com os requisitos mínimos para ver onde estou pecando?"

Antes, quando essas coisas aconteciam, eu tinha que ir ao Menu Iniciar para encontrar as configurações ou procurar tutoriais online. Agora, posso dizer apenas uma frase.

O Marvis integra-se profundamente com as informações do sistema e o acesso à configuração. Ele permite visualizar parâmetros de hardware e modificar diretamente as configurações do sistema. Em vez de simplesmente abrir o "Painel de Controle" e deixar você procurar as informações por conta própria, ele realiza o trabalho diretamente. Para quem não está familiarizado com configurações de computador, essa é a experiência mais intuitiva.

Por exemplo, se você quiser desativar os anúncios na tela de bloqueio do Windows, sabe como essa opção se chama nas configurações? Chama-se "Desativar o Spotlight do Windows". Quantos usuários sabem que esse termo se refere a desativar anúncios?

Mas Marvis consegue desligá-lo com uma única frase.

A era dos arquivos locais abre caminho para a Inteligência Artificial.

Para testar suas capacidades, desenterrei algo que me incomodava há muito tempo: uma captura de tela que baixei de um grupo há dois meses. Eu só me lembrava que o conteúdo era sobre "Black Myth: Wukong", mas havia esquecido completamente o nome do arquivo.

Digitei: "Você poderia me ajudar a encontrar algumas imagens ou capturas de tela de Black Myth: Wukong? Isso foi há cerca de um mês."

Para ser sincero, eu não tinha grandes expectativas.

Após Marvis aceitar o pedido, ele primeiro seguiu as instruções do Skill para filtrar 1.000 fotos por palavras-chave no nome do arquivo e intervalo de tempo, depois usou Python para filtrar rapidamente todo o arquivo de resultados e finalmente encontrou 8 imagens candidatas.

A primeira é exatamente a que estou procurando.

Além disso, seu escopo de busca é extremamente amplo: nomes de arquivos, conteúdo de documentos, cenas em imagens e texto em capturas de tela — abrange tudo. Mesmo com descrições vagas, ainda consegue encontrar os resultados. Essa capacidade é, de fato, muito superior à busca integrada do Windows.

É claro que algumas pessoas podem se preocupar com a privacidade ao ouvirem falar em "varredura de imagens". Você pode definir o intervalo de varredura manualmente no primeiro uso. Se encontrar conteúdo que não deseja que seja indexado no mapa gerado, basta clicar com o botão direito e bloqueá-lo. Além disso, o próprio modelo de borda possui recursos básicos de filtragem; não se trata de uma varredura indiscriminada.

Além de localizar arquivos, o Marvis também consegue realizar análises e compreensões aprofundadas de diversos tipos de arquivos, como documentos locais e planilhas, oferecendo suporte à otimização de conteúdo, geração de gráficos, aprimoramento de textos e conversão de formatos, tornando muito mais fáceis tarefas que antes eram demoradas e trabalhosas.

Por exemplo, se você baixou um lote de artigos acadêmicos e está sem saber por onde começar, basta perguntar à Marvis: "Dê uma olhada nesses PDFs e me diga a questão de pesquisa, a metodologia e as principais conclusões de cada um." Em poucos minutos, você saberá quais artigos valem a pena ler em detalhes e quais pode deixar de lado por enquanto, sem precisar folhear os resumos um por um.

Por exemplo, depois de ler "O Problema dos Três Corpos", eu tinha feito várias páginas de anotações e estava prestes a compartilhá-las em sala de aula. Organizar manualmente o esboço, selecionar o conteúdo e aplicar os modelos de PowerPoint levaria pelo menos uma ou duas horas.

No entanto, se você pedir ao Marvis para gerar um PPT com base em suas anotações de leitura, ele poderá entender a lógica e a estrutura das anotações e gerar o PPT diretamente, sem a necessidade de copiar e colar manualmente e, em seguida, aplicar um modelo.

Use seu celular para controlar seu computador e trabalhe a qualquer hora e em qualquer lugar.

Controlar um computador remotamente com seu celular é uma experiência multiplataforma muito prática. Baixe o cliente para Windows no site oficial, instale o aplicativo Marvis no seu celular e faça login usando a mesma conta do WeChat ou QQ para conectar os dois dispositivos diretamente.

Especificamente, assim que o aplicativo móvel se conecta ao computador, os usuários podem visualizar a área de trabalho do computador em seus telefones em tempo real e controlá-la diretamente com a tela sensível ao toque. Mesmo que o computador esteja bloqueado, o telefone ainda pode assumir o controle, eliminando a necessidade de o computador permanecer desbloqueado.

Por exemplo, se eu estiver na rua e um amigo me falar sobre um novo jogo chamado "Roco Kingdom: World" que foi lançado recentemente, posso pegar meu celular e digitar: "Instale 'Roco Kingdom: World' no meu computador" e posso jogar assim que chegar em casa.

Conectar-se ao ClawBot no WeChat também não é problema; você pode iniciar uma conversa após fazer login, escaneando o código QR com o WeChat.

Mas acho que o cenário mais prático é a resolução remota de problemas de computador para familiares idosos. Se meus pais dizem "O QQ não abre", antes eu tinha que tentar adivinhar por telefone ou ir até a casa deles para resolver o problema. Agora posso acessar diretamente a área de trabalho deles e ver onde está o problema num instante. O pré-requisito é que o aplicativo Marvis para celular consiga se conectar ao aplicativo Marvis nos computadores dos seus pais; o aplicativo para celular deve suportar a conexão com vários PCs.

Se o computador perder a conexão com a internet, o aplicativo móvel alternará automaticamente para o modo de nuvem Marvis, permitindo acesso independente aos recursos da nuvem, e a maioria das tarefas continuará funcionando. Ele também possui um recurso exclusivo: o controle direto de aplicativos móveis a partir do computador. Aplicativos como Tonghuashun e FlightAware já estão integrados a ele, graças aos anos de experiência da equipe da App Store no desenvolvimento de mecanismos multiplataforma. Atualmente, a App Store oferece suporte a plataformas móveis, PCs e veículos, demonstrando ampla experiência em desenvolvimento multiplataforma.

Assim como outros agentes de desktop, o Marvis também oferece suporte a tarefas automatizadas personalizadas.

Por exemplo, você pode configurar um lembrete de "Preço Médio de Imóveis Usados ​​em Shenzhen Houde Pinyuan", preencher a descrição da tarefa como "Consultar o preço médio mais recente de imóveis usados ​​e notificar os usuários" e especificar o horário de execução como 10h da manhã de todas as segundas-feiras. Depois disso, você não precisa fazer mais nada. A tarefa será executada automaticamente no horário marcado e os resultados serão enviados diretamente.

Outro recurso que vale a pena mencionar é a personalização e extensão de habilidades. O Marvis permite a instalação de pacotes de habilidades personalizados com um único clique, oferece diversas habilidades de terceiros e, claro, você também pode importar seus arquivos de habilidades mais usados ​​e modificá-los para melhor se adequarem ao seu fluxo de trabalho pessoal.

Usuários com necessidades específicas do setor, como criação de conteúdo, investimento financeiro, pesquisa acadêmica, etc., podem carregar a base de conhecimento e a lógica operacional correspondentes por conta própria, sem depender de atualizações oficiais.

Por fim, todos os agentes que priorizam a disponibilidade em tempo real não podem evitar a questão mais crítica: a segurança.

O Marvis oferece dois modos: Modo Eficiência e Modo Privacidade.

Ao ativar o "Modo de Privacidade" nas configurações, o Marvis pode carregar modelos locais no lado do cliente. Tudo, desde a recuperação, análise e reconhecimento de documentos e imagens, é executado localmente; os arquivos nunca saem do seu computador e o sistema pode até ser usado offline. A afirmação oficial de que "os dados não saem do domínio" se concretiza no momento em que o cabo de rede é desconectado.

No entanto, o limite para experimentar o "modo de privacidade" é relativamente alto, exigindo um processador com mais de 16 núcleos, 32 GB de RAM, 16 GB de memória de vídeo como mínimo e 35 GB de espaço livre no SSD.

Portanto, para uso diário, basta alternar para o "Modo Eficiência". O entendimento e o planejamento são gerenciados pelo modelo de grande porte baseado em nuvem (HunYuan e DeepSeek V4), enquanto a execução é feita localmente, resultando em velocidades mais rápidas. Alterne entre os dois modos conforme necessário.

Que os PCs realmente comecem a "entender" as pessoas.

A forma como usamos os computadores hoje em dia ainda se baseia essencialmente na lógica dos anos 80: uma necessidade corresponde a um programa de software, e é preciso encontrá-lo, abri-lo e aprender suas regras para concluir a tarefa. Ao longo dos últimos quarenta anos, surgiram mais softwares e as configurações se tornaram mais complexas, mas essa lógica não mudou, e a distância entre os usuários comuns e os computadores não diminuiu de fato.

A lógica de Marvis é inversa: primeiro entender o que está no computador, depois decidir o que fazer por você.

Veja o meu avô, por exemplo. Ele usa computadores há anos e ainda não sabe onde fica o "Painel de Controle". Mas ele sabe que o computador demora a iniciar e quer encontrar uma foto antiga. Antes, ele ligava para os filhos pedindo ajuda; agora, mesmo que não consiga digitar, ele pode simplesmente dizer o que precisa no Clawbot do WeChat ou no aplicativo Mavis do celular, e o computador faz tudo por ele.

A busca de arquivos, as configurações do sistema, o controle entre dispositivos, as tarefas automáticas, o modo de privacidade e as extensões de habilidades podem parecer funções diferentes, mas todas apontam para a mesma direção: a IA pessoal não deve ser apenas um portal de perguntas e respostas, mas sim uma camada de agendamento de tarefas dentro do dispositivo.

Além disso, acho que Marvis tem um bom senso estético. Detalhes como a animação do escritório virtual e a exibição do progresso das tarefas fazem com que pareça menos uma ferramenta de IA fria e impessoal e mais um estúdio pequeno, organizado e funcional.

É especialmente adequado para diversos tipos de usuários: usuários locais intensivos com muitos arquivos desorganizados; profissionais das áreas de finanças, direito e saúde que valorizam o isolamento de dados; e entusiastas da eficiência que gostam de personalizar fluxos de trabalho. Ao contrário de sistemas como "shrimp" e "horse", que precisam ser "cultivados" para serem usados ​​com eficácia, o Agente integrado e os comandos em linguagem natural do Marvis são suficientes para a maioria das operações diárias no computador. Para muitas pessoas que têm receio da IA ​​e não sabem como usá-la, o Marvis é mais igualitário, acessível e pronto para uso imediato.

No futuro, a IA pessoal se tornará tão natural quanto pesquisar e tirar capturas de tela, integrando-se ao sistema operacional. Trinta anos atrás, Bob, da Microsoft, tentou tornar os computadores mais fáceis de usar; trinta anos depois, Marvis busca fazer com que os computadores realmente entendam os usuários.

O sucesso da Marvis é atribuído aos seus quatorze anos de experiência no desenvolvimento de ecossistemas de lojas de aplicativos e quatro anos de experiência em tecnologia multiplataforma e multissistema. Sua enorme base de usuários permite que ela compreenda melhor as necessidades e os padrões de uso dos usuários em diferentes dispositivos. Esse tipo de experiência é difícil de ser replicado a curto prazo por empresas focadas exclusivamente em IA — elas podem treinar rapidamente um modelo mais inteligente, mas não conseguem estabelecer controle sobre a infraestrutura de PCs e o ecossistema móvel com a mesma rapidez.

Assim, um exemplo verdadeiramente utilizável de um assistente de IA em nível de sistema, impulsionado por linguagem natural, finalmente surgiu no ecossistema de língua chinesa.

O foco da chamada IA ​​pessoal nunca foi apenas na IA, mas também no indivíduo. Marvis finalmente nos mostra o poder que surge quando a tecnologia é escolhida para acompanhar cada necessidade específica, influenciando e remodelando o mundo de forma sutil.

Este é o momento em que a IA pessoal começa a se tornar verdadeiramente útil.

#Siga a conta oficial do iFanr no WeChat: iFanr (ID do WeChat: ifanr), onde você encontrará conteúdo ainda mais interessante o mais breve possível.