Um rival do ChatGPT poderá em breve controlar sua área de trabalho com voz

A startup de inteligência artificial Anthropic compartilha os holofotes entre os principais nomes do Vale do Silício por dois motivos principais. Primeiro, a empresa foi fundada por ex-alunos da OpenAI que saíram após desenvolver diferenças ideológicas com Sam Altman. Em segundo lugar, a Anthropic afirma adotar uma abordagem mais responsável com seu chatbot de IA – e grandes modelos de linguagem de mesmo nome – Claude , tentando eliminar respostas prejudiciais ou antiéticas.

Mike Krieger, diretor de produtos da Anthropic – e cofundador do Instagram – falou ao Financial Times sobre os planos da empresa para melhorar o “trabalho de conhecimento”, ajudando-os a recuperar algum tempo gasto no “Excel ou Google Docs”.

Uma maneira de conseguir isso seria por meio de sistemas de agente onde a IA da Anthropic será capaz de controlar todo o seu desktop a partir de um conjunto de comandos em linguagem natural. Em teoria, o conceito é semelhante ao modo Operador do ChatGPT, que navega na web para você com base em seus comandos.

Simultaneamente, a Microsoft está apostando emcomandos de voz para controlar seus laptops Windows com a ajuda de sua interface de bate-papo Copilot+.

Bate-papo por voz para controlar seu PC

Krieger prevê que uma maneira de implantar Claude para controlar sua área de trabalho será por voz, pois seria “uma interface de usuário mais natural”. No ano passado, a Anthropic demonstrou seu agente de IA que pode controlar computadores usando comandos escritos .

Pode-se esperar que o controle de voz, eventualmente, seja uma extensão desta funcionalidade existente. Mesmo que não haja um cronograma claro sobre quando – ou confirmação se – o controle do seu PC com recurso de voz se tornará realidade, o Anthropic já tem um modo de voz em desenvolvimento.

O executivo disse que a empresa já está prototipando o controle de voz para Claude. A Anthropic está apostando em parcerias empresariais, em vez de disponibilizar seus produtos imediatamente aos consumidores, para ganhar vantagem sobre rivais como OpenAI, Meta e Google.

“Espero que Claude alcance o maior número de pessoas possível, mas o caminho crítico não é através da adoção pelo consumidor no mercado de massa neste momento”, disse Krieger.

Porém, se a funcionalidade de voz estivesse disponível para os usuários do Claude, um dos lugares mais naturais seria o aplicativo móvel lançado em agosto do ano passado. Por enquanto, o modo de voz de Claude existe na forma do Alexa+ revisado da Amazon, que é alimentado pelos grandes modelos de linguagem de Claude.

Isso provavelmente foi resultado do investimento de US$ 4 bilhões da Amazon na startup. A empresa também pode estar procurando outros parceiros para lançar seus produtos baseados em voz, mas ainda não revelou nenhuma aliança além da Amazon.

Enquanto isso, os rivais OpenAI e Google já possuem funcionalidade de voz proficiente por meio de seus respectivos modos de voz no ChatGPT e Gemini.