Este novo aplicativo mágico é um AI Ron Burgundy para o seu telefone

o aplicativo leitor ElevenLabs em um iPhone
OnzeLabs

Mesmo enquanto a OpenAI atrasa seu recurso de conversão de texto em fala para ChatGPT, a startup de áudio AI ElevenLabs lançou seu aplicativo Reader para iOS na quarta-feira, um modelo que promete ler em voz alta as palavras de praticamente qualquer fonte de conteúdo, incluindo artigos de notícias, PDFs, ePubs e boletins informativos. – até mesmo colar links da web.

Os usuários poderão selecionar em uma biblioteca de “ vozes humanas de alta qualidade ” para ouvir e controlar a rapidez com que a voz modulada por IA lê o texto de volta para eles. O aplicativo Reader está disponível no iPhone, iPad e iPod Touch (qualquer coisa que execute iOS e iPadOS 15 ou posterior) para usuários nos EUA, Reino Unido e Canadá começarem. A empresa planeja lançar o software na UE “ dentro de algumas semanas ” por volta de 11 de julho. Uma versão Android está atualmente em desenvolvimento e a empresa está oferecendo uma lista de espera para usuários interessados.

A ElevenLabs já está considerando atualizações para o serviço, incluindo reprodução offline, acesso a feeds RSS, resumo de IA e a capacidade de compartilhar trechos com amigos. A empresa também pretende expandir os idiomas falados para todos os 29 idiomas suportados pelo seu modelo multilíngue.

“Criar os melhores modelos de áudio de IA não é suficiente”, diz o anúncio da ElevenLabs na quarta-feira. “Os criadores precisam de ferramentas através das quais possam criar. E os consumidores precisam de interfaces através das quais possam consumir áudio.” A empresa eventualmente começará a cobrar pelo serviço (dado que seu site afirma que os primeiros três meses de uso são gratuitos), embora ainda não haja informações sobre quanto essa assinatura poderia custar.

Os modelos de voz gerados por IA da ElevenLabs são treinados em dados de domínio público, dados adquiridos em acordos com parceiros comerciais e dados disponíveis publicamente, de acordo com um relatório anterior de Tendências Digitais . Com eles, a empresa consegue oferecer uma variedade de serviços, desde dublagem e tradução automática até clonagem de voz e narração automática — até mesmo gerando vozes de IA para NPCs construídas no Unreal Engine.