Lançar meu primeiro podcast gerado por IA do NotebookLM me ensinou uma coisa que você deve evitar.

Tudo começou como uma brincadeira. "E se eu criasse um podcast onde eu conversasse com bots de inteligência artificial e fingisse estar interessado no que eles têm a dizer?", perguntei a um amigo meu.

Isso foi há alguns meses, antes de eu descobrir que o Google tem uma ferramenta de IA chamada NotebookLM que (na maior parte do tempo) permite conversar com dois apresentadores com voz humana em tempo real. Conhecido como modo interativo, você pode entrar no podcast e fazer uma pergunta a qualquer momento . Os bots pausarão, reconhecerão você como um "ouvinte" e comentarão o que você disse.

Decidi testar o NotebookLM para criar um podcast de verdade, lançando-o pelo Spotify for Creators e promovendo-o nas minhas redes sociais. Aprendi muito durante o processo, mas o resultado final revelou bastante sobre o que é preciso para fazer um podcast. A principal coisa a evitar? Criar um podcast com som robótico e sem alma. Aqui está como eu fiz tudo funcionar.

Gravação em modo interativo

Inicialmente, não me dei conta, mas o NotebookLM não grava as interações com os robôs anfitriões. Como o aplicativo (disponível para dispositivos móveis, mas também funciona em navegadores) está em versão beta, não há muita documentação ou instruções de uso. Em vez de usar o NotebookLM para gravar a conversa, utilizei o aplicativo Gravador de Voz do iPhone. Embora um podcaster profissional criticasse a baixa qualidade, foi rápido e fácil.

Para começar, você precisa escolher uma fonte para a discussão. Decidi criar o "Origins with John Brandon" como um podcast um tanto irônico sobre a origem de coisas comuns. Meu primeiro episódio seria sobre como o plástico-bolha surgiu, então primeiro encontrei vários artigos sobre o assunto e os carreguei no NotebookLM. Esses são os dados de treinamento que os "apresentadores" usam, já que normalmente eles só conversam entre si, mas eu não queria que eles simplesmente começassem a divagar sobre o assunto. Em vez disso, interrompi imediatamente e me apresentei como o verdadeiro apresentador.

Como você pode imaginar, não era exatamente assim que o Google pretendia que funcionasse. Os bots fingiram surpresa e até comentaram que eu não era o apresentador (mencionando meu nome) e insistiram que eram os apresentadores humanos de verdade. Fiz algumas perguntas sobre plástico-bolha, mas eventualmente o bate-papo descambou para uma discussão sobre consciência e percepção da IA. Achei esse um tópico muito mais interessante, então meu podcast assumiu um tom mais satírico, semelhante ao do The Onion. Em outras palavras, embora devesse ser sobre plástico-bolha, acabou se tornando sobre IA.

Fiquei satisfeito com os resultados, mesmo que a qualidade da gravação não fosse excepcional. Imaginei como teria funcionado melhor se eu tivesse gravado a discussão ao vivo com um gravador digital separado, mas eu não estava tentando ganhar nenhum prêmio de podcast. Eu queria publicar meu primeiro episódio, e o NoteBookLM me impressionou, pelo menos, em termos de produzir uma discussão coerente. Também foi legal como os bots responderam ao meu comentário em tempo real.

Criação dos recursos

É claro que um podcast é mais do que apenas um arquivo de áudio que você publica. Ele também envolve arte, música de abertura, narração e outros elementos.

Assim que gravei o primeiro episódio, recorri ao Google Gemini para criar um ícone quadrado para o programa. Todo podcast tem um ícone que ajuda as pessoas a identificá-lo em aplicativos como o Apple Podcasts. Meu pedido era simples: criar uma imagem quadrada para um podcast chamado Origins with John Brandon . Também forneci uma imagem minha gerada por IA. Na primeira tentativa, o Gemini criou um ícone excepcionalmente bom, como algo que um profissional poderia ter feito. No entanto, não gostei da ideia de associar minha imagem a ele, então pedi ao bot para tentar novamente. O resultado ficou um pouco brega, mas aceitável.

Estava a todo vapor. Em seguida, usei o Suno para criar a música de abertura do meu novo podcast. Essa ferramenta de geração de som por IA normalmente usa instruções como: "Crie uma nova música que soe como uma mistura de Coldplay com Nirvana ". Mas a minha instrução era mais no sentido de pedir uma música de abertura para podcast com sintetizadores e bateria para adicionar energia e empolgação antes de começarmos a falar.

Assim como na minha primeira tentativa com Gemini, Suno criou uma música de abertura que soou perfeita de imediato. Não precisei testar mais nenhum texto, mas queria aprimorar a introdução com uma narração. Recorri ao Speechify, que transforma qualquer texto fornecido em uma narração. Em seguida, usei o ChatGPT para combinar a música de abertura com a narração, criando uma sobreposição. Para ser sincero, eu não sabia que o ChatGPT permitia criar arquivos de áudio.

Em poucos minutos, eu tinha uma música de introdução como vinheta com uma narração. Até ajustei a transição entre a música de introdução e o início da narração, e depois a fiz desaparecer gradualmente. Pedi ao ChatGPT para adicionar o áudio do podcast para o meu primeiro episódio e ele gerou um arquivo de áudio final, que eu enviei para o Spotify.

Uma coisa a evitar

Fiquei impressionado com os resultados e com a forma como tudo se encaixou , mas diria que dependi demais da IA ​​para o meu novo podcast. O título ficou um pouco artificial e sem alma, principalmente porque a imagem que usei foi gerada por IA. O áudio do NotebookLM em si tem um toque mais humano e autêntico, principalmente porque converso com os bots, mas o episódio acabou soando como uma pessoa falando com chatbots, o que é uma receita para o desastre. As pessoas ouvem podcasts para aprender algo novo, mas também porque as pessoas que falam são acessíveis, interessantes e reais. Pelo menos isso me motivou a fazer um podcast de verdade, sem bots envolvidos, sobre o mesmo tema.

Minha principal lição foi relacionada ao NotebookLM. É uma boa ferramenta experimental e me ajudou a descobrir como criar e lançar um podcast. No entanto, não passa de um experimento de laboratório. Os "apresentadores" repetem o mesmo áudio repetitivo várias vezes, principalmente quando eu entrava na conversa. Depois de ouvi-los dizer "ah, temos um ouvinte que quer comentar" algumas vezes, você começa a suspeitar que tudo é uma farsa gerada por computador. Eles usam os mesmos tiques vocais e maneirismos sonoros peculiares repetidamente, a ponto de se tornar quase inaudível e irritante.

Resumindo, é chato. O podcast não é algo que eu gostaria de manter online e, principalmente, revela que ter bots conversando dessa forma não vai prender a atenção de ninguém. É quase como assistir dois computadores jogando videogame. O que se deve evitar em qualquer podcast é depender tanto de IA a ponto de remover toda a humanidade da equação.

Na evolução da IA, talvez precisemos decidir se esse não é um bom resultado.

O post Lançar meu primeiro podcast gerado por IA do NotebookLM me ensinou uma coisa que você deve evitar apareceu primeiro em Digital Trends .