LALAL.AI tem um novo algoritmo de Cassiopeia que vai explodir sua mente

Separar diferentes partes de uma música sem ter o radical real é difícil, mas existe uma ferramenta chamada LALAL.AI que é perfeitamente capaz de lidar com o processo. Ele divide as músicas entre vocais e instrumentais com o mínimo de esforço e nenhuma habilidade de engenharia de áudio necessária.

E embora LALAL.AI já fosse bastante sólido, recentemente deu um grande passo em frente graças à introdução de sua nova arquitetura de rede neural chamada Cassiopeia. Ele pega o Rocknet, a rede neural da geração anterior do serviço, e o torna melhor em quase todos os sentidos.

O que a Cassiopeia do LALAL.AI traz para a mesa?

Simplificando: Cassiopeia fornece resultados de divisão aprimorados com significativamente menos artefatos de áudio. O propósito do LALAL.AI é puxar e separar vocais e instrumentos de uma faixa, então ter um recurso que pode melhorar a capacidade é incrível.

Com a nova rede neural, LALAL.AI levará um pouco mais de tempo para gerar as faixas divididas, mas isso é uma pequena compensação para a grande melhoria na qualidade.

Então, o que é diferente? Basicamente, o Rocknet, que ainda pode ser usado em LALAL.AI, considera apenas o componente de amplitude enquanto ignora o componente de fase. A rede neural Cassiopeia mais recente considera o componente de fase do sinal de entrada e gera a fase para o sinal de saída. Por meio desse processo, as faixas divididas conterão menos artefatos de áudio.

Para colocar tudo isso em termos simples, o novo algoritmo analisa mais profundamente a música para criar uma divisão melhor.

Para provar que seu serviço funciona de forma mais eficaz, a LALAL.AI o testou com o Spleeter, OpenUnmix e Extended Unmix. Ele também comparou os resultados com sua própria rede neural Rocknet. Você pode ver os resultados completos do teste no blog do LALAL.AI , mas basicamente, Cassiopeia superou todos os outros na maioria das categorias em vários gêneros selecionados aleatoriamente, como jazz, soft rock, pop e assim por diante.

Curiosamente, Rocknet ainda tem um desempenho melhor no canal vocal. Cassiopeia tem um pouco mais de infiltração dos instrumentais para os vocais. No entanto, LALAL.AI ressaltou que os números nem sempre contam toda a história e, às vezes, a qualidade do som pode ser diferente do que os testes mostram.

Aqui está o que a empresa disse sobre o assunto:

Embora Cassiopeia fique atrás do Rocknet em termos de métricas formais para vocais, tanto a parte instrumental e especialmente a haste vocal separada por Cassiopeia soam muito mais naturais e suaves que o Rocknet, sem os artefatos de som metálico que são tão característicos das outras soluções.

Testei os resultados por mim mesmo e descobri que a rede neural Cassiopeia resultou em divisões de áudio mais limpas. A trilha vocal quase não tinha infiltração perceptível dos instrumentais, que é exatamente o que você quer de uma ferramenta como o LALAL.AI

Com isso dito, os resultados do Rocknet ainda foram muito bons e foram absolutamente utilizáveis ​​para isolar a faixa vocal dos instrumentais.

Como você experimenta o novo recurso Cassiopeia do LALAL.AI?

Se você quiser dar uma chance à nova rede neural, pode ir para LALAL.AI e verificar se a caixa Usar o novo algoritmo está marcada perto da parte inferior da tela ao fazer upload de uma música.

Você também pode escolher o nível de agressão usado pelo algoritmo para dividir as faixas. Normal é bom para a maioria das faixas, mas você pode experimentar com Mild e Aggressive para ver o que cria uma faixa melhor para você.