Separar diferentes partes de uma música sem ter o radical real é difícil, mas existe uma ferramenta chamada LALAL.AI que é perfeitamente capaz de lidar com o processo. Ele divide as músicas entre vocais e instrumentais com o mínimo de esforço e nenhuma habilidade de engenharia de áudio necessária.
E embora LALAL.AI já fosse bastante sólido, recentemente deu um grande passo em frente graças à introdução de sua nova arquitetura de rede neural chamada Cassiopeia. Ele pega o Rocknet, a rede neural da geração anterior do serviço, e o torna melhor em quase todos os sentidos.
O que a Cassiopeia do LALAL.AI traz para a mesa?
Simplificando: Cassiopeia fornece resultados de divisão aprimorados com significativamente menos artefatos de áudio. O propósito do LALAL.AI é puxar e separar vocais e instrumentos de uma faixa, então ter um recurso que pode melhorar a capacidade é incrível.
Com a nova rede neural, LALAL.AI levará um pouco mais de tempo para gerar as faixas divididas, mas isso é uma pequena compensação para a grande melhoria na qualidade.
Então, o que é diferente? Basicamente, o Rocknet, que ainda pode ser usado em LALAL.AI, considera apenas o componente de amplitude enquanto ignora o componente de fase. A rede neural Cassiopeia mais recente considera o componente de fase do sinal de entrada e gera a fase para o sinal de saída. Por meio desse processo, as faixas divididas conterão menos artefatos de áudio.
Para colocar tudo isso em termos simples, o novo algoritmo analisa mais profundamente a música para criar uma divisão melhor.
Para provar que seu serviço funciona de forma mais eficaz, a LALAL.AI o testou com o Spleeter, OpenUnmix e Extended Unmix. Ele também comparou os resultados com sua própria rede neural Rocknet. Você pode ver os resultados completos do teste em Blog do LALAL.AI, mas basicamente, Cassiopeia superou todos os outros na maioria das categorias em vários gêneros selecionados aleatoriamente, como jazz, soft rock, pop e assim por diante.
Curiosamente, o Rocknet ainda tem um desempenho melhor no canal vocal. Cassiopeia tem um pouco mais de infiltração dos instrumentais para os vocais. No entanto, LALAL.AI ressaltou que os números nem sempre contam toda a história e, às vezes, a qualidade do som pode ser diferente do que os testes mostram.
Aqui está o que a empresa disse sobre o assunto:
Embora Cassiopeia fique atrás da Rocknet em termos de métricas formais para vocais, tanto a parte instrumental quanto a haste vocal são separadas por Cassiopeia soa muito mais natural e suave do que Rocknet, sem os artefatos de som metálico que são tão característicos do outro soluções.
Testei os resultados por mim mesmo e descobri que a rede neural Cassiopeia resultou em divisões de áudio mais limpas. A trilha vocal quase não tinha infiltração perceptível dos instrumentais, que é exatamente o que você quer de uma ferramenta como o LALAL.AI
Com isso dito, os resultados do Rocknet ainda foram muito bons e foram absolutamente utilizáveis para isolar a faixa vocal dos instrumentais.
Como você experimenta o novo recurso Cassiopeia do LALAL.AI?
Se você quiser dar uma chance à nova rede neural, você pode ir para LALAL.AI e certifique-se de que Use o novo algoritmo A caixa é marcada perto da parte inferior da tela quando você carrega uma música.
Você também pode escolher o nível de agressão usado pelo algoritmo para dividir as faixas. Normal é bom para a maioria das faixas, mas você pode experimentar com Mild e Aggressive para ver o que cria uma faixa melhor para você.
Em vez de gastar horas criando hastes, o LALAL.AI usa inteligência artificial para fazer isso em segundos.
Leia a seguir
- Promovido
- Produção musical
Dave LeClair escreve notícias do Google / Android, gerencia mídias sociais e aparece em vídeos.
Assine a nossa newsletter
Junte-se ao nosso boletim informativo para dicas de tecnologia, análises, e-books grátis e ofertas exclusivas!
Mais um passo…!
Confirme o seu endereço de e-mail no e-mail que acabamos de enviar.