Propaganda
Recentemente, eu estava trabalhando em uma história envolvendo uma pessoa que fez uma ligação, que foi gravada. Mais tarde, essa pessoa se recusou a admitir que já havia feito a ligação.
Com a voz gravada do telefonema e um clipe da pessoa negando a acusação, comecei a trabalhar tentando encontrar uma maneira de provar que as vozes eram a mesma.
Admito que sou um pouco obcecado por tecnologias de voz. É por isso que eu estava esperando Google Voice Como usar o Google Voice no blog por telefone consulte Mais informação para se tornar mais avançado com sua tecnologia de reconhecimento de voz, e é por isso que eu amo aplicativos de controle de voz para PC como Tazti Habilite o controle de voz para texto e voz configurando o reconhecimento de fala no WindowsO reconhecimento de fala permanece mais poderoso que o Cortana. Conduz a fala ao controle de texto e voz. Este artigo mostrará o que o reconhecimento de fala pode fazer, como configurá-lo, treiná-lo e usá-lo. consulte Mais informação
. No entanto, quando se trata de comparar vozes digitalmente, fiquei perplexo. Você provavelmente já viu aqueles filmes espiões nos quais o computador pode identificar automaticamente a voz de um criminoso conhecido apenas com a impressão por voz.Para ser sincero, depois que descobri o Sonogram Visible Speech, percebi que a tecnologia de voz do espectrograma realmente é Atualmente, é uma maneira viável de identificar solidamente uma pessoa apenas por sua voz.
Noções básicas sobre espectrograma
Se você conhece isótopos químicos, sabe que, com isótopos, os químicos podem identificar a composição química de compostos isolando os elementos básicos e usando a repartição para identificar os componentes individuais de qualquer mistura. Da mesma maneira, um espectrograma de áudio divide o som em frequências básicas. O interessante da voz humana é que ninguém fala em uma frequência. Sua boca, passagens nasais e a estrutura de sua caixa de voz determinam a mistura de frequências que compõem sua voz um tanto singular.
O Sonogram Visible Speech é um aplicativo de software de espectrograma gratuito que pega arquivos de vídeo ou áudio e quebra a faixa de áudio em todo o espectro - todas as suas frequências durante todo o período do faixa. Um espectrograma completo se parece com a imagem abaixo.
Como você pode ver, a faixa inferior se parece com a onda sonora básica que você vê em um programa como Audácia 3 dicas do Audacity para aprimorar suas entrevistas gravadasO áudio claro é vital para qualquer podcast ou gravação que você deseja publicar. Aumente sua qualidade de áudio com o Audacity em três etapas fáceis. consulte Mais informação , no entanto, o painel central exibe cada segmento do arquivo de som em todo o layout de frequência. O incrível deste software é que existem muitas outras formas de onda que você pode usar para examinar seu arquivo de som. Estes são especialmente para usuários avançados.
Você pode configurar como cada um desses formulários de onda é exibido acessando o menu “Opções” e selecionando “Geral Ajustamento." Aqui você pode definir como os gráficos logarítmicos calculam a saída e a configuração geral da exibição de todos os gráficos.
Se o som estiver bastante baixo ou a voz que você está analisando for um sussurro, considere usar o visor de frequência logarítmica. Você o ativa no menu "Opções" e seleciona "Frequência logarítmica". Isso irá "ampliar" as áreas significativas de frequência no espectrograma.
Isso pode realmente ajudar a identificar padrões claros de frequência que identificam alguém pelo som de sua voz. Se você está completamente perdido e não sabe por onde começar, clicar em "Ajuda" e ir para "Ajuda on-line" abrirá o manual de ajuda on-line do Sonogram muito bem escrito. É um ótimo lugar para começar, se você não conhece a espectrograma da análise de áudio.
Uma experiência com espectrogramas usando caça fantasma
A beleza deste software é que ele é bom para muitos usos diferentes. Um dos artefatos que surgem frequentemente na caça aos fantasmas, um interesse pessoal meu, é “Fenômeno da voz eletrônica” - onde a voz de uma aparição ou fantasma supostamente aparece no áudio gravações. Essas gravações estão espalhadas por toda a web, então decidi retirar alguns dos sites dos caçadores de fantasmas e fazer uma análise de espectrograma.
O espectrograma mostra que as frequências da voz são geralmente baixas, mas para obter uma melhor imagem das vozes na gravação, é necessário abrir as formas de onda adicionais. A tela de autocorrelação calcula o “tom” no período em que você passa o mouse.
O "fantasma" tem uma frequência de afinação média de cerca de 129,0 hz. Rolar para o final da gravação em que você ouve a voz do investigador, o tom calculado a frequência é de 208,0 hz (o que faz sentido porque é uma voz feminina e a gravação fantasma soa masculino.)
A abertura da tela Fast Fourier revela ainda mais detalhes sobre as vozes. Este gráfico divide rapidamente as frequências primárias e as exibe em um código de cores.
Nesse caso, a divisão das frequências é dividida em partes, com algumas altas, mas também um bom número de baixas frequências no mix. No entanto, o investigador na sala está falando claramente com uma voz agrupada em frequência mais na direção do limite superior do intervalo, como mostrado aqui.
Essa análise rápida provou que as duas vozes são bem diferentes, mas este é apenas um exemplo básico das capacidades deste poderoso software. Basicamente, qualquer situação em que uma quebra de frequências de uma onda sonora possa ajudar - este é o software para você. É fácil de aprender, rápido de instalar e configurar, e tem um desempenho tão bom quanto melhor que qualquer software de espectrograma pago no mercado.
Você tem algum projeto que possa usar um espectrograma? Você já experimentou o Sonogram Visible Speech? Compartilhe sua visão na seção de comentários abaixo.
Ryan é bacharel em Engenharia Elétrica. Ele trabalhou 13 anos em engenharia de automação, 5 anos em TI e agora é engenheiro de aplicativos. Um ex-editor-chefe do MakeUseOf, ele falou em conferências nacionais sobre visualização de dados e foi apresentado na TV e rádio nacional.