Pesquisadores da Carnegie Mellon University desenvolveram um sistema para interagir com alto-falantes inteligentes e outros dispositivos assistidos por voz sem o uso de wake words.
O sistema, que depende do aprendizado de máquina, pode ser a base para uma alternativa segura aos assistentes domésticos sempre ativos.
Como funciona o novo sistema?
As novas descobertas foram publicadas em um artigo de pesquisa [PDF] por uma equipe de pesquisa de quatro pessoas, que também forneceu um vídeo explicando como o novo modelo poderia funcionar.
A pesquisa se concentra no Direção da Voz, uma técnica que determina a posição e o ângulo de onde vem a fala. Isso difere dos dispositivos inteligentes de hoje, que tendem a se concentrar apenas na posição de origem de um som.
A abordagem atual também depende de uma palavra de ativação específica, por isso mudando a palavra de despertar de Alexa para outra coisa só oferece mais uma ou duas opções.
Estamos analisando como você pode alterar a palavra de ativação em qualquer dispositivo Amazon Alexa.
Quando uma pessoa fala, sua voz cria ecos pela sala, que chegam a um alto-falante inteligente em momentos diferentes. Ao analisar o tempo, o volume e o espectro de frequência do som que cada eco refletido faz, o novo O sistema pode prever se um usuário está falando na direção do objeto inteligente ou de costas para ele.
Juntamente com o artigo de pesquisa, a equipe também forneceu um Link GitHub ao conjunto de dados usado para treinar a rede neural. As 11.520 frases únicas no conjunto de dados foram suficientes para treinar um alto-falante inteligente a prever o ângulo que o usuário estava enfrentando com uma precisão de 90 graus.
Os cálculos necessários para determinar a direção são leves o suficiente para serem feitos no dispositivo localmente, sem conectar a um servidor remoto. A equipe de pesquisa por trás das novas descobertas espera que essa abordagem permita interações mais fluidas com dispositivos inteligentes e ofereça mais privacidade aos usuários do que as alternativas baseadas em nuvem.
Não há um cronograma de quando essa tecnologia pode aparecer para uso público, mas a base existe para abolir a necessidade de wake words eventualmente. Quando você não precisa mais chamar um alto-falante inteligente pelo nome, ele realmente precisa de um? Talvez Alexa saiba a resposta.
O fim dos assistentes domiciliares personificados?
Embora essa pesquisa abra novas possibilidades empolgantes para interagir com dispositivos inteligentes, não é provável que ela substitua totalmente as palavras de despertar. Afinal, um dos principais atrativos dos alto-falantes inteligentes é que você pode interagir com eles apenas pela voz enquanto realiza outras tarefas.
Talvez prometa um futuro em que vários dispositivos inteligentes possam ser usados no mesmo espaço. Em vez de despertar todos os dispositivos inteligentes ao alcance da voz, você pode pedir a um único dispositivo para fornecer o boletim meteorológico em silêncio.
Ainda é cedo, mas tecnologias como essa podem tornar as interações perfeitas entre humanos e computadores da ficção científica uma realidade em um futuro não muito distante.
Os algoritmos de aprendizado de máquina são projetados para tornar a vida mais fácil e melhorar os sistemas, mas podem dar errado, com consequências ruins.
- Lar inteligente
- Notícias de tecnologia
- Comandos de voz
- Alexa
- Alto-falante inteligente
- Aprendizado de Máquina
Ian Buckley é jornalista freelance, músico, performer e produtor de vídeo que mora em Berlim, Alemanha. Quando não está escrevendo ou no palco, ele está mexendo em eletrônicos ou códigos DIY na esperança de se tornar um cientista maluco.
Assine a nossa newsletter
Junte-se ao nosso boletim informativo para dicas de tecnologia, análises, e-books grátis e ofertas exclusivas!
Mais um passo…!
Confirme o seu endereço de e-mail no e-mail que acabamos de enviar.