O Google Chrome é o navegador da Web mais usado, mas ele está ouvindo secretamente seus usuários?
Houve alegações de que o popular navegador da web, Google Chrome, pode potencialmente ouvir sua mídia e você, levando alguns a desenvolver teorias da conspiração para atrair mais apoiadores. É crucial examinar o que o Google Chrome está fazendo em segundo plano e determinar se ele está monitorando suas atividades.
Como esse problema tem implicações para a segurança e privacidade de todos, é importante dar uma olhada mais de perto.
Google Chrome e o Projeto Chromium
O Chromium é um projeto de plataforma de navegador da Web de código aberto desenvolvido pelo Google. Uma equipe de desenvolvedores trabalhando no Google desenvolveu o Chromium sob a licença BSD. O objetivo fundamental do projeto é criar um navegador web rápido e confiável. O Google usa o software de código aberto desenvolvido neste projeto, conforme sua licença permite, e adiciona seus componentes proprietários para criar o navegador Google Chrome.
O projeto Chromium não é usado apenas pelo Google Chrome, mas também por vários outros aplicativos e bibliotecas, como Yandex Browser, Qt Web Engine e muito mais. Adicionalmente, várias distribuições Linux como o Debian e o Ubuntu têm um pacote de navegador chamado Chromium, que é semelhante ao projeto Chromium, mas diferente do Google Chrome.
O Google Chrome não é um software livre. Mas, ao usar o aplicativo Chromium que acompanha as distribuições do Linux em vez do Google Chrome, você pode evitar os componentes proprietários adicionados pelo Google.
Como o problema foi detectado?
Em 26 de maio de 2015, Yoshino Yoshihito elaborou um relatório de bug sobre o Sistema de Rastreamento de Bugs do Debian. Nesse relatório de bug, ele resumiu que após atualizar o aplicativo Chromium para a versão 43, o sistema baixou uma extensão chamada "Chrome Hotword Shared Module" sem o consentimento de Yoshihito, e quando Yoshihito entrou chrome://voicesearch na barra de endereço do navegador para obter informações adicionais sobre a extensão, indicava que tinha permissão "Captura de áudio permitida" e, portanto, tinha acesso ao microfone.
Após a publicação deste relatório de bug, muitas pessoas compartilharam informações confirmando a mesma situação. Então, o que tudo isso significa e onde o problema começa para nós?
O que sabemos sobre a tecnologia de pesquisa por voz do Google?
Muito provavelmente, você já experimentou o recurso de pesquisa por voz do Google em seu computador ou celular. Esse recurso começa a funcionar quando você clica em um botão que indica que deseja realizar uma pesquisa por voz ou quando abre um aplicativo especial desenvolvido para essa finalidade em seu telefone.
Os servidores do Google gravam e analisam sua voz do microfone e a comparam com padrões armazenados anteriormente. Atualmente, executar funções avançadas de reconhecimento de fala diretamente em um computador pessoal ou telefone celular não é prático. Portanto, é inevitável usar clusters de servidores baseados em nuvem para análise.
O Google usa modelos de redes neurais artificiais, inspirados no método de processamento de informações do cérebro humano, para perceber melhor o padrão de voz registrado em seu reconhecimento de fala tecnologia.
O Google utiliza a vantagem de seus enormes dados, que incluem conteúdo da Web previamente analisado e consultas de pesquisa frequentes, para melhorar o processo de reconhecimento de fala com o modelo N-gram. O modelo N-gram foi desenvolvido para casos onde a probabilidade da enésima palavra ser conhecida é baseada nas palavras anteriores (N-1). Por exemplo, se houver uma terceira palavra após duas palavras, como "chá da tarde", a probabilidade dessa palavra ser "matemática" ou "café da manhã" é diferente. Para aumentar a taxa de sucesso na previsão da terceira palavra no exemplo, precisamos de dados para alimentar o modelo de 3 gramas.
De acordo com números fornecidos pelo Google, em 2012, estava usando um modelo de 5 gramas (ou seja, até cinco palavras consecutivas) e um total de cerca de 12 bilhões de conjuntos de N-gramas para tecnologia de reconhecimento de fala. Embora eu não possa ter certeza sobre o nível que esses números atingiram hoje, posso assumir que eles aumentaram significativamente. Além disso, vale ressaltar que este não é um modelo estático e continua a aprender.
Esse detalhe é necessário para entender por que a voz gravada é enviada aos servidores do Google. Os algoritmos que continuam a aprender nos grandes conjuntos de dados mencionados acima podem produzir respostas rápidas, mas isso só é possível executando em vários servidores. Mesmo que algum dia seus computadores pessoais atinjam o poder de processamento necessário, o Google sempre terá uma vantagem porque você não possui os grandes bancos de dados necessários para análise.
A pesquisa por voz é realmente maliciosa?
A pesquisa por voz é um produto do Google há muito tempo, mas com o Google Chrome versão 43 e posterior, esse processo deu um passo adiante e é suportado por um novo modelo chamado OK Google. Esse recurso funciona quando você entra na página inicial do Google do seu navegador ou abre uma nova aba no Google Chrome para ir a um endereço. Tudo o que você precisa fazer é dizer as palavras que deseja pesquisar depois de dizer OK Google. Assim, em vez de clicar em um botão especial para fazer uma pesquisa por voz, você ativa o processo de reconhecimento de fala pronunciando as palavras OK Google. Você pode fazer várias perguntas interessantes e úteis usando o OK Google, o que acaba facilitando sua vida.
Para que esse recurso funcione, seu sistema precisa ouvir constantemente os sons do ambiente e capturar a palavra-chave OK do Google. A análise aqui é feita no seu computador porque a contagem de palavras é apenas duas e contém um padrão de som específico, e nenhum dado é enviado aos servidores do Google. Mas a próxima análise requer servidores. Portanto, a maneira de permitir que você pesquise mais rapidamente é ouvi-lo constantemente. Além disso, você não recebe uma notificação de que seu microfone está em uso durante esse processo de escuta.
Com o lançamento do Google Chrome versão 46, o recurso OK Google desapareceu. Então, outra tecnologia a substituiu ou, se foi, quão prejudicial é essa tecnologia para nós, podemos confiar no Google?
Mesmo que o Google seja considerado uma das empresas de tecnologia mais seguras do mundo, se hackers mal-intencionados encontrarem uma forte fraqueza nessa tecnologia, eles poderão explorá-la. Como resultado, a maneira como essa tecnologia funciona pode ser que a escuta do ambiente seja ativada para determinadas pessoas nos horários desejados e continue funcionando normalmente no restante do tempo.
Também, Política de privacidade do Google afirma que o Google usa as vozes dos usuários para desenvolver tecnologias de reconhecimento de voz. Claro, apenas o Google pode conhecer essas vozes. Ou o Google pode até usá-lo para capturar criminosos com a polícia. No entanto, é uma situação que os usuários civis normais devem estar cientes.
Então o que nós podemos fazer?
O Google é uma empresa realmente poderosa que conseguiu conduzir a tecnologia. Tem quase todo o tráfego da web no mundo também. Isso o torna um superpoder. O Google é um dos investidores de muitos algoritmos de análise de voz e pesquisa por voz que evoluíram ao longo dos anos. Por isso é importante ter dúvidas se o Google Chrome está ouvindo você.
Porque por trás dessas grandes empresas, existem investimentos financeiros sérios, apoio do governo e ações negociadas publicamente. O que você precisa fazer aqui é se proteger em vez de esperar que essas grandes empresas o protejam. É por isso que você sempre pode se referir ao software livre de código aberto.