Propaganda
Procurando o melhor livre Software Windows para fala em texto? O mais repetido pago recomendação é Dragão naturalmente falando (DNS). Mas alguns podem zombar de pagar dinheiro por software. Felizmente, existem vários programas gratuitos excelentes por aí, como o Google Docs Voice Typing (GDVT) e o Windows Speech Recognition (WSR).
Dragon NaturallySpeaking Basics 13 (Descontinuado)Dragon NaturallySpeaking Basics 13 (Descontinuado) Compre agora na Amazon $79.73
Você pode se perguntar como esses dois produtos se comparam ao DNS - e se o DNS atende ou não às suas necessidades. Neste artigo, identifiquei três tipos de usuários: aqueles que precisam de transcrição de fala para texto para escrevendo romancesaqueles que precisam transcrição acadêmicae quem escreve documentos comerciais, como memorandos. Para esse fim, testei três programas de transcrição de fala (DNS, GDVT e WSR).
Configuração da transcrição de fala
Antes de iniciarmos o teste, vamos primeiro examinar a configuração de hardware e software recomendada.
Requisitos de hardware e software
Digitação por voz do Google Docs requer o navegador Chrome e um microfone. E também precisa de uma conexão persistente à Internet (que não é mencionada nos requisitos). Caso contrário, este é provavelmente o método mais fácil para iniciar a transcrição de fala.
O DNS requer um processador fabricado em 2001 ou posterior, Windows 7 ou posterior e cerca de 4 GB de armazenamento gratuito. Seu requisito mais estrito é 2 GB de RAM. Aqui está uma lista completa de Requisitos de hardware do DNS.
Reconhecimento de fala do Windows Habilite o controle de voz para texto e voz configurando o reconhecimento de fala no WindowsO reconhecimento de fala permanece mais poderoso que o Cortana. Conduz a fala ao controle de texto e voz. Este artigo mostrará o que o reconhecimento de fala pode fazer, como configurá-lo, treiná-lo e usá-lo. consulte Mais informação , também conhecido como Speech Platform Runtime (download do WSR), não custa nada e requer apenas um sistema operacional Windows 7 ou posterior.
Considerações sobre microfone
Eu uso um microfone dinâmico (melhor microfone para podcasting O melhor microfone para podcastingIniciando um novo podcast? Você vai precisar de um bom microfone! Aqui estão suas opções para o melhor microfone para podcasting. consulte Mais informação ) e um processador Intel Core i7 relativamente rápido. Embora um microfone de alta qualidade seja desejado, ele não é necessário. Mesmo assim, seus resultados melhorarão com melhor qualidade de som e ruído de fundo reduzido.
O microfone de preço mais baixo que eu recomendaria para gravação de alta qualidade é o Audio-Technica ATR-2100. No entanto, a diferença de precisão entre o microfone de US $ 5 e um dispositivo de US $ 200 é bastante mínima.
Microfone Dinâmico Cardióide USB / XLR Audio-Technica ATR2100-USBMicrofone Dinâmico Cardióide USB / XLR Audio-Technica ATR2100-USB Compre agora na Amazon
Por outro lado, os requisitos mínimos para o Microsoft Speech são praticamente todos computador remotamente moderno (a maioria dos computadores fabricados nos últimos dez anos) e um microfone. Se você possui um laptop ou tablet fabricado nos últimos cinco anos, ele deve ter o que você precisa por padrão.
Configurando programas de transcrição de fala
Veja como usar o Google Voice Typing:
Veja como começar com o Windows Speech Recognition:
E, finalmente, veja como começar com o Dragon Naturally Speaking:
Metodologia de Teste
Eu quero encontrar o melhor livre Aplicativo de fala para texto baseado em Windows. Como diferentes consumidores podem precisar de um produto diferente, desenvolvi um teste simples. Li três passagens diferentes de textos sem direitos autorais: uma de Charles Darwin Sobre a tendência das espécies de formar variedades. Um da H.P. De Lovecraft Chamada de Cthulu. As últimas são do discurso de 2017 do Estado da União de Jerry Brown. Minha metodologia não é de forma alguma perfeita, mas dá uma impressão das precisões de cada conjunto de reconhecimento de voz.
Amostra de escrita de ficção (de H.P. Lovecraft's Chamada de Cthulu)
“A coisa mais misericordiosa do mundo, eu acho, é a incapacidade da mente humana de correlacionar todo o seu conteúdo. Vivemos em uma plácida ilha de ignorância no meio dos mares negros do infinito, e isso não significava que deveríamos viajar para longe. As ciências, cada uma se esforçando em sua própria direção, até agora nos prejudicaram pouco; mas um dia a junção de conhecimentos dissociados abrirá perspectivas tão terríveis da realidade e de nossos terríveis posição em que devemos enlouquecer com a revelação ou fugir da luz mortal para a paz e segurança de um novo Idade Média, Era das Trevas."
Exemplo de redação comercial (discurso do Estado da União de Jerry Brown em 2017)
“É habitual em uma ocasião como essa definir uma agenda específica para o próximo ano. Seis vezes antes dessa tribuna, eu fiz isso e com alguns detalhes. E, ao reler as propostas apresentadas em discursos anteriores do Estado, fiquei surpreso ao ver o quanto conseguimos juntos. ”
Amostra de redação acadêmica (Charles Darwin's Sobre a tendência das espécies de formar variedades)
“Agora, quando ocorre uma variedade desse animal, com maior poder ou capacidade em qualquer órgão ou sentido, o aumento é totalmente inútil, nunca é acionado e pode até existir sem que o animal se conscientize disso. No animal selvagem, pelo contrário, todas as suas faculdades e poder são levados à ação plena pelas necessidades da existência, qualquer aumento torna-se imediatamente disponível, é fortalecido pelo exercício e deve modificar levemente a comida, os hábitos e toda a economia do país. corrida."
3 suítes de transcrição de voz testadas
É surpreendente como reconhecimento de voz gratuito Os melhores aplicativos de criação de lista para comandos de vozMuitas ferramentas gratuitas de produtividade suportam voz para texto em listas. Mostraremos os melhores aplicativos de criação de lista com reconhecimento de voz e comandos que você deve tentar. consulte Mais informação testes realizados com software pago. Mas, no final das contas, o aplicativo mais preciso é o Dragon Naturally Speaking. No entanto, o Google Voice Typing e o Windows Speech Recognition não custam nada e oferecem mais de 90% de precisão. Mas cada um tem suas próprias forças e fraquezas e você pode preferir um ao outro.
H.P. Lovecraft (Teste de redação de ficção)
Lovecraft adorava escrever em prosa longa, ininterrupta e entre parênteses. Enquanto todas as três suítes fazem um ótimo trabalho de transcrever com precisão o texto vocalizado de Lovecraft, DNS sai à frente de seus concorrentes. Inclui maiúsculas e pontuação (o que é completamente insano).
DNS: O DNS eliminou apenas uma única palavra do texto. No geral, marcou 107 pontos corretos em 108 palavras. Prendeu várias frases longas e sem parar também.
WSR: O Windows fez um trabalho muito bom - mas não incrível - na transcrição do Lovecraft. Ele obteve cerca de 97 das 108 palavras corretas. Embora isso fique aquém do GDVT e do DNS, ainda é bom para um programa de livre expressão para texto que não exija acesso on-line.
GDVT: Não sei o que aconteceu porque o Google pregou a transcrição para os outros trechos. O GDVT alcançou apenas 103 dos 108, soltando duas palavras e maltratando três. Mesmo soletrando "ponto e vírgula", em vez de inserir a pontuação correta. Ele também colocou em maiúsculas certas palavras, transformando-as em substantivos próprios (mas eu não as penalizo, pois é a precisão e não a capitalização que importa).
Tenho certeza de que, se reler o documento pela segunda vez, não haverá erros.
Charles Darwin (Teste de redação científica ou acadêmica)
Darwin escreve, como Lovecraft, longas frases carregadas de informações entre parênteses. No entanto, seu uso da linguagem é muito claro e ele quase não usa jargões, o que difere da literatura científica quase incompreensível atualmente.
DNS: O texto de Darwin sai quase perfeito em Dragon Naturally Speaking. O DNS digitou incorretamente apenas uma palavra ("into") e, de outra forma, acertou completamente o teste com 87 palavras em 88.
WSR: A Microsoft fez um ótimo trabalho, correspondendo 82 de 88 palavras. Cometeu alguns erros relativamente bizarros, como soletrar "sentido" como "centavos".
GDVT: O Google fez muito bem com o trecho de Darwin. O GDVT só conseguiu duas palavras, de 88. No geral, para um aplicativo gratuito, você não encontra uma alternativa mais precisa.
Jerry Brown Estado do endereço do estado 2016 (Teste de redação comercial)
O discurso de Brown não usa muitas frases ou vocabulários complicados (além da palavra "tribuna"). No geral, a maioria dos serviços de transcrição teve um desempenho incrível. Mais ou menos, se você precisar de um serviço que lida com frases simples e vocabulário limitado, qualquer uma delas funciona muito bem.
DNS: O DNS acertou em cheio o Brown Estado do endereço do estado. Enquanto perdia um período, caso contrário, recebia todas as palavras perfeitamente. Note, no entanto, que os discursos políticos muitas vezes carecem do tipo de linguagem complexa que você pode ver na ficção ou na academia. Um memorando ou discurso é direto e direto ao ponto. Isso é algo que um cliente de reconhecimento de fala não deve ter problemas para lidar.
WSR: O Windows Speech Recognition fez um ótimo trabalho - embora não tão bom quanto o DNS ou o Google - na transcrição do discurso de Brown. Ele marcou 55 de 58 palavras. Ele até reconheceu a palavra "tribuna", que eu nem sabia que era uma palavra, nem sabia como pronunciar. Aparentemente, eu entendi direito ou a tecnologia de reconhecimento de fala pode até pegar declarações erradas.
GDVT: O software de transcrição do Google acertou em cheio a transcrição, com 100% de precisão. Ele até conseguiu capitalizar corretamente "State of the State", sem a necessidade de entrada do usuário. Estranhamente, usava o número, e não a ortografia, para a palavra "seis". O que resultou em um erro estilístico.
Vale a pena usar os serviços de transcrição gratuita?
Há uma diferença entre Dragon Naturally Speaking, Google Voice Typing e o Windows Speech Recognition da Microsoft. Dragon é mais preciso que seus concorrentes. No entanto, o melhor programa gratuito em termos de precisão é, por uma margem estreita, a digitação por voz do Google. Enquanto os serviços de transcrição da Microsoft e do Google se comparam menos do que o DNS, eles não custam US $ 30.
Contrastando os dois serviços gratuitos, o Google oferece melhor precisão de reconhecimento de voz, pontuação e maiúsculas e minúsculas, requer uma conexão à Internet. O Google também captura muitas coisas que você não pretende, como pontuação e letras maiúsculas.
No entanto, se você deseja um programa de transcrição gratuito que não precisa de conexão com a Internet, O reconhecimento de fala do Windows é adequado. Não é ruim e oferece 90% do que a Dragon Naturally Speaking oferece. Experimente, se você ainda não o fez.
Para mais, dê uma olhada maneiras de fazer seu computador ler documentos para você 5 maneiras de fazer seu computador ler documentos para vocêVocê pode fazer seu computador ler em voz alta para você? Claro! Experimente estes métodos e ferramentas de conversão de texto em fala em seu PC. consulte Mais informação . E para obter ajuda com seu telefone Android, confira os melhores aplicativos Android de fala em texto 7 melhores aplicativos de ditado Android para fácil fala para textoProcurando os melhores aplicativos de fala para texto para Android? Esses aplicativos de ditado para Android permitem que você faça anotações e muito mais. consulte Mais informação .
Qual é o seu serviço de transcrição favorito? Por favor deixe nos saber nos comentarios!
Kannon é jornalista de tecnologia (BA), com experiência em assuntos internacionais (MA), com ênfase no desenvolvimento econômico e no comércio internacional. Suas paixões são em aparelhos de origem chinesa, tecnologias da informação (como RSS) e dicas e truques de produtividade.