Propaganda
ì´ ì›¹ì‚¬ì´íŠ¸ì— 환ì˜. ì´ê²ƒì€ 보기 ì›ë³¸ì´ë‹¤
Que língua é essa? Chinês? Japonês?
Na verdade, é coreano. Detectar isso manualmente teria me levado muito tempo. Felizmente, encontrei algumas ferramentas muito precisas que podem fazer isso automaticamente. Todos eles estão listados abaixo.
O experimento: Testei os sites usando um texto de amostra (1-2 frases com 8 palavras) dos seguintes idiomas: português, russo, coreano, vietnamita, italiano, Turco, polonês, ucraniano, azerbaijano, esloveno, macedônio, holandês, filipino (tagalo), grego, galego, tcheco, bielo-russo, finlandês, tártaro e Norueguês.
No geral, testei 20 idiomas diferentes.
3 ferramentas para detectar texto em idioma desconhecido
1. LangId (passou em 18 de 20 testes, não passou em tártaro e bielo-russo)
Prós: No geral, ótima ferramenta online. Ele oferece funcionalidade básica de detecção de texto e também tem Twitter e bots de detecção de e-mail para resultados ainda mais rápidos.
Contras: Seu mecanismo é baseado na API do Google, mas eles parecem ter resultados melhores do que o detector do Google descrito abaixo. Parece que sabem utilizar muito bem as coisas. Não gostei que eles não tivessem seu próprio algoritmo exclusivo para detectar idiomas.
2. Detector de idioma do Google [não mais disponível] (passou em 17 de 20 testes, não passou em português, taglog e bielo-russo)
Prós: O Google tem uma das melhores APIs do mundo para detecção de idioma. A boa notícia é que você pode ver a probabilidade de o resultado que exibem ser verdadeiro. Eles foram capazes de passar na maioria dos testes de amostra.
Contras: Fiquei bastante surpreso por eles não terem passado no teste de português. Parece que eles têm um bug (espero temporário) com esse idioma. Além disso, eles certamente podem fazer um trabalho melhor em tornar o design da página melhor.
3. Que língua é essa (passou em 11 de 20 testes, não passou em russo, coreano, ucraniano, azerbaijano, macedônio, tagalo, grego, galego e tártaro)
Prós: Algumas línguas, como as eslavas do sul (sérvio, croata, esloveno), são bastante semelhantes. No caso de você inserir algum texto croata, digamos, este site dirá que o texto também pode ser sérvio ou esloveno.
Contras: Eles precisam trabalhar para tornar seu sistema de detecção mais sofisticado. Eu estava pensando em colocar Translated.net (outro site para detecção de idioma) em vez deste, mas a Translated prometeu detecção de mais idiomas e, na verdade, foi pior do que WhatLanguageIsThis.com.
2 ferramentas para detectar sites em idiomas desconhecidos
4. Google Tradutor com Detectar idioma como a primeira opção
Passado: 18 de 20, não foi aprovado em bielo-russo e tártaro.
Prós: Esta ferramenta faz seu trabalho muito bem. O que eu gosto sobre Google Tradutor O Google Translate 2.1 é exibido com teclado nativo iOS 7 e mais suporte a idiomasAtualize para o Google Translate 2.1 em seu dispositivo iOS e leve consigo o suporte para tradução e entrada de texto manuscrito para novos idiomas. O Google Translate finalmente ganha um novo teclado iOS 7 para fazer tudo ... consulte Mais informação é que, se não for compatível com um idioma específico, aparecerá a seguinte tela:
Esse é um ótimo detector de linguagem, se você me perguntar!
5. Microsoft Bing Translator com Detecção automática como a primeira opção.
Passado: 8 em 20, não passou holandês, vietnamita, turco, ucraniano, azerbaijani, esloveno, macedônio, tagalo, grego, galego, tcheco e bielorrusso
Prós: Suporta um número limitado de idiomas. Para esses idiomas, ele faz bem o seu trabalho.
Contras: Estou muito decepcionado com a Microsoft. Eles têm um número muito limitado de idiomas para detecção e tradução Esqueça o Google Translate: três maneiras de obter uma tradução rápida e precisaEsteja você planejando se candidatar a um emprego ou um apartamento no exterior, ou esteja procurando traduzir sua página da web, você precisa fazer as coisas certas até mesmo em um idioma estrangeiro. consulte Mais informação e seu recurso de detecção automática é terrível. Caso você insira um idioma que eles não suportam, você obterá um resultado errado em vez de dizer que eles não suportam esse idioma.
Pensamentos
No geral, minha opinião é que as ferramentas acima estão indo em uma boa direção. Eles são atualmente os melhores para detectar idiomas online e fazem seu trabalho muito bem quando se trata de idiomas populares. No entanto, eles devem trabalhar para adicionar mais linguagens obscuras (nenhuma das ferramentas foi capaz de reconhecer o Tatar) e tenho certeza que todos eles, especialmente o Google, irão nessa direção em um futuro próximo.
Crédito da imagem: Kanko *
Meu nome é Darko (apelido Darren.) Gosto da Web 2.0, criação de sites de nicho (meu projeto mais recente é pesquisa de pessoas) e assim por diante... o que mais posso dizer sobre mim em um perfil tão curto, siga meu Twitter se quiser saber mais :)