Mais de 70 anos atrás, quando a inteligência artificial foi conceituada, Alan Turing publicou um artigo que descrevia como identificá-la. Mais tarde, ficou conhecido como teste de Turing e tem sido usado há décadas para distinguir entre um humano e uma IA.

No entanto, com a introdução de chatbots de IA avançados, como ChatGPT e Google Bard, está ficando mais difícil saber se você está falando com uma IA. Isso levanta a questão; o teste de Turing está desatualizado? E se for, quais são as alternativas?

O teste de Turing está desatualizado?

Crédito da imagem: Jesus Sanz/Shutterstock

Para determinar se o teste de Turing está desatualizado, você deve primeiro entenda como funciona. Para uma IA passar no teste de Turing, ela deve convencer um interrogador humano de que é um humano. Mas há um problema - a IA é avaliada ao lado de um humano e deve responder usando texto.

Pense assim; se você é o interrogador e está fazendo perguntas a dois participantes online usando texto, mas um deles é um modelo de IA - você os diferenciaria depois de cinco minutos? Lembre-se de que o objetivo do teste de Turing não é identificar o modelo de IA com base nas respostas corretas, mas avaliar se a IA pode pensar ou se comportar como um humano.

instagram viewer

O problema com a abordagem do teste de Turing de apenas identificar respostas semelhantes às humanas é que ele não considera outros fatores. Por exemplo, a inteligência do modelo de IA ou o conhecimento do interrogador. Além disso, o teste de Turing é limitado apenas a texto, e está cada vez mais difícil identificar uma IA que gere uma voz humana ou vídeos deepfake que imitam o comportamento humano.

No entanto, os modelos atuais de IA, como ChatGPT-4 e Google Bard, ainda não avançaram a ponto de passar consistentemente no teste de Turing. Na verdade, se você estiver familiarizado com a IA, poderá localizar texto gerado por IA.

As 5 melhores alternativas de teste de Turing

É possível que futuros modelos de IA como ChatGPT-5 poderia passar no teste de Turing. Se isso acontecer, precisaríamos de testes diferentes combinados com o teste de Turing para identificar se estamos falando com uma IA ou com um humano. Aqui estão as melhores alternativas de teste de Turing:

1. O teste de Marcus

Gary Marcus, um renomado cientista cognitivo e pesquisador de IA, propôs uma alternativa ao teste de Turing que foi publicado no Nova iorquino para identificar a capacidade cognitiva de uma IA. O teste é simples: você julga um modelo de IA com base em sua capacidade de assistir e entender vídeos do YouTube e programas de TV sem legendas ou texto. Para que a IA passe no teste de Marcus, ela deve entender o sarcasmo, o humor, a ironia e o enredo ao assistir aos vídeos e explicá-los como um humano.

No momento, GPT-4 pode descrever imagens, mas até agora não existe nenhum modelo de IA que possa compreender vídeos como um humano. Veículos autônomos chegam perto, mas não são totalmente autônomos e requerem sensores, pois não conseguem entender tudo no ambiente ao seu redor.

2. O Teste de Turing Visual

De acordo com um trabalho de pesquisa publicado na PNAS, o teste visual de Turing pode ser usado para identificar se você está falando com um humano ou uma IA usando questionários de imagem. Funciona como o teste de Turing, mas em vez de responder a perguntas usando textos, os participantes veem imagens e espera-se que respondam a perguntas simples enquanto pensam como um ser humano. No entanto, o teste de Turing visual é diferente de CAPTCHAs já que todas as respostas estão corretas, mas para passar no teste, a IA deve processar as imagens de forma semelhante a um ser humano.

Além disso, se uma IA e um humano forem mostradas várias imagens lado a lado e solicitados a identificar imagens realistas, o humano teria a capacidade cognitiva de passar no teste. Isso ocorre porque os modelos de IA têm dificuldade em distinguir imagens que não parecem ter sido tiradas no mundo real. Na verdade, essa é a razão pela qual você pode identificar imagens geradas por IA usando anomalias que não fazem sentido.

3. O teste Lovelace 2.0

A teoria de que um computador não pode criar ideias originais além do que foi programado para fazer foi conceituada pela primeira vez por Ada Lovelace antes do teste de Turing. No entanto, Alan Turing se opôs a essa teoria argumentando que a IA ainda pode surpreender os humanos. Não foi até 2001 que as diretrizes para o teste Lovelace foram desenvolvidas para diferenciar uma IA de um ser humano - e, de acordo com o thekurzweillibrary as regras foram revisadas posteriormente em 2014.

Para que uma IA passe no teste de Lovelace, ela deve demonstrar que pode gerar ideias originais que superem seu treinamento. Os modelos atuais de IA, como o GPT-4, não têm a capacidade de criar novas invenções além do nosso conhecimento existente. No entanto, inteligência geral artificial pode alcançar essa capacidade e passar no teste Lovelace.

4. Teste de Turing Reverso

Que tal o teste de Turing, mas feito ao contrário? Em vez de tentar descobrir se você está falando com um humano, o objetivo do teste de Turing reverso é enganar a IA fazendo-a acreditar que você é uma IA. No entanto, você também precisa de outro modelo de IA para responder às mesmas perguntas usando texto.

Por exemplo, se ChatGPT-4 for o interrogador, você pode inscrever Google Bard e outro ser humano como participantes. Se o modelo de IA puder identificar corretamente o participante humano com base nas respostas, ele passou no teste.

A desvantagem do teste de Turing reverso é que ele não é confiável, especialmente considerando que às vezes A IA não pode diferenciar a gerada pela IA e conteúdo escrito por humanos.

5. Estrutura de classificação de IA

De acordo com a estrutura de classificação de IA desenvolvida por Chris Saad, o teste de Turing é apenas um método de avaliação para saber se você está falando com uma IA. Mais sucintamente, a estrutura de classificação da IA ​​é baseada na teoria da inteligência múltipla, que exige que a inteligência humana satisfaça pelo menos oito critérios diferentes, que incluem: ritmo musical, inteligência lógico-matemática, identificação visual, inteligência emocional, inteligência auto-reflexiva, capacidade de pensamento existencial e corpo movimento.

Como a IA é avaliada em oito parâmetros diferentes, é improvável que passe por um ser humano, mesmo que tenha um desempenho melhor que a média em certos benchmarks. Por exemplo, ChatGPT pode resolver problemas de matemática, descrever imagens e conversar em uma linguagem natural como um ser humano, mas falharia em outras categorias definidas na estrutura de classificação de IA.

O teste de Turing não é conclusivo

O teste de Turing pretendia ser mais um experimento mental do que um teste conclusivo para diferenciar entre humanos e IA. Quando foi inicialmente proposto, era a referência fundamental para medir a inteligência da máquina.

No entanto, com o recente desenvolvimento de modelos de IA com recursos interativos de fala, visual e auditivo, o teste de Turing fica aquém, pois é limitado a conversas de texto. A solução mais eficaz seria introduzir alternativas de teste de Turing que diferenciem ainda mais os modelos de IA dos humanos.