Após o lançamento do ChatGPT em novembro de 2022, o fenomenal chatbot de IA emergiu como uma das ferramentas de escrita mais confiáveis ​​da Internet. É simples de usar; descreva o que você precisa escrever e o ChatGPT imprime na tela em segundos.

No entanto, em uma era em que o texto gerado por IA é passado como escrito por humanos e usado para obter uma vantagem injusta, identificar o conteúdo de IA é muito importante. Mas o ChatGPT não consegue identificar com precisão o conteúdo de IA, nem mesmo seu próprio trabalho - mas por quê?

Existe uma diferença entre o texto AI e a escrita humana?

Uma pré-condição para o ChatGPT identificar sua própria escrita ou qualquer texto gerado por IA é que deve haver uma diferença entre ele e o texto escrito por humanos. Então, existe alguma diferença significativa entre texto escrito por humanos e conteúdo gerado por IA? Se houver, com certeza, uma ferramenta como o ChatGPT deve ser capaz de discerni-lo.

Escrevemos um conto sem nenhuma entrada de nenhuma ferramenta de IA e, em seguida, perguntamos ao ChatGPT se a história era um conteúdo escrito por IA. O ChatGPT o sinalizou com confiança como um texto gerado por IA.

Em seguida, pedimos ao ChatGPT para gerar uma história e, nesse mesmo tópico de bate-papo, copiamos e colamos o texto gerado e perguntamos ao ChatGPT se o texto foi criado por IA. A resposta do ChatGPT? Um "não" confiante.

O ChatGPT falhou na identificação de texto escrito por humanos ou gerado por IA em ambos os casos. Então, por que o ChatGPT não consegue detectar seu próprio texto? Isso significa que não há diferença entre IA e texto humano?

Bem, existe. Poderíamos escrever um livro inteiro sobre a diferença entre os dois, mas não importa muito. Então, se há uma diferença, por que o ChatGPT ou qualquer outra ferramenta de IA não consegue identificar essas diferenças e apontar com precisão o texto gerado por IA de um escrito por humanos? A resposta está em como funciona o ChatGPT e como gera texto.

Como o ChatGPT Gera Texto

Quando você pede ao ChatGPT para gerar texto, ele tenta imitar o processo de escrita humana. Em primeiro lugar, o modelo por trás do ChatGPT - Transformador pré-treinado generativo (GPT) - foi treinado em um grande corpus de texto humano. Tudo, desde e-mails, artigos de saúde, artigos de tecnologia, redações do ensino médio e praticamente qualquer texto que você possa encontrar online, foi inserido no modelo durante o treinamento. Assim, o ChatGPT entende como cada um desses tipos de textos deve ser escrito.

Se você pedir ao ChatGPT para escrever um e-mail para seu chefe, ele saberá como deve ser um e-mail dessa natureza porque foi treinado em e-mails semelhantes - provavelmente milhares deles. Da mesma forma, se você pedir para escrever uma redação do ensino médio, ela também saberá como deve soar uma redação do ensino médio. O ChatGPT tentará escrever o que você quiser, da maneira que um humano faria.

Mas há um porém. Ao contrário de como os humanos escrevem, o ChatGPT realmente não entende o que está escrevendo da maneira que um humano entenderia. Em vez disso, o chatbot tenta prever qual seria a próxima palavra mais plausível em uma frase até concluir a redação.

Como o ChatGPT escreve por previsão

Digamos que você peça ao ChatGPT para escrever uma história sobre uma cidade fictícia chamada Volkra. Existe uma grande possibilidade de que o chatbot comece a história com as palavras "Era uma vez". Isso ocorre porque o chatbot não pensa por em si, mas tenta prever o que um humano escreveria com base no que aprendeu com as milhares de histórias com as quais foi alimentado durante treinamento.

Portanto, acreditando que um humano provavelmente começaria a história com as palavras "Era uma vez", o ChatGPT tentaria prever a próxima palavra lógica, que seria ser "a" seguido de "tempo". Então você teria "Era uma vez ..." seguido pela próxima palavra lógica e a próxima até que a história fosse concluída. O ChatGPT basicamente escreve prevendo qual palavra naturalmente (ou pelo menos tem a maior probabilidade) de vir a seguir em uma frase e inseri-la.

Portanto, quando uma ferramenta de IA tenta detectar se um texto é gerado por IA, um dos critérios que ela tenta avaliar é a previsibilidade do texto, pois as ferramentas de IA escrevem por previsão. Essa medida de previsibilidade é chamada de perplexidade na linguagem da IA. Agora, quando apresentado a um texto, entre outros critérios, uma ferramenta de IA como o ChatGPT tenta analisar o texto para medir o quão previsível é a sequência de palavras ou frases no texto. Maior previsibilidade ou baixa perplexidade normalmente significa que o texto provavelmente é gerado por IA. Menos previsibilidade ou maior perplexidade normalmente significa que o texto provavelmente foi escrito por humanos.

Esses critérios, juntamente com outros fatores como o nível de criatividade de um texto, infelizmente não são suficientes para determinar com certeza se um texto foi escrito por uma ferramenta de IA ou não. Isso ocorre porque os humanos podem escrever com maior variação, como no texto de exemplo que usamos para demonstração no início deste artigo.

Chatbots de IA como o ChatGPT são projetados para imitar a linguagem humana natural tanto quanto possível. Portanto, embora o texto AI possa ter padrões discerníveis, esses padrões não são tão óbvios, mesmo para uma ferramenta poderosa como o ChatGPT. É por isso que o ChatGPT não consegue detectar sua própria escrita, bem como por que as ferramentas de detecção de texto AI não funcionam.

O ChatGPT reconhecerá sua própria escrita no futuro?

Atualmente, ferramentas como o ChatGPT não conseguem detectar se um texto foi escrito por si mesmo ou por qualquer outra ferramenta de IA porque não há um padrão claro e discernível no conteúdo gerado por IA. No entanto, há uma boa chance de que isso mude em breve. Com os esforços de empresas como o ChatGPT para introduzir marcas d'água digitais no conteúdo gerado pelo ChatGPT, haverá um padrão mais perceptível no texto gerado pelo chatbot.