À medida que a presença do conteúdo produzido por inteligência artificial se torna mais comum em nosso dia a dia, pode surgir a dúvida: “Como posso reconhecer um texto gerado por AI?”
Não é surpreendente que conforme a tecnologia de inteligência artificial avança, esses modelos se tornem mais desafiadores de identificar. Atualmente, a boa notícia é que conteúdos como imagens e vídeos não são tão complexos de analisar visualmente.
Como identificar conteúdo produzido por inteligência artificial.
Seja você um educador ou um internauta experiente, qual é o truque para identificar texto produzido por inteligência artificial? É mais fácil do que parece: basta confiar nos seus olhos. É possível treinar o olhar humano para distinguir textos gerados por IA. Especialistas como Melissa Heikkilä, da MIT Technology Review, afirmam que a “magia” dessas máquinas está na ilusão de precisão.
Cada indivíduo tem um estilo de escrita único, porém existem padrões compartilhados. Em ambientes corporativos, é comum notar que muitas pessoas utilizam frases genéricas ao redigir memorandos para seus superiores. Por essa razão, os detectores de texto AI frequentemente identificam o conteúdo como sendo “gerado igualmente pela AI”, já que diferenciar entre um estilo de escrita humano monótono e uma voz genérica produzida pela AI é uma tarefa praticamente impossível.
A seguir, apresentam-se algumas sugestões e estratégias para identificar possíveis textos criados por inteligência artificial.
Busque utilizar com frequência termos como “o”, “ele” e “sua”.
• A falta de falhas é comum no texto gerado por inteligência artificial, que costuma ser muito impecável.
• Declarações finais que resumem de forma precisa os parágrafos.
Muito prolixo ou com excesso de palavras.
• Dados e fontes inexatas ou inventadas.
Uma abordagem mais sofisticada do que os trabalhos típicos do autor.
Frase que se repete com frequência ou gramática peculiarmente formal.
Existem também no mercado detectores de texto AI disponíveis para uso, no entanto, com base na minha experiência, eles são provavelmente menos confiáveis do que a avaliação feita diretamente por você.
Detectores de inteligência artificial de texto: Por que sua confiabilidade está em questão?
Não é só desgraça e tristeza; algumas soluções surgiram para enfrentar os desafios da inteligência artificial. A introdução de modelos como o ChatGPT e competidores como o Gemini e o Claude impulsionou o crescimento de um setor dedicado à detecção de texto gerado por IA. Novas plataformas, como o ZeroGPT, foram desenvolvidas em resposta ao modelo de linguagem da OpenAI, e ferramentas como Grammarly e Copyleaks, inicialmente criadas para detectar plágio, também estão sendo adaptadas para lidar com conteúdo produzido por inteligência artificial.
De acordo com algumas opiniões, a detecção de texto por inteligência artificial é atualmente a forma mais eficaz de identificar conteúdo gerado por IA ou fraudulento. No entanto, a precisão desses detectores não é perfeita, mesmo que muitos afirmem o contrário. Em muitos casos, a confiabilidade dessas ferramentas pode ser incerta.
De acordo com Junfeng Yang, professor da Universidade Columbia, a questão reside no fato de que os modelos estão se tornando mais fluentes, o que resulta na ineficácia dos detectores mais antigos. Conforme o texto gerado por inteligência artificial se torna mais complexo, passa a empregar vocabulário e estruturas de frases que se assemelham de perto à linguagem humana, tornando sua detecção mais desafiadora mesmo para detectores avançados.
Testando a exatidão dos detectores de inteligência artificial para textos.
Mesmo com avançadas ferramentas como o GPTZero ou o Hive Moderation, é surpreendentemente fácil enganar um detector de inteligência artificial para classificar conteúdo humano como sendo produzido por uma máquina. Esses sistemas costumam analisar linhas de texto que explicam ou resumem ideias, o que os torna suscetíveis a identificar falsos positivos. Por exemplo, ao testar um resumo simples de Game of Thrones que foi rapidamente escrito de memória em várias dessas ferramentas, quase todas apontaram que o conteúdo foi “igualmente gerado pela IA”.
Eu peguei o resumo do Game of Thrones, gerado pelo ChatGPT, e solicitei que fosse expandido e elaborado, tornando-o mais extenso e menos direto.
Aqui está o que eu redigi:
O enredo de Game of Thrones segue diversas famílias em Westeros, um continente fictício. Uma delas são os Stark, que governam o Norte, e os Lannisters, que controlam os Westerlands. Cersei, a filha mais velha dos Lannisters, também é a Rainha de Westeros e está casada com Robert Baratheon, que é dos Stormlands e tomou o trono dos Targaryens, uma antiga linhagem de dragões que dominava a terra há séculos, mas perdeu lentamente o controle devido a conflitos. A série foi criada por George RR Martin e se baseia em cinco livros, com mais dois planejados, incluindo o Winds of Winter, previsto para ser lançado em 2025.
Aqui está a nova e melhorada versão do ChatGPT.
Game of Thrones transporta os espectadores para o complexo cenário de Westeros, onde o poder é o prêmio e a moralidade é flexível. Os Stark, líderes do Norte gelado, representam a honra em contraste com os Lannisters dos Westerlands, família conhecida por sua opulência e reputação controversa. Enquanto o trono de Westeros tem uma história sangrenta e turbulenta, marcada por rebeliões e traições, a obra de George R. R. Martin combina carnificina, intriga política e traições em uma saga envolvente. Os fãs aguardam ansiosamente o desenrolar dos próximos capítulos, cientes de que em Westeros as promessas são frequentemente quebradas.
Os resultados dos testes que realizei foram diferentes. Inicialmente, experimentei o Scribbr, que classificou meu resumo original como “100% provavelmente produzido pela inteligência artificial”. No entanto, ao optar pela versão aprimorada pela IA, o Scribbr reduziu a probabilidade para apenas 48%, surpreendentemente.
Outra ferramenta que experimentei foi o Winston AI, que indicou que o texto original tinha uma probabilidade de 39% de ter sido gerado pelo GPT-4. No entanto, quando analisou o verdadeiro resumo do GPT-4, a probabilidade foi de apenas 1%.
O Hive Moderation falhou em reconhecer corretamente o meu trabalho, não marcando nenhum dos resumos que enviei como feito por um ser humano, mesmo que eu tenha sido o autor.
Atualmente, ao solicitar um parágrafo aleatório de qualquer assunto ao ChatGPT e submetê-lo a diversos detectores de texto, ele frequentemente será identificado como gerado por inteligência artificial de imediato. No entanto, essa situação destaca um dilema: na ausência de orientações específicas, o texto produzido pelo ChatGPT costuma ser genérico, previsível e direto.
O tom entediante previsível é responsável por esses resultados falsos positivos, não a suposta tecnologia avançada que esses sites afirmam ter para distinguir entre conteúdo gerado por inteligência artificial e humanos. Mesmo quando ferramentas como Originality identificam corretamente ambas as instâncias de escrita gerada por AI, uma pequena modificação na frase pode alterar completamente o resultado. Com uma simples reformulação, o que antes era marcado como “100% de confiança” como sendo gerado por AI pode ser de repente rotulado como “Provavelmente original”.
Aqui está a relação de ferramentas gratuitas de detecção de texto AI que experimentei, seguindo o procedimento mencionado. Além disso, utilizei algumas análises de artigos acadêmicos que redigi anteriormente para verificar se identificariam meu uso de linguagem rebuscada para aumentar o número de palavras. Essas são as ferramentas testadas.
- Reescreva o texto parafraseando-o.
- ZeroGPT es un programa informático que se utiliza para optimizar la programación de tareas y la asignación de recursos en entornos de producción.
- Moderação da Colmeia
- Scribbr is a platform that provides academic editing and proofreading services to students.
- Reformulação: Regras de Reprodução
- “Originalidade.ai” puede ser parafraseado como “Inteligencia artificial para la creatividad”.
- Reescreva o texto sobre gramática de forma diferente.
- Identificador de saída GPT-2
- O texto foi redigido por X.
- Winston Artificial Intelligence
GPT Zero, um modelo de inteligência artificial.
ZeroGPT significa gravidade zero por tempo parcial.
Controle de Colmeia
Reescreva o texto fornecido de forma original.
Códigos de Replicação
Originalidade.ai significa ser autêntico e genuíno.
Gramática é o conjunto de regras que regulam o funcionamento da língua.
Identificador de saída GPT-2
Texto de autoria de X.
Winston Inteligencia Artificial
Se a sua escrita parece monótona e sem emoção, os sistemas de inteligência artificial provavelmente identificarão você como um robô precisando urgentemente de um teste de Turing. Esse teste demonstra que evitar certos padrões de escrita pode enganar facilmente os sistemas de IA. Isso representa um grande desafio para as empresas que desenvolvem essas ferramentas, especialmente aquelas que oferecem serviços de assinatura e pretendem vender suas APIs para escolas e empresas como uma solução de negócio para negócio.
Embora essas ferramentas possam ser eficazes na identificação de plágio, é evidente que a capacidade delas de detectar texto produzido por inteligência artificial ainda precisa ser aprimorada significativamente. A inconsistência é notável – ao submeter o mesmo texto a diferentes detectores, os resultados obtidos podem ser bastante discrepantes. O que uma ferramenta aponta como sendo gerado por IA pode passar despercebido por outra. Dada a falta de confiabilidade, é complicado recomendar com segurança o uso dessas ferramentas atualmente.
Por que é tão desafiador identificar texto criado por inteligência artificial?
A linguagem humana é extremamente rica e intricada, o que torna desafiador identificar o texto criado pela inteligência artificial.
Bamshad Mobasher, que faz parte do IEEE e lidera o programa de IA na Universidade DePaul, explica que os modelos são treinados para imitar conversas humanas, facilitando assim a compreensão do texto.
Em vez de usar ferramentas de detecção, Mobasher mencionou que os padrões são procurados, como frases repetitivas e estruturas gramaticais muito regulares. Ele observou que, embora às vezes seja mais simples para um ser humano identificar quando o texto é “muito perfeito”, pode ser desafiador confirmar se foi criado por inteligência artificial.
Diferentemente dos geradores de imagem, que podem criar sinais de contos como dedos adicionais ou características faciais distorcidas, LLMs, de acordo com Mobasher, se baseiam em probabilidades estatísticas para produzir texto – o que resulta em uma saída mais precisa. Consequentemente, identificar falhas no texto criado pela inteligência artificial – como nuances na escolha de palavras ou pequenas irregularidades gramaticais – é uma tarefa muito mais difícil tanto para os sistemas de detecção quanto para os leitores humanos.
Essa é a razão pela qual o texto produzido pela inteligência artificial se torna igualmente perigoso. Mobasher alerta que “torna-se mais simples criar e disseminar desinformação em grande quantidade”. Com LLMs gerando textos bem elaborados que podem imitar autoridades, torna-se desafiador para o público identificar a diferença entre realidade e ficção.
Yang afirma que com a inteligência artificial, é mais simples executar esses ataques, pois é possível tornar o e-mail mais natural, transmitir a mensagem desejada e até mesmo inserir detalhes personalizados sobre a posição ou função do alvo em uma empresa.
Além da possibilidade de ser mal utilizado, o texto produzido pela inteligência artificial contribui para a baixa qualidade da internet. Empresas como OpenAI e Anthropic utilizam dados públicos para treinar seus modelos de linguagem. Como resultado, os artigos gerados pela IA são compartilhados online e podem ser usados repetidamente de forma contínua.
Este ciclo de reutilização de conteúdo diminui a qualidade global da informação online, gerando um ciclo de retroalimentação de material cada vez mais genérico, repetitivo, o que dificulta a localização de conteúdo autêntico e bem redigido.
Não temos muito controle sobre a rápida evolução da inteligência artificial e seus impactos negativos no conteúdo da internet, mas podemos utilizar nosso conhecimento em alfabetização midiática para distinguir entre o que é produzido por humanos e o que é gerado por um programa automatizado.
Yang recomenda não confiar cegamente em um artigo ou relatório, e aconselha a buscar fontes adicionais para confirmar as informações, principalmente se algo parecer suspeito.
Assuntos abordados: Inteligência Artificial e OpenAI.
Comments