Sumário
- Introdução
- Detecção de Texto
- Detecção de Imagem
- Detecção de Áudio e Vídeo
- Precisão e Limitações dos Detectores
- Técnicas de Evasão (Anti-Detecção)
- Padrões e Iniciativas da Indústria
- Comparativo de Ferramentas
- Conclusão
- Referências
Introdução
A detecção de conteúdo gerado por inteligência artificial tornou-se uma área crítica à medida que modelos como ChatGPT, Claude, Gemini, Midjourney, DALL-E e Stable Diffusion se popularizam. Instituições acadêmicas, editoras científicas, jornalistas e empresas buscam formas confiáveis de distinguir conteúdo humano de conteúdo sintético.
Este documento reúne os principais mecanismos de detecção para texto e imagem, as ferramentas gratuitas disponíveis, e suas limitações.
⚠️ Aviso importante: Nenhum detector de IA é 100% preciso. Estudos mostram que a maioria dos detectores tem taxas de acerto abaixo de 80% e são vulneráveis a técnicas de evasão.
Detecção de Texto
Como Funciona
A detecção de texto gerado por IA baseia-se em várias abordagens complementares:
1. Análise Estatística (Perplexidade e Burstiness)
Perplexidade: Mede o quão "surpreendente" um texto é para um modelo de linguagem. Textos de IA tendem a ter perplexidade mais baixa — as palavras são mais previsíveis, seguindo padrões estatísticos mais prováveis. Humanos escrevem com maior variabilidade lexical.
Burstiness: Mede a variação na estrutura das frases. Texto humano naturalmente mistura frases curtas, médias e longas. Texto de IA tende a ter burstiness mais uniforme — frases de comprimento e estrutura mais homogêneos.
Limitação: Estas métricas são facilmente enganadas por parafraseamento ou edição humana básica. Um estudo da Pangram Labs mostrou que perplexidade e burstiness sozinhos falham em detectar IA consistentemente.
2. Classificadores Baseados em Modelos
Funcionam como um "modelo adversário" treinado para diferenciar texto humano de IA:
- Um modelo (ex: RoBERTa, BERT, DeBERTa) é fine-tunado em datasets contendo textos humanos e textos gerados por vários modelos de IA (ChatGPT, Claude, Gemini, Llama)
- O classificador aprende padrões sutis: escolha de palavras de transição, comprimento de parágrafos, uso de advérbios, formalidade
- Alguns detectores usam ensembles (múltiplos modelos combinados) para maior precisão
3. Watermarking (Marca D'Água) em Texto
Técnica proposta pela OpenAI e outros laboratórios:
- Durante a geração, o modelo insere um padrão estatístico imperceptível na escolha de tokens
- Um detector correspondente pode verificar matematicamente esse padrão
- A vantagem: não depende de análise pós-hoc, é parte do processo de geração
Estado atual:
- OpenAI desenvolveu e testou internamente um sistema de watermarking para GPT-4, mas enfrentou resistência — usuários podem burlar editando o texto ou usando parafraseadores
- A técnica é mais robusta para textos longos (500+ palavras)
- Google DeepMind desenvolveu o SynthID-Text, que adiciona um watermark estatístico durante o sampleamento
4. Detecção por Metadados e Proveniência
- C2PA (Coalition for Content Provenance and Authenticity): padrão que permite anexar metadados criptográficos a conteúdo digital, incluindo se foi gerado por IA
- Modelos como os da OpenAI já suportam C2PA em imagens, mas a adoção em texto é mais difícil devido à facilidade de copiar/colar
Ferramentas Gratuitas de Detecção de Texto
| Ferramenta | URL | Limite Grátis | Modelos Detectados | Precisão Relatada |
|---|---|---|---|---|
| GPTZero | https://gptzero.me | ~10.000 caracteres/consulta | ChatGPT, GPT-5, Claude, Gemini, Llama | 99% (auto-declarado) |
| QuillBot AI Detector | https://quillbot.com/ai-content-detector | Grátis ilimitado (básico) | ChatGPT, Gemini, Claude | 78% (teste Scribbr) |
| Grammarly AI Detector | https://www.grammarly.com/ai-detector | Grátis com limite | ChatGPT, Gemini, GPT-4 | #1 ranking (2025) |
| Scribbr AI Detector | https://www.scribbr.com/ai-detector | Limitado grátis | ChatGPT, Copilot, Gemini | 78% (auto) |
| Paperpal | https://paperpal.com/tools/ai-detector | Grátis limitado | ChatGPT, GPT-5, Claude, Gemini | Alta |
| ZeroGPT | https://www.zerogpt.com | Grátis ilimitado (+ WhatsApp/Telegram bot) | ChatGPT, Gemini, Llama | Moderada |
| Originality.ai | https://originality.ai | Teste grátis (créditos) | ChatGPT, GPT-4, Claude, Gemini | Alta (paga) |
| Writer AI Detector | https://writer.com/ai-content-detector | Grátis ilimitado | ChatGPT, Gemini | Moderada-Boa |
| Sapling AI Detector | https://sapling.ai/ai-content-detector | Grátis ilimitado | ChatGPT, GPT-4 | Moderada |
| Copyleaks | https://copyleaks.com/ai-content-detector | Teste grátis | ChatGPT, Gemini, Claude | Alta |
| ContentDetector.AI | https://contentdetector.ai | Grátis | ChatGPT, Gemini | Moderada |
| Crossplag | https://justdone.com/ai-detector | Grátis limitado | ChatGPT, Gemini | Moderada |
| GPTKit | https://gptkit.ai | Teste grátis | ChatGPT, GPT-4, Gemini | 85%+ |
| AI Checker Pro | https://aichecker.pro | Grátis | ChatGPT | Básica |
| Detectortools | https://detectortools.ai | Grátis | ChatGPT, Gemini | Moderada |
| Winston AI | https://gowinston.ai | Teste grátis | ChatGPT, Claude, Gemini | Alta |
| Content at Scale | https://contentatscale.ai/ai-content-detector | Grátis | ChatGPT, Jasper, Copy.ai | Moderada |
| Undetectable AI | https://undetectable.ai | Teste grátis | ChatGPT, Gemini | Moderada (também humaniza) |
| Hugging Face (Detectores) | https://huggingface.co/spaces?search=ai+detector | Grátis | Modelos open-source | Variável |
| Binoculars | https://binocularsai.com | Grátis | LLMs em geral | Alta (pesquisa) |
| AI Or Not | https://www.aiornot.com | Grátis | ChatGPT, Gemini, Claude | Moderada |
| SciSpace | https://scispace.com/ai-detector | Grátis limitado | ChatGPT, Gemini | Híbrido (perplexidade + classificador) |
| Pangram | https://www.pangram.com | Teste grátis | ChatGPT, Claude, Gemini | Deep learning (0.01% falso positivo) |
| Surfer AI Detector | https://surferseo.com/ai-content-detector | Teste grátis | ChatGPT, Gemini | Moderada |
| Checker AI | https://www.aicheatcheck.com | Grátis | ChatGPT | Básica |
💡 Dica do Scribbr (2026): Em teste comparativo, Scribbr e QuillBot acertaram 78% — os melhores entre os gratuitos. Sempre use mais de uma ferramenta.
Detecção de Imagem
Como Funciona
A detecção de imagens geradas por IA utiliza múltiplas abordagens:
Análise de Artefatos
Imagens geradas por modelos (Nanobanana, Midjourney, DALL-E 3, Stable Diffusion, Firefly) têm características visuais detectáveis:
- Artefatos de textura: Padrões repetitivos ou texturas "plásticas" em áreas de sombra e pele
- Inconsistências de iluminação: Sombras que não correspondem à fonte de luz
- Erros anatômicos: Mãos, dedos, olhos e orelhas com proporções incorretas (cada vez mais raros em modelos recentes)
- Artefatos de compressão: Padrões de ruído diferentes do ruído natural de câmeras fotográficas
- Falta de ruído de sensor: Imagens sintéticas são "perfeitas demais" — não têm o ruído granular característico de sensores CMOS/CCD
Análise de Frequência (FFT/DCT)
- Imagens reais têm espectros de frequência complexos
- Imagens de IA tendem a ter distribuições de frequência anômalas em altas frequências
- Detectores analisam transformadas de Fourier para identificar padrões sintéticos
Classificadores CNN/Deep Learning
- Redes neurais treinadas em datasets de imagens reais vs. sintéticas
- Modelos como ResNet, EfficientNet e Vision Transformers fine-tunados
- Podem detectar padrões invisíveis ao olho humano
Metadados e Proveniência (C2PA)
A Coalition for Content Provenance and Authenticity (C2PA) é o padrão mais importante para verificação de autenticidade:
- Metadados criptográficos anexados à imagem no momento da criação
- Incluem: modelo usado, data, configurações
- Assinatura digital que pode ser verificada
- Suporte: OpenAI (DALL-E 3), Adobe (Firefly), Microsoft (Bing Image Creator), Google
- Ferramentas: Content Credentials Verify (contentcredentials.org/verify)
- Limitação: Facilmente removido por screenshot, recorte, ou recompressão
Watermarking Invisível (SynthID)
Desenvolvido pelo Google DeepMind:
- Insere um padrão imperceptível nos pixels da imagem
- Resistente a: recorte, redimensionamento, compressão JPEG, filtros
- Disponível no Vertex AI e Google Cloud
- Também integrado ao Gemini e Imagen
- OpenAI também implementou watermarking invisível em imagens do DALL-E 3
Ferramentas Gratuitas de Detecção de Imagem
| Ferramenta | URL | Tipo | Funcionalidades |
|---|---|---|---|
| Hugging Face Spaces | https://huggingface.co/spaces/umm-maybe/AI-image-detector | Grátis | Detector de imagem IA via modelo |
| AI Or Not | https://www.aiornot.com | Grátis limitado | Detecta imagens, áudio e vídeo IA |
| Illuminarty | https://illuminarty.ai | Grátis limitado | Análise de probabilidade de IA em imagens |
| Maybe's AI Image Detector | https://huggingface.co/spaces/umm-maybe/AI-image-detector | Grátis | Hugging Face Space open-source |
| Exposing.ai | https://exposing.ai | Grátis | Pesquisa reversa: descobre se imagem está em datasets de treinamento |
| Imagetwin | https://imagetwin.ai | Grátis limitado | Verificação de autenticidade de imagem |
| DeepAI Image Detector | https://deepai.org/ai-image-detector | Grátis | Detector de IA em imagens via deep learning |
| Sightengine | https://sightengine.com/detect-ai-generated-images | Teste grátis | API de detecção de IA em imagem com análise detalhada |
| Hive Moderation | https://hivemoderation.com/ai-generated-content-detection | Teste grátis | Detector multimodal (imagem + vídeo + áudio) com API |
| ZeroGPT Image Detector | https://www.zerogpt.com/ai-image-detector | Grátis | Detecta imagens de DALL-E, Midjourney, Stable Diffusion |
| WasItAI | https://wasitai.com | Grátis | Analisa qualquer foto e diz se foi criada por IA |
| TruthScan | https://truthscan.com/ai-image-detector | Grátis | Detecta DALL-E, Midjourney, deepfakes |
| Decopy AI | https://decopy.ai/ai-image-detector | Grátis | Detector para Midjourney, Stable Diffusion, DALL-E, Flux |
| Fake Image Detector (Hugging Face) | https://huggingface.co/spaces | Grátis | Vários modelos open-source |
| Optical AI Detector | https://www.optic.xyz | Grátis | Verificação de NFT/imagem |
| Content Credentials Verify | https://contentcredentials.org/verify | Grátis | Verifica metadados C2PA |
| FotoForensics | https://fotoforensics.com | Grátis | Análise de nível de erro (ELA) |
| Forensically | https://29a.ch/photo-forensics | Grátis | Conjunto de ferramentas forenses para imagem |
| Deepware Scanner | https://scanner.deepware.ai | Grátis | Detecção de deepfake em vídeo |
Detecção de Áudio e Vídeo
Embora o foco deste documento seja texto e imagem, é importante mencionar:
- Deepfake áudio: Detectores analisam artefatos de frequência, falta de variação natural na respiração, e inconsistências no espectrograma
- Deepfake vídeo: Detectores analisam inconsistências entre áudio e vídeo, piscadas não naturais, artefatos de borda em rostos
- Ferramentas: Deepware Scanner, Microsoft Video Authenticator, Pindrop (áudio)
Precisão e Limitações dos Detectores
Estudos acadêmicos revelam limitações significativas:
Estudo de Weber-Wulff et al. (2023)
- 14 ferramentas avaliadas
- Todas abaixo de 80% de precisão
- Apenas 5 ferramentas acima de 70%
- Tendência a classificar textos como humanos (viés de falso negativo)
- Parafraseamento reduz drasticamente a acurácia
Por que Perplexidade e Burstiness Falham (Pangram Labs, 2025)
O detector Pangram publicou uma análise detalhada das 5 falhas fundamentais de detectores baseados em perplexidade:
Texto do dataset de treinamento é classificado como IA — Documentos famosos como a Declaração de Independência dos EUA e artigos da Wikipedia são marcados como IA porque o modelo foi otimizado para minimizar perplexidade nesses textos durante o treinamento.
Perplexidade varia entre modelos diferentes — O que é "esperado" para o GPT é diferente para o Claude. Quando o modelo de referência usado pelo detector difere do gerador, os resultados ficam imprecisos.
Modelos comerciais não expõem perplexidade — ChatGPT, Gemini e Claude não fornecem as probabilidades de cada token, impossibilitando o cálculo direto de perplexidade.
Viés contra falantes não-nativos (ESL) — Textos de aprendizes de inglês têm perplexidade e burstiness mais baixas, levando a falsos positivos desproporcionais. Estudo de Stanford (2023) com 91 redações TOEFL confirmou o viés.
Detectores de perplexidade não evoluem com dados — Diferente de detectores baseados em deep learning (como o próprio Pangram), que melhoram com mais dados, detectores baseados em métricas estagnam.
Falsos Positivos
- Turnitin: Alega <1% de falsos positivos, mas estudo do Washington Post encontrou 50% em amostra menor
- Textos de pessoas não-nativas em inglês são mais frequentemente marcados como IA
- Textos técnicos e científicos têm maior taxa de falso positivo
- Consequências: acusações injustas de má conduta acadêmica
Falsos Negativos
- Textos de IA parafraseados ou editados por humanos passam despercebidos
- Modelos mais recentes (GPT-5, Claude 4) produzem texto mais "humano" e são mais difíceis de detectar
- Ferramentas de "humanização" de texto IA (Undetectable AI, etc.) burlam detectores
Técnicas de Evasão (Anti-Detecção)
Para Texto
- Parafraseamento: Reescrever o texto IA com vocabulário e estrutura diferentes
- Adição de erros: Inserir erros gramaticais ou escolhas lexicais não-ótimas intencionais
- Variação de comprimento de frase: Misturar frases curtas e longas propositalmente
- Ferramentas de humanização:
- Undetectable AI
- Surfer AI Content Humanizer
- WriteHuman
- Edição manual: Misturar parágrafos humanos com IA, reordenar seções
- Adversarial prompting: Pedir ao modelo para escrever "como um humano", com imperfeições
Para Imagem
- Screenshot: Remove metadados C2PA e watermark invisível
- Recorte e redimensionamento: Degrada marcas d'água
- Recompressão JPEG: Remove artefatos sutis e watermarks
- Filtros e edição: Aplicar filtros Instagram, ajustes de cor
- Injeção de ruído: Adicionar ruído gaussiano mínimo para enganar detectores
- Adição de metadados falsos: Inserir EXIF de câmera falsos
Padrões e Iniciativas da Indústria
C2PA (Coalition for Content Provenance and Authenticity)
- Membros: Adobe, Microsoft, OpenAI, Google, Intel, Sony, BBC, Truepic
- Padrão: Content Credentials — metadados criptográficos ligados ao conteúdo
- Como verificar: https://contentcredentials.org/verify
- Implementação: Adobe Photoshop, Microsoft Designer, OpenAI DALL-E 3
- Limitação: Facilmente removido por screenshot
SynthID (Google DeepMind)
- Watermarking invisível em imagens e áudio
- Resistente a modificações comuns (compressão, recorte, redimensionamento)
- Disponível no Google Cloud Vertex AI
- Também SynthID-Text para watermark em texto
OpenAI Watermarking
- Implementado para imagens DALL-E 3 via C2PA
- Em desenvolvimento para texto (GPT-4), mas não lançado amplamente
- Atrasado por resistência interna e de usuários
IPTC (International Press Telecommunications Council)
- Padrão de metadados para fotojornalismo
- Inclui campos específicos para indicar uso de IA generativa
Digital Watermarking Alliance
- Grupo da indústria focado em marcas d'água digitais
Comparativo de Ferramentas
Melhores para Uso Acadêmico
- GPTZero → Mais usado por educadores, detecção sentença-por-sentença
- Turnitin → Integrado a LMS, mas pago
- Scribbr → Bom para textos acadêmicos
- Originality.ai → Alta precisão, mas pago
Melhores Gratuitas para Texto
- QuillBot → Interface simples, ilimitado
- Grammarly → Integração com editor
- Writer → Ilimitado, sem cadastro
- Sapling → Ilimitado
- ZeroGPT → Ilimitado
- GPTZero → Até 10k caracteres
Melhores Gratuitas para Imagem
- AI Or Not → Interface simples
- Illuminarty → Análise detalhada
- Hugging Face Spaces → Modelos open-source
- FotoForensics → Ferramentas forenses
- Content Credentials Verify → Verificação C2PA oficial
Conclusão
A detecção de conteúdo gerado por IA é uma área em rápida evolução, mas nenhuma ferramenta atual é 100% confiável. As principais conclusões:
Para texto: Abordagens baseadas em perplexidade/burstiness são frágeis. Classificadores baseados em modelos (como GPTZero) são melhores, mas ainda falham com parafraseamento. Watermarking nativo (SynthID-Text, OpenAI) é a promessa futura, mas ainda não amplamente adotado.
Para imagem: A detecção por artefatos está ficando obsoleta conforme os modelos melhoram. C2PA e SynthID são as abordagens mais promissoras, mas ambas são contornáveis.
Padrão geral: A melhor estratégia continua sendo o julgamento humano combinado com ferramentas de detecção, consciente das limitações de cada ferramenta.
Recomendação prática: Use duas ou mais ferramentas em conjunto e nunca tome decisões baseadas unicamente na saída de um detector de IA.
Referências
- Wikipedia: Artificial Intelligence Content Detection
- Texas Tech University: AI Detection Tools Guide
- Pangram Labs: Why Perplexity and Burstiness Fail to Detect AI
- GPTZero: What is Perplexity and Burstiness?
- GPTZero: How AI Detectors Work — Complete Guide 2026
- SciSpace: How Do AI Detectors Work?
- Gonzaga University: AI Detectors Guide for Faculty
- Scribbr: 12 Best AI Detectors Tested (2026 Guide)
- Zapier: The 6 Best AI Content Detectors in 2026
- Nature (2023): ChatGPT Detector Catches AI-Generated Papers
- Nature (2024): AI-Generated Images Threaten Science
- EFF: AI Watermarking Won't Curb Disinformation
- C2PA: Content Credentials
- Google DeepMind: SynthID
- Stanford HAI: Human Writer or AI? Scholars Build Detection Tool
- MIT Technology Review: How to Spot AI-Generated Text
