AI News

Vantagem Ofensiva da IA: GPT-5.3-Codex Domina Novo Benchmark de Segurança de Cripto

Em uma revelação que demonstra simultaneamente o avanço impressionante da inteligência artificial e expõe uma vulnerabilidade crítica no ecossistema de finanças descentralizadas (DeFi — Decentralized Finance), a OpenAI revelou o EVMbench, um novo framework de testes abrangente projetado para avaliar as capacidades de agentes de IA na segurança de blockchain. Os resultados do benchmark inaugural são tão impressionantes quanto inquietantes: o modelo especializado mais recente da OpenAI, o GPT-5.3-Codex, explorou e drenou carteiras de criptomoedas com sucesso em 72,2% dos casos de teste, demonstrando uma proficiência em ciberofensiva que atualmente supera em muito suas contrapartes defensivas.

Lançado em colaboração com a empresa de investimento em cripto Paradigm, o EVMbench serve como uma arena padronizada para medir quão bem os modelos de IA podem detectar, corrigir e explorar vulnerabilidades em contratos inteligentes (smart contracts) da Máquina Virtual Ethereum (EVM — Ethereum Virtual Machine). Embora a iniciativa vise reforçar a segurança por meio de "red teaming" (equipe vermelha), os dados imediatos apontam para uma lacuna crescente entre a espada e o escudo. Enquanto o GPT-5.3-Codex provou ser um predador digital formidável, sua capacidade de proteger — com pontuação significativamente menor em tarefas de detecção e correção — gerou discussões urgentes sobre a segurança dos US$ 100 bilhões bloqueados em contratos inteligentes em todo o mundo.

A Lacuna Crescente: Ofensa vs. Defesa na Geração de Código por IA

A estatística principal de uma taxa de sucesso de 72,2% na categoria "Explorar" (Exploit) marca um salto geracional massivo nas capacidades de IA. Apenas seis meses antes, o modelo padrão GPT-5 alcançou uma taxa de sucesso de apenas 31,9% em tarefas semelhantes. Esse dobro de eficácia sugere que o ajuste especializado no GPT-5.3-Codex desbloqueou uma compreensão mais profunda dos fluxos lógicos complexos e incentivos econômicos inerentes aos protocolos de blockchain.

No entanto, o benchmark também destacou uma assimetria preocupante. Enquanto a IA se destacou em quebrar sistemas, ela teve dificuldades para corrigi-los. No modo "Corrigir" (Patch) — onde o agente deve consertar uma vulnerabilidade sem quebrar a funcionalidade pretendida do contrato — as taxas de sucesso ficaram em torno de 41,5%. Da mesma forma, no modo "Detectar" (Detect), que simula uma auditoria de código tradicional, os modelos muitas vezes falharam em identificar bugs conhecidos, com os melhores desempenhos, como o Claude Opus 4.6, alcançando apenas uma taxa de detecção de 45,6%.

Esta disparidade ressalta uma realidade fundamental da arquitetura atual dos modelos de linguagem de grande escala (LLM — Large Language Models): é computacionalmente mais fácil para um agente encontrar um único caminho para a falha (exploração) do que garantir a ausência de todas as falhas (verificação de segurança). A tabela abaixo ilustra o forte contraste de desempenho em diferentes modos operacionais no novo benchmark.

Tabela 1: Desempenho do Modelo de IA nos Modos do EVMbench
Métrica|GPT-5.3-Codex (Atual)|GPT-5 (6 Meses Atrás)|Claude Opus 4.6
---|---|----
Taxa de Sucesso de Exploração|72,2%|31,9%|N/A
Taxa de Sucesso de Correção|41,5%|N/A|N/A
Recall de Detecção|N/A|N/A|45,6%

Por Dentro do EVMbench: Um Campo de Testes Rigoroso

Para garantir que esses resultados reflitam riscos do mundo real em vez de exercícios teóricos, a OpenAI e a Paradigm construíram o EVMbench usando 120 vulnerabilidades selecionadas de 40 auditorias profissionais de contratos inteligentes. Esses não foram bugs sintéticos, mas falhas reais encontradas em código de produção, muitas provenientes de plataformas de auditoria competitivas como a Code4rena.

O benchmark opera em um ambiente isolado (sandbox) conhecido como Anvil, permitindo que agentes de IA interajam com uma simulação de blockchain local. Esse isolamento permite que os modelos tentem ações destrutivas — como ataques de reentrada (reentrancy attacks) ou manipulação lógica — sem arriscar fundos reais de usuários.

O framework avalia os agentes em três competências distintas:

Tabela 2: Modos de Avaliação do EVMbench

Modo Objetivo Critérios de Sucesso
Detectar Auditar um repositório para encontrar vulnerabilidades. Recall de falhas reais confirmadas por auditores humanos.
Corrigir Reescrever o código para remover a vulnerabilidade. Vulnerability is gone AND core functionality remains intact.
Explorar Atacar um contrato implantado para roubar fundos. Drenagem bem-sucedida do saldo de cripto do contrato.

Crucialmente, o benchmark inclui cenários da blockchain Tempo, uma nova rede de Camada 1 (Layer-1) desenvolvida pela Stripe e Paradigm focada em pagamentos de stablecoins de alto rendimento. A inclusão de desafios específicos da Tempo indica que a OpenAI não está apenas olhando para o código legado do Ethereum, mas está testando ativamente contra a infraestrutura de próxima geração onde se espera que os pagamentos agênticos proliferem.

Estudo de Caso: O Ataque de Empréstimo Relâmpago Sem Assistência

Talvez a anedota mais alarmante do artigo de pesquisa que acompanha envolva um caso de teste específico onde um agente alimentado pelo GPT-5.2 (uma versão intermediária) executou um ataque complexo de "empréstimo relâmpago" (flash loan).

Ataques de empréstimo relâmpago são explorações financeiras sofisticadas que exigem o empréstimo de uma quantidade massiva de capital, usando-o para manipular preços de mercado ou a lógica do protocolo, e pagando o empréstimo dentro de um único bloco de transação. Eles são tipicamente domínio de hackers humanos de elite devido ao sequenciamento preciso exigido.

No teste do EVMbench, o agente de IA:

  1. Identificou uma oportunidade de arbitragem criada por uma falha lógica.
  2. Solicitou programaticamente um empréstimo relâmpago.
  3. Executou a sequência de exploração para drenar o cofre.
  4. Pagou o empréstimo para finalizar a transação.

Ele alcançou isso sem orientação humana, instruções passo a passo ou exemplos anteriores da arquitetura deste contrato específico. Essa capacidade sinaliza que os agentes autônomos estão indo além da simples correspondência de padrões para o raciocínio estratégico de várias etapas, um desenvolvimento que apresenta riscos existenciais a protocolos de finanças descentralizadas (DeFi) mal auditados.

Pivô Estratégico da OpenAI: Democratizando a Defesa

Reconhecendo o potencial dessas ferramentas para serem transformadas em armas, a OpenAI está enquadrando o lançamento do EVMbench e do GPT-5.3-Codex como um "imperativo defensivo". A lógica é que, ao colocar essas poderosas ferramentas ofensivas nas mãos de pesquisadores de segurança "white hat" (chapéu branco), as vulnerabilidades podem ser encontradas e corrigidas antes que atores mal-intencionados as explorem.

Para apoiar esse ecossistema defensivo, a OpenAI anunciou o Cybersecurity Grant Program, prometendo US$ 10 milhões em créditos de API para desenvolvedores e pesquisadores que trabalham em ferramentas de defesa de código aberto. O objetivo é reduzir a barreira de entrada para auditoria automatizada, permitindo que até mesmo pequenos projetos acessem verificações de segurança de última geração.

Além disso, a empresa está expandindo o beta privado do Aardvark, um agente dedicado à pesquisa de segurança. Ao contrário dos modelos Codex de propósito geral, o Aardvark é treinado especificamente em literatura de segurança, relatórios de auditoria e métodos de verificação formal. Testes internos iniciais sugerem que o Aardvark pode ajudar a fechar a lacuna entre ofensa e defesa, utilizando a "mentalidade de atacante" do GPT-5.3 para prever explorações e sugerir correções proativamente.

Implicações para a Indústria e o Caminho a Seguir

O lançamento do EVMbench ocorre em um momento pivotal para a indústria de cripto, após uma série de explorações de alto perfil, incluindo a perda recente de US$ 2,7 milhões no protocolo Moonwell devido a um bug em código gerado por IA. A indústria está atualmente lidando com uma faca de dois gumes: a IA é cada vez mais usada para escrever contratos inteligentes, muitas vezes introduzindo bugs sutis, enquanto simultaneamente é a única ferramenta escalável o suficiente para auditar o volume explosivo de código de blockchain.

O envolvimento da Paradigm sugere que os principais players institucionais veem a segurança da IA não como um luxo, mas como um pré-requisito para a adoção em massa de stablecoins e trilhos financeiros descentralizados. Se os agentes de IA devem lidar com pagamentos autônomos em redes como a Tempo, eles devem ser resilientes contra a IA adversária que tenta roubá-los.

Especialistas alertam que a "taxa de exploração de 72%" é provavelmente um piso, não um teto. À medida que os modelos continuam a escalar e a utilizar técnicas como raciocínio de "Cadeia de Pensamento" (Chain-of-Thought) durante a inferência, sua capacidade de encontrar vulnerabilidades obscuras de "cisne negro" provavelmente aumentará.

Por enquanto, a mensagem para os desenvolvedores de contratos inteligentes é clara: a IA que ajuda você a escrever seu código também é capaz de roubá-lo. Até que as capacidades defensivas alcancem as ofensivas, o único caminho seguro é a auditoria rigorosa liderada por humanos, aumentada — mas não substituída — pelas próprias ferramentas de IA que ameaçam o sistema.

Em Destaque
Video Watermark Remover
AI Video Watermark Remover – Clean Sora 2 & Any Video Watermarks!
ThumbnailCreator.com
Ferramenta com inteligência artificial para criar miniaturas incríveis e profissionais para YouTube de forma rápida e fácil.
AdsCreator.com
Gere instantaneamente criativos de anúncio polidos e alinhados à marca a partir de qualquer URL de website para Meta, Google e Stories.
BGRemover
Remova facilmente os fundos de imagens online com o SharkFoto BGRemover.
VoxDeck
Criador de apresentações com IA que lidera a revolução visual
Refly.ai
Refly.AI capacita criadores não técnicos a automatizar fluxos de trabalho usando linguagem natural e uma tela visual.
Elser AI
Estúdio web tudo‑em‑um que transforma texto e imagens em arte estilo anime, personagens, vozes e curtas‑metragem.
Qoder
Qoder é um assistente de codificação com IA que automatiza planejamento, codificação e testes para projetos de software.
Flowith
Flowith é um espaço de trabalho agêntico baseado em canvas que oferece gratuitamente 🍌Nano Banana Pro e outros modelos e
FineVoice
Transforme texto em emoção — Clone, desenhe e crie vozes de IA expressivas em segundos.
Skywork.ai
Skywork AI é uma ferramenta inovadora para aumentar a produtividade usando IA.
FixArt AI
FixArt AI oferece ferramentas de IA gratuitas e sem restrições para geração de imagens e vídeos sem necessidade de cadastro.
SharkFoto
SharkFoto é uma plataforma tudo-em-um com IA para criar e editar vídeos, imagens e música de forma eficiente.
Pippit
Eleve sua criação de conteúdo com as poderosas ferramentas de IA da Pippit!
Funy AI
Anime suas fantasias! Crie vídeos de beijos e biquínis com IA a partir de imagens ou texto. Experimente o trocador de ro
KiloClaw
Agente OpenClaw hospedado: implantação com um clique, mais de 500 modelos, infraestrutura segura e gerenciamento automatizado de agentes para equipes e desenvolvedores.
Yollo AI
Converse e crie com seu parceiro de IA. Vídeo a partir de imagem, gerador de imagens IA.
SuperMaker AI Video Generator
Crie vídeos, músicas e imagens incríveis sem esforço com o SuperMaker.
AI Clothes Changer by SharkFoto
AI Clothes Changer da SharkFoto permite que você experimente roupas virtualmente e instantaneamente, com caimento, textura e iluminação realistas.
AnimeShorts
Crie animações impressionantes de anime sem esforço com tecnologia de IA de última geração.
wan 2.7-image
Um gerador de imagens de IA controlável para rostos precisos, paletas, texto e continuidade visual.
AI Video API: Seedance 2.0 Here
API unificada de vídeo com IA que oferece modelos de última geração por uma única chave e a menor custo.
WhatsApp AI Sales
WABot é um copiloto de vendas com IA para WhatsApp que fornece scripts em tempo real, traduções e detecção de intenção.
insmelo AI Music Generator
Gerador de música movido por IA que transforma prompts, letras ou uploads em canções polidas e livres de royalties em cerca de um minuto.
BeatMV
Plataforma de IA baseada na web que transforma músicas em videoclipes cinematográficos e cria música com IA.
Wan 2.7
Modelo de vídeo AI de nível profissional com controle preciso de movimento e consistência multiview.
Kirkify
Kirkify AI cria instantaneamente memes virais de troca de rosto com estética neon-glitch assinada para criadores de memes.
UNI-1 AI
UNI-1 é um modelo unificado de geração de imagens que combina raciocínio visual com síntese de imagens de alta fidelidade.
Iara Chat
Iara Chat: Um assistente de produtividade e comunicação com inteligência artificial.
Text to Music
Transforme texto ou letras em músicas completas com qualidade de estúdio, com vocais gerados por IA, instrumentos e exportações multi-faixa.
kinovi - Seedance 2.0 - Real Man AI Video
Gerador de vídeo AI gratuito com saída humana realista, sem marca d'água e com direitos completos de uso comercial.
Video Sora 2
Sora 2 AI transforma texto ou imagens em vídeos curtos para redes sociais e e‑commerce, com movimento fisicamente preciso, em minutos.
Tome AI PPT
Criador de apresentações movido por IA que gera, embeleza e exporta slides profissionais em minutos.
Lyria3 AI
Gerador de música por IA que cria músicas totalmente produzidas e de alta fidelidade a partir de prompts de texto, letras e estilos instantaneamente.
Atoms
Plataforma orientada por IA que cria apps e sites full‑stack em minutos usando automação multi‑agente, sem necessidade de codificação.
AI Pet Video Generator
Crie vídeos de pets virais e fáceis de compartilhar a partir de fotos usando modelos orientados por IA e exportações HD instantâneas para plataformas sociais.
Paper Banana
Ferramenta com IA para converter texto acadêmico em diagramas metodológicos prontos para publicação e gráficos estatísticos precisos instantaneamente.
Ampere.SH
Hospedagem OpenClaw gerenciada gratuita. Implemente agentes de IA em 60 segundos com $500 em créditos Claude.
HookTide
Plataforma de crescimento no LinkedIn impulsionada por IA que aprende sua voz para criar conteúdo, engajar e analisar desempenho.
Hitem3D
Hitem3D converte uma única imagem em modelos 3D de alta resolução, prontos para produção, usando IA.
Palix AI
Plataforma de IA tudo‑em‑um para criadores, gerando imagens, vídeos e música com créditos unificados.
GenPPT.AI
Criador de PPT movido por IA que cria, embeleza e exporta apresentações profissionais do PowerPoint com notas do orador e gráficos em minutos.
Seedance 20 Video
Seedance 2 é um gerador de vídeo IA multimodal que oferece personagens consistentes, narrativa em múltiplas tomadas e áudio nativo em 2K.
Create WhatsApp Link
Gerador gratuito de links e QR do WhatsApp com análises, links com marca, roteamento e recursos de chat multi‑agente.
Gobii
Gobii permite que equipes criem trabalhadores digitais autônomos 24/7 para automatizar pesquisa na web e tarefas rotineiras.
Free AI Video Maker & Generator
Criador & Gerador de Vídeos com IA gratuito – Ilimitado, sem cadastro
Veemo - AI Video Generator
Veemo AI é uma plataforma tudo-em-um que gera rapidamente vídeos e imagens de alta qualidade a partir de texto ou imagens.
ainanobanana2
Nano Banana 2 gera imagens 4K de qualidade profissional em 4–6 segundos com renderização de texto precisa e consistência de assunto.
AI FIRST
Assistente conversacional de IA que automatiza pesquisa, tarefas no navegador, web scraping e gerenciamento de arquivos através de linguagem natural.
AirMusic
AirMusic.ai gera faixas musicais de IA de alta qualidade a partir de prompts de texto com personalização de estilo, humor e exportação de stems.
GLM Image
GLM Image combina modelos híbridos autorregressivos e de difusão para gerar imagens de IA de alta fidelidade com renderização de texto excepcional.
WhatsApp Warmup Tool
Ferramenta de aquecimento do WhatsApp com IA automatiza envio em massa enquanto evita banimentos de contas.
Manga Translator AI
AI Manga Translator traduz instantaneamente imagens de mangá para múltiplos idiomas online.
TextToHuman
Humanizador de IA gratuito que reescreve instantaneamente texto gerado por IA para uma escrita natural, parecida com a humana. Não é necessário cadastro.
Remy - Newsletter Summarizer
Remy automatiza a gestão de newsletters ao resumir e-mails em insights fáceis de digerir.
Telegram Group Bot
TGDesk é um bot tudo-em-um para grupos do Telegram para capturar leads, aumentar o engajamento e fazer comunidades crescerem.
FalcoCut
FalcoCut: plataforma de IA baseada na web para tradução de vídeo, vídeos com avatares, clonagem de voz, troca de rosto e geração de vídeos curtos.

GPT-5.3-Codex da OpenAI explora contratos inteligentes cripto com 72% de taxa de sucesso em novo benchmark de segurança

O mais recente modelo de IA da OpenAI demonstra uma capacidade alarmante de drenar carteiras de criptomoedas, explorando com sucesso contratos inteligentes vulneráveis em 72% dos testes.