OpenAI a dévoilé un cadre d'évaluation visant à mesurer l'efficacité avec laquelle les agents d'IA peuvent détecter, atténuer et même exploiter les vulnérabilités de sécurité dans la cryptoOpenAI a dévoilé un cadre d'évaluation visant à mesurer l'efficacité avec laquelle les agents d'IA peuvent détecter, atténuer et même exploiter les vulnérabilités de sécurité dans la crypto

OpenAI oppose des Agents d'IA les uns aux autres pour tester les Smart Contracts en mode Red-Team

2026/02/19 09:26
Temps de lecture : 9 min
Openai Pits Ai Agents Against Each Other To Red-Team Smart Contracts

OpenAI a dévoilé un cadre de référence visant à mesurer l'efficacité avec laquelle les Agents d'IA peuvent détecter, atténuer et même exploiter les vulnérabilités de sécurité dans les Smart Contract (Contrat Intelligent) crypto. Le projet, intitulé « EVMbench : Évaluation des Agents d'IA sur la sécurité des Smart Contract (Contrat Intelligent) », a été publié en collaboration avec Paradigm et OtterSec, deux organisations ayant une exposition approfondie à la sécurité blockchain et à l'investissement. L'étude évalue les Agents d'IA face à un ensemble organisé de 120 faiblesses potentielles issues de 40 Audit de smart contract, cherchant à quantifier non seulement les capacités de détection et de correction, mais aussi le potentiel d'exploitation théorique de ces agents dans un environnement contrôlé.

Points clés

  • EVMbench teste les Agents d'IA contre 120 vulnérabilités extraites de 40 Audit de smart contract, en mettant l'accent sur les vulnérabilités issues de compétitions d'audit open-source.
  • Parmi les modèles testés, Claude Opus 4.6 d'Anthropic a mené avec une récompense de détection moyenne de 37 824 $, suivi par OC-GPT-5.2 d'OpenAI à 31 623 $ et Gemini 3 Pro de Google à 25 112 $.
  • OpenAI présente le benchmark comme une étape vers la mesure des performances de l'IA dans des « environnements économiquement significatifs », et pas seulement des tâches fictives, soulignant les implications réelles pour les attaquants et les défenseurs dans le paysage de la sécurité crypto.
  • Les chercheurs notent que les Smart Contract (Contrat Intelligent) sécurisent des milliards de dollars d'actifs, soulignant la valeur stratégique des outils pilotés par l'IA pour les activités offensives et défensives.
  • Les observateurs de l'industrie ont lié ces développements à des discussions plus larges sur les paiements pilotés par l'IA et le rôle des Stablecoin dans les transactions quotidiennes, avec des dirigeants majeurs prédisant une utilisation agentique croissante dans les années à venir.
  • Le contexte de ce travail est souligné par les données d'incidents de sécurité crypto de 2025, qui montrent un Flux des capitaux continu à travers les vulnérabilités et les attaques, renforçant la demande de mécanismes d'audit et de défense robustes pilotés par l'IA.

Les récompenses de détection pour les Agents d'IA sont détaillées dans le PDF OpenAI accompagnant l'étude, qui décrit également la méthodologie d'évaluation et les scénarios utilisés pour simuler le risque réel des Smart Contract (Contrat Intelligent). Les auteurs soulignent que bien que les Agents d'IA aient évolué pour automatiser un large éventail de tâches routinières, l'évaluation de leurs performances dans des « environnements économiquement significatifs » est essentielle pour comprendre comment ils fonctionneront sous pression dans les systèmes de production.

OpenAI note qu'elle s'attend à ce que les technologies agentiques élargissent la portée des Paiement et du Règlement automatique, y compris les Stablecoin utilisés dans les flux de travail automatisés. La discussion autour des paiements pilotés par l'IA s'étend au-delà des tests de sécurité à la question plus large de la façon dont les systèmes autonomes participeront à l'activité financière quotidienne. Les propres projections de l'entreprise suggèrent que les paiements agentiques pourraient devenir plus courants, ancrant les capacités de l'IA dans des cas d'usage pratiques qui touchent les transactions quotidiennes des consommateurs.

Parallèlement aux résultats du benchmark, le PDG de Circle, Jeremy Allaire, a publiquement prévu que des milliards d'Agents d'IA pourraient effectuer des transactions avec des Stablecoin pour des paiements quotidiens d'ici cinq ans. Cette vision recoupe un thème récurrent dans les cercles crypto : le potentiel pour la crypto de devenir la monnaie native des Agents d'IA, un récit qui a gagné une attention notable de la part des leaders de l'industrie et des investisseurs. Bien que de telles prédictions restent spéculatives, la tendance sous-jacente est claire : l'automatisation de l'IA passe du laboratoire à la couche de transaction, où elle pourrait remodeler la façon dont la valeur circule à travers les réseaux.

L'étude arrive à un moment où la sécurité crypto continue d'être un facteur de risque important pour les investisseurs. Le point de données concernant l'assaut de 2025 sur les fonds crypto - où les attaquants ont retiré environ 3,4 milliards de dollars - souligne l'urgence d'outils améliorés et de mécanismes de correction plus rapides et plus fiables. Le cadre EVMbench est positionné, en partie, comme un moyen de mesurer si les Agents d'IA peuvent contribuer de manière significative aux capacités défensives à grande échelle, réduisant les opportunités d'exploitation et accélérant l'atténuation des menaces.

Pour construire le benchmark, les chercheurs se sont appuyés sur 120 vulnérabilités organisées couvrant 40 Audit de smart contract, avec de nombreuses faiblesses remontant aux défis d'audit open-source. OpenAI affirme que le benchmark aidera à suivre les progrès de l'IA dans la reconnaissance et l'atténuation des faiblesses au niveau des contrats à grande échelle, offrant un moyen standardisé de comparer les futurs modèles d'IA au fur et à mesure de leur évolution. L'étude fournit également un aperçu de la façon dont l'IA pourrait être appliquée à la normalisation de l'Évaluation des risques à travers un large éventail d'architectures de Smart Contract (Contrat Intelligent), plutôt que de se concentrer uniquement sur des cas isolés.

Les Smart Contract (Contrat Intelligent) n'ont pas été conçus pour les humains : Dragonfly

Dans un fil contemporain sur X, Haseeb Qureshi, un partenaire de Dragonfly, a soutenu que la promesse de la crypto de remplacer les droits de propriété et les contrats traditionnels ne s'est jamais matérialisée non pas parce que la technologie a échoué, mais parce qu'elle n'a jamais été conçue avec l'intuition humaine à l'esprit. Il a souligné la peur persistante associée à la signature de transactions importantes dans un environnement où les Portefeuille de vidange et autres vecteurs d'attaque restent une menace constante, en contraste frappant avec l'expérience comparativement plus fluide des Transfert bancaires traditionnels.

Qureshi soutient que la prochaine phase des transactions crypto pourrait être facilitée par des portefeuilles autonomes intermédiés par l'IA. Ces portefeuilles surveilleraient les risques, géreraient des opérations complexes et répondraient de manière autonome aux menaces au nom des utilisateurs, réduisant potentiellement les frictions et la peur qui caractérisent les grands transferts aujourd'hui.

La conclusion plus large de ce fil est que les Agents d'IA peuvent jouer un rôle critique dans la transformation de la façon dont les gens interagissent avec la crypto - passant de transactions manuelles sujettes aux erreurs à des processus automatisés conscients des risques qui peuvent évoluer avec l'adoption. Au fur et à mesure que les Agents d'IA commencent à démontrer plus de compétence dans la gestion des préoccupations de sécurité, les utilisateurs pourraient voir une fiabilité et une résilience améliorées dans les flux de travail de la DeFi / Finance Décentralisée, même si les technologies sous-jacentes continuent de mûrir.

Ce qu'il faut surveiller ensuite

  • Publication et réplication indépendante de l'ensemble de données EVMbench complet à travers des modèles et architectures d'IA supplémentaires.
  • Adoption plus large des flux de travail d'audit assistés par l'IA par les auditeurs, les échanges et les projets DeFi / Finance Décentralisée cherchant à renforcer les postures de sécurité.
  • Explorations des portefeuilles agentiques et des flux de Paiement autonomes, y compris les considérations réglementaires et de conformité pour les actifs gérés par l'IA.
  • Benchmarks de suivi comparant davantage de systèmes d'IA au fur et à mesure du déploiement de nouvelles versions, suivant les améliorations de la précision de détection et de la vitesse de correction.

Sources et vérification

  • OpenAI : EVMbench : Évaluation des Agents d'IA sur la sécurité des Smart Contract (Contrat Intelligent) — PDF : https://cdn.openai.com/evmbench/evmbench.pdf
  • OpenAI : Présentation d'EVMbench — https://openai.com/index/introducing-evmbench/
  • Pertes de sécurité crypto en 2025 (couverture de reportage) : https://cointelegraph.com/news/crypto-3-4-billion-losses-2025-wallet-hacks
  • Dragonfly : Haseeb Qureshi sur l'IA et l'UX crypto (publication X) : https://x.com/hosseeb/status/2024136762424185208
  • L'avance de la Chine en IA et les implications crypto (analyse) : https://cointelegraph.com/news/china-ai-lead-future
  • AI Eye — IronClaw et développements de bots IA dans la couverture Polymarket : https://cointelegraph.com/magazine/ironclaw-secure-private-sounds-cooler-openclaw-ai-eye/

Chiffres clés et prochaines étapes

L'étude EVMbench démontre que les grands modèles de langage et les Agents d'IA associés commencent à effectuer un travail de sécurité significatif dans l'espace des Smart Contract (Contrat Intelligent), avec des différences clairement quantifiables entre les modèles. L'avance de Claude Opus 4.6 dans les récompenses de détection moyennes signale que certaines architectures peuvent être plus aptes à repérer et atténuer les vulnérabilités dans la logique de contrat complexe, tandis que d'autres sont à la traîne, offrant un spectre de capacités que les chercheurs voudront probablement affiner. L'inclusion de multiples partenariats industriels dans le projet souligne le consensus croissant selon lequel la sécurité pilotée par l'IA et la Gestion des risques automatisée pourraient devenir essentielles pour évoluer dans des environnements décentralisés.

Au fur et à mesure que le domaine évolue, les observateurs surveilleront la rapidité avec laquelle les Agents d'IA peuvent passer de la détection à la remédiation, et si ces agents peuvent fonctionner de manière fiable dans des systèmes en direct sans introduire de nouveaux risques. La conversation sur les portefeuilles pilotés par l'IA et les paiements autonomes touche à un ensemble plus large de questions autour de la gouvernance de la sécurité, du consentement des utilisateurs et de l'alignement réglementaire. Si la trajectoire suggérée par OpenAI et ses partenaires se poursuit, les outils assistés par l'IA pourraient devenir un composant essentiel de la future infrastructure crypto, changeant à la fois le calcul des risques et l'expérience utilisateur de manière significative. La prochaine série de benchmarks, aux côtés des déploiements réels, aidera à déterminer à quelle vitesse cette vision se matérialise et quelles garanties doivent l'accompagner.

Cet article a été publié à l'origine sous le titre OpenAI Pits AI Agents Against Each Other to Red-Team Smart Contracts sur Crypto Breaking News - votre source de confiance pour les actualités crypto, les actualités Bitcoin et les mises à jour blockchain.

Opportunité de marché
Logo de Smart Blockchain
Cours Smart Blockchain(SMART)
$0.004387
$0.004387$0.004387
-2.14%
USD
Graphique du prix de Smart Blockchain (SMART) en temps réel
Clause de non-responsabilité : les articles republiés sur ce site proviennent de plateformes publiques et sont fournis à titre informatif uniquement. Ils ne reflètent pas nécessairement les opinions de MEXC. Tous les droits restent la propriété des auteurs d'origine. Si vous estimez qu'un contenu porte atteinte aux droits d'un tiers, veuillez contacter service@support.mexc.com pour demander sa suppression. MEXC ne garantit ni l'exactitude, ni l'exhaustivité, ni l'actualité des contenus, et décline toute responsabilité quant aux actions entreprises sur la base des informations fournies. Ces contenus ne constituent pas des conseils financiers, juridiques ou professionnels, et ne doivent pas être interprétés comme une recommandation ou une approbation de la part de MEXC.