#evmbench — Public Fediverse posts
Live and recent posts from across the Fediverse tagged #evmbench, aggregated by home.social.
-
AI 에이전트, 스마트 컨트랙트 공격 72% 성공, EVMbench가 보여준 역설
OpenAI와 Paradigm이 공개한 EVMbench. AI 에이전트가 스마트 컨트랙트를 공격하는 능력이 방어보다 뛰어나다는 역설적 결과와 그 의미를 소개합니다. -
EVMbench misst die Sicherheit von Smart Contracts gegen KI-Agenten. GPT-5.3-Codex erreicht 72,2% Erfolgsquote beim Exploit, scheitert aber oft an der reinen Detektion im Quellcode. Interessant: Mit expliziten Hinweisen auf den Fehlerort steigt die Reparaturquote auf fast 94%. Die Architektur des Agenten wiegt hier schwerer als reine Modellgröße. #EVMbench #OpenAI #SmartContract
https://www.all-ai.de/news/beitrage2026/ki-agenten-evmbench