home.social

#evmbench — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #evmbench, aggregated by home.social.

  1. AI 에이전트, 스마트 컨트랙트 공격 72% 성공, EVMbench가 보여준 역설

    OpenAI와 Paradigm이 공개한 EVMbench. AI 에이전트가 스마트 컨트랙트를 공격하는 능력이 방어보다 뛰어나다는 역설적 결과와 그 의미를 소개합니다.

    aisparkup.com/posts/9578

  2. EVMbench misst die Sicherheit von Smart Contracts gegen KI-Agenten. GPT-5.3-Codex erreicht 72,2% Erfolgsquote beim Exploit, scheitert aber oft an der reinen Detektion im Quellcode. Interessant: Mit expliziten Hinweisen auf den Fehlerort steigt die Reparaturquote auf fast 94%. Die Architektur des Agenten wiegt hier schwerer als reine Modellgröße. #EVMbench #OpenAI #SmartContract
    all-ai.de/news/beitrage2026/ki