home.social

#代碼驗證 — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #代碼驗證, aggregated by home.social.

  1. Sakana AI の間違いを徹底的に査読してみた (Colabコード付き)|しらいはかせ(AI研究/Hacker作家)

    Link
    📌 Summary: 本文探討了 Sakana AI 的 research paper "The AI CUDA Engineer" 及其發表的 CUDA 代碼,質疑其正當性和性能表現。透過仔細的檢查,發現 Sakana 版本的代碼存在「偷取影響」的可能性,即在計算過程中可能會誤讀 PyTorch 的結果,導致錯誤的運算結果同時顯示異常快速的運行速度。此外,作者還提出了改進過的 CUDA 實現,並通過多方比較驗證了其優勢,強調了自動化代碼生成與驗證的重要性。

    🎯 Key Points:
    - Sakana AI 宣稱其生成的 CUDA 代碼比 PyTorch 的本地實現要快,然而代碼中的不當處理可能導致錯誤結果。
    - 在檢查過程中,Sakana 的代碼在執行時可能會未經初始化地使用先前的內存數據。
    - 改進的 CUDA 代碼及 Gemini 版本被證實功能正常,且速度表現優於 Sakana 版本。
    - 自動化生成的 CUDA 代碼需要人類的仔細驗證,以確保結果的準確性和可靠性。
    - 本文最後指出,Sakana AI 的程序應對質疑保持透明並進行改進,以鞏固其在業界的信任。

    🔖 Keywords: #SakanaAI #CUDA #機器學習 #自動化 #代碼驗證