home.social

#coding-agents — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #coding-agents, aggregated by home.social.

fetched live
  1. Deutschland diskutiert weiter über KI Regulierung. Währenddessen bauen US Anbieter ihre Coding Agents tief in Entwicklungsprozesse ein. Regulierung ohne eigene Plattformen löst keine Abhängigkeit. #AI #CodingAgents #SoftwareEngineering #Digitalesouveränität #EU #Deutschland

  2. Deutschland diskutiert weiter über KI Regulierung. Währenddessen bauen US Anbieter ihre Coding Agents tief in Entwicklungsprozesse ein. Regulierung ohne eigene Plattformen löst keine Abhängigkeit. #AI #CodingAgents #SoftwareEngineering #Digitalesouveränität #EU #Deutschland

  3. Wenn #CodingAgents Personalkosten für die Entwicklung überschreiten darf sich nicht die Frage stellen, ob man Entwickler oder Agents einsetzt. Die Frage muss lauten, wann ist der Einsatz eines Agents wirtschaftlich und wann nicht. Ein wirtschaftlicher Agent-Run muss dabei günstiger, schnell oder besser als ein Entwickler abliefern. Dies einschätzen zu können wird eine der zentralen Skills in der #Softwareentwicklung werden. #ai #claude #openai #dev #devops

  4. Wenn #CodingAgents Personalkosten für die Entwicklung überschreiten darf sich nicht die Frage stellen, ob man Entwickler oder Agents einsetzt. Die Frage muss lauten, wann ist der Einsatz eines Agents wirtschaftlich und wann nicht. Ein wirtschaftlicher Agent-Run muss dabei günstiger, schnell oder besser als ein Entwickler abliefern. Dies einschätzen zu können wird eine der zentralen Skills in der #Softwareentwicklung werden. #ai #claude #openai #dev #devops

  5. Ein grüner Test hieß immer: Aufgabe gelöst. OpenAIs neues Modell GPT-5.6 Sol stellt das infrage. Die Prüforganisation METR fand die höchste Schummel-Rate, die sie je gemessen hat: Das Modell trickst die Testumgebung aus, statt das Problem zu lösen, und verwischt danach die Spuren.

    Was Reward Hacking ist, wie es Coding-Agenten betrifft und wie du es im Review erkennst:
    kiberblick.de/artikel/sicherhe
    #KI #KIberblick #CodingAgents #Testing

  6. Ein grüner Test hieß immer: Aufgabe gelöst. OpenAIs neues Modell GPT-5.6 Sol stellt das infrage. Die Prüforganisation METR fand die höchste Schummel-Rate, die sie je gemessen hat: Das Modell trickst die Testumgebung aus, statt das Problem zu lösen, und verwischt danach die Spuren.

    Was Reward Hacking ist, wie es Coding-Agenten betrifft und wie du es im Review erkennst:
    kiberblick.de/artikel/sicherhe
    #KI #KIberblick #CodingAgents #Testing

  7. We do not want to clean up slop! We are tired of it already! Millennium bug was an honest oversight and of course COBOL programmers were happy to pause their retirement and fix it. But slop is not an honest mistake. It is a systematic corporate malice! They have chosen slop over humans, they deserve to drown in slop!

    circumstances.run/@mawhrin/116

    #AI #noAI #LLM #LLMs #vibeCoding #codingAgents

  8. We do not want to clean up slop! We are tired of it already! Millennium bug was an honest oversight and of course COBOL programmers were happy to pause their retirement and fix it. But slop is not an honest mistake. It is a systematic corporate malice! They have chosen slop over humans, they deserve to drown in slop!

    circumstances.run/@mawhrin/116

    #AI #noAI #LLM #LLMs #vibeCoding #codingAgents

  9. "force your developers to use a model too weak for their tasks and you will create massive technical debt. Replacing a strong proprietary model with a cheap open-weight alternative risks a far greater drop in product quality than the cost saving justifies. Consult your internal experts, introduce rigorous evaluation pipelines, and rely on validated research and reliable benchmarks."

    msukhareva.substack.com/p/the-

    From Maria Sukhareva

    #ai #genAI #codingagents

  10. "force your developers to use a model too weak for their tasks and you will create massive technical debt. Replacing a strong proprietary model with a cheap open-weight alternative risks a far greater drop in product quality than the cost saving justifies. Consult your internal experts, introduce rigorous evaluation pipelines, and rely on validated research and reliable benchmarks."

    msukhareva.substack.com/p/the-

    From Maria Sukhareva

    #ai #genAI #codingagents

  11. Git Wok now has Agent Skills for AI-assisted multirepo workflows.

    If your AI coding agent is working in a wok-managed workspace, the skills teach it to use the `wok` CLI correctly for status, branch switching, updates, locking submodule state, pushing, and tagging across repos.

    Install:

    npx skills add codeberg.org/wok/skills.git

    Supports Cursor, Claude Code, Codex, Gemini CLI, OpenCode, and 65+ more agents.

    Docs: git-wok.dev/

  12. Git Wok now has Agent Skills for AI-assisted multirepo workflows.

    If your AI coding agent is working in a wok-managed workspace, the skills teach it to use the `wok` CLI correctly for status, branch switching, updates, locking submodule state, pushing, and tagging across repos.

    Install:

    npx skills add codeberg.org/wok/skills.git

    Supports Cursor, Claude Code, Codex, Gemini CLI, OpenCode, and 65+ more agents.

    Docs: git-wok.dev/

    #Git #AI #CodingAgents #Rust #CLI #Multirepo #GitWok

  13. Laguna M.1 (Poolside): arquitetura que sacrifica conhecimento geral por especialização em código (contexto 262K).

    • Novo: Otimização nativa para tool calling e latência de ~150ms TTFT (Tempo até ao Primeiro Token).

    • Comparação: Bate Gemini/Claude
    no SWE-bench (Resolved)(48.2%) e BFCL. Troca a versatilidade multimodal por execução determinística no terminal.

    🔗 poolside.ai/blog/introducing-l

    #MachineLearning #LLM #Laguna #SWEbench #CodingAgents #SOTA

  14. Laguna M.1 (Poolside): arquitetura que sacrifica conhecimento geral por especialização em código (contexto 262K).

    • Novo: Otimização nativa para tool calling e latência de ~150ms TTFT (Tempo até ao Primeiro Token).

    • Comparação: Bate Gemini/Claude
    no SWE-bench (Resolved)(48.2%) e BFCL. Troca a versatilidade multimodal por execução determinística no terminal.

    🔗 poolside.ai/blog/introducing-l

    #MachineLearning #LLM #Laguna #SWEbench #CodingAgents #SOTA

  15. #Microsoft shut down over 70 #GitHub #repositories, including those related to #Azure and #AI #codingagents, after a data breach. #Hackers planted #malware in the repositories, harvesting credentials when opened in AI coding tools like Claude Code and Gemini CLI. The breach is linked to a previous compromise of Microsoft’s durabletask by the group TeamPCP. 404media.co/microsoft-hacked-t #tech #media #news

  16. Workdash 0.3.0 is out.

    I made Workdash because don’t want to delegate work to agents elsewhere and chase updates.

    I want to collaborate on shared goals in the same workflow I use for my own work.

    amolnotes.substack.com/p/workd

  17. Workdash 0.3.0 is out.

    I made Workdash because don’t want to delegate work to agents elsewhere and chase updates.

    I want to collaborate on shared goals in the same workflow I use for my own work.

    amolnotes.substack.com/p/workd

    #AIAgents #CodingAgents #AgenticEngineering #DevTools

  18. My CLI logbasset already documents itself for AI agents through a `context` command — so why did I just add an installable agent skill too?

    Because self-documentation tells an agent *how* to use a tool. It doesn't make the agent *discover* it in the first place. Those are two different problems.

    I wrote about the distinction — and how to keep the skill thin enough that it never goes stale:

    andreagrandi.it/posts/why-add-

    #CLI #AItools #CodingAgents #ClaudeCode #golang #opensource

  19. My CLI logbasset already documents itself for AI agents through a `context` command — so why did I just add an installable agent skill too?

    Because self-documentation tells an agent *how* to use a tool. It doesn't make the agent *discover* it in the first place. Those are two different problems.

    I wrote about the distinction — and how to keep the skill thin enough that it never goes stale:

    andreagrandi.it/posts/why-add-

    #CLI #AItools #CodingAgents #ClaudeCode #golang #opensource

  20. A vibe coder doesn't want to be held accountable. Therefore, a vibe coder must never be allowed to contribute any code to critical infrastructure.

    #noAI #AI #artificialIntelligence #genAI #generativeAI #vibeCoding #codingAgent #codingAgents #codeGeneration #LLM

  21. Der Gartner Magic Quadrant für Enterprise AI Coding Agents ist draußen. Leaders: OpenAI, Anthropic, GitHub, Cursor. Kein einziger europäischer Anbieter unter den 12 bewerteten Vendors. Der nächste große #vendorlockin in der Softwareentwicklung baut sich gerade auf. Diesmal nicht bei Office-Suiten, sondern direkt im Engineering-Prozess. #codingagents #digitalesouveränität #ai #Digitalpolitik
    gartner.com/en/articles/enterp

  22. George Hotz nennt KI-Coding-Agenten "einen der teuersten Fehler" der Branchengeschichte. Wir haben seine These gegen die Studienlage gehalten: METR (minus 19% bei Profis) und Faros (Code-Churn +861%) stützen ihn, Spotify Honk und Karpathy widersprechen.

    Das Fazit: Es hängt an den Bedingungen, nicht am Werkzeug. Wie schon bei der Einführung von Agilität.

    kiberblick.de/aktuell/2026/202

    #KI #Softwareentwicklung #CodingAgents