home.social

#claude — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #claude, aggregated by home.social.

  1. Codex 5.3 vs Claude Opus 4.6 на реальном Java-монолите

    Я сравнил Codex 5.3, Claude Opus 4.6 и GPT-5.5 на реальном многомодульном Java-монолите: скопировал проект в отдельные ветки, дал агентам похожие задачи и прогнал их через цикл правок, ревью и e2e-тестов. Результат: чем дешевле - тем лучше результат.

    habr.com/ru/articles/1034452/

    #Codex #Claude #GPT55 #AIагенты #вайбкодинг #Java #Spring_AI #Telegramбот #LLM #ReAct

  2. You asked for it.

    "After burning through our reader's AWS Activate credits (totaling $8,026.54 in this case), Amazon started charging for model inference on the Bedrock Marketplace, racking up $30,141.33, plus another $675.07 in AWS infrastructure charges, without a peep from the CAD service."

    The Register: Amazon Bedrock and a hard place: Claude adventure leaves AWS user staring down $30K invoice theregister.com/saas/2026/05/1 @theregister #Anthropic #Claude #Amazon

  3. You asked for it.

    "After burning through our reader's AWS Activate credits (totaling $8,026.54 in this case), Amazon started charging for model inference on the Bedrock Marketplace, racking up $30,141.33, plus another $675.07 in AWS infrastructure charges, without a peep from the CAD service."

    The Register: Amazon Bedrock and a hard place: Claude adventure leaves AWS user staring down $30K invoice theregister.com/saas/2026/05/1 @theregister #Anthropic #Claude #Amazon

  4. You asked for it.

    "After burning through our reader's AWS Activate credits (totaling $8,026.54 in this case), Amazon started charging for model inference on the Bedrock Marketplace, racking up $30,141.33, plus another $675.07 in AWS infrastructure charges, without a peep from the CAD service."

    The Register: Amazon Bedrock and a hard place: Claude adventure leaves AWS user staring down $30K invoice theregister.com/saas/2026/05/1 @theregister #Anthropic #Claude #Amazon

  5. You asked for it.

    "After burning through our reader's AWS Activate credits (totaling $8,026.54 in this case), Amazon started charging for model inference on the Bedrock Marketplace, racking up $30,141.33, plus another $675.07 in AWS infrastructure charges, without a peep from the CAD service."

    The Register: Amazon Bedrock and a hard place: Claude adventure leaves AWS user staring down $30K invoice theregister.com/saas/2026/05/1 @theregister #Anthropic #Claude #Amazon

  6. You asked for it.

    "After burning through our reader's AWS Activate credits (totaling $8,026.54 in this case), Amazon started charging for model inference on the Bedrock Marketplace, racking up $30,141.33, plus another $675.07 in AWS infrastructure charges, without a peep from the CAD service."

    The Register: Amazon Bedrock and a hard place: Claude adventure leaves AWS user staring down $30K invoice theregister.com/saas/2026/05/1 @theregister #Anthropic #Claude #Amazon

  7. Me han pasado en petit comité las cifras de gasto que nuestra empresa esta teniendo con #Claude de #Anthropic (el gasto de #Copilot va aparte). Hay usuarios que se están puliendo mil chuchas AL DÍA. Y la proyección de gasto para este mes de mayo es de más de 150k 🙈

    Gran éxito, a ver como justifican que ese palo a los presupuestos se traduce en que la empresa va a ganar más sin recurrir a despidos. Todo el mundo con el que he hablado está más quemado que el guante de un bombero. La #IA solo nos está ayudando a resolver problemas que ha generado ella misma y los equipos en vez de trabajar menos o mejor, curran más solo para seguirle el ritmo a lo que escupe la máquina tragaperras de código.

    Nadie al volante. No sé qué métricas estarán usando pero yo desde el escalafón de abajo no me salen las cuentas. Y solo me lo explico si alguien se lo está llevando calentito a su bolsillo.

  8. For context:

    We went from “cannot understand the difference between C and PHP” to “can sometimes write a valid function” to “works reasonably well to work on single files” to “can build a full greenfield app but needs extensive guidance on architecture and APIs” to “can build a full app with an engineer in the loop and build on top of it for a few weeks” to “decent at architecture and can build smaller systems without guidance” in 3 years.

    But when I was trying to talk about labor issues and it being a paradigm shift for the industry at large, the standard response was that I was deluded and spreading FUD. The take that the tools are useless has been constant too, except the goal posts constantly move to whatever the current state of the art. Another take that never dies is that using llm based tools somehow can’t involve skill, that there is no difference between the prompting of an experienced software engineer who has spent years working with llms and the 3 prompts one has put into a random model “to try things out”. Imagine someone coming to like Elixir from Java, typing a few classes in Java, runs it and gets errors and say “elixir is kinda useless, all I got to run was this super barebones program after 17 tries and lots of compile errors”.

    Whether one like using these tools or not (especially if you don’t like them), and especially if you are relatively new to them, spend just a few minutes or hours to compare how far you get with llama (the OG) and pure copy paste by hand, to a newer 8B model in an agent harness, to a model like glm5.1 to gpt5.5 or opus4.6 in a harness.

    That’s the last 2 years in a bottle.

  9. For context:

    We went from “cannot understand the difference between C and PHP” to “can sometimes write a valid function” to “works reasonably well to work on single files” to “can build a full greenfield app but needs extensive guidance on architecture and APIs” to “can build a full app with an engineer in the loop and build on top of it for a few weeks” to “decent at architecture and can build smaller systems without guidance” in 3 years.

    But when I was trying to talk about labor issues and it being a paradigm shift for the industry at large, the standard response was that I was deluded and spreading FUD. The take that the tools are useless has been constant too, except the goal posts constantly move to whatever the current state of the art. Another take that never dies is that using llm based tools somehow can’t involve skill, that there is no difference between the prompting of an experienced software engineer who has spent years working with llms and the 3 prompts one has put into a random model “to try things out”. Imagine someone coming to like Elixir from Java, typing a few classes in Java, runs it and gets errors and say “elixir is kinda useless, all I got to run was this super barebones program after 17 tries and lots of compile errors”.

    Whether one like using these tools or not (especially if you don’t like them), and especially if you are relatively new to them, spend just a few minutes or hours to compare how far you get with llama (the OG) and pure copy paste by hand, to a newer 8B model in an agent harness, to a model like glm5.1 to gpt5.5 or opus4.6 in a harness.

    That’s the last 2 years in a bottle.

    #llm #llms #genai #claude #vibecoding

  10. For context:

    We went from “cannot understand the difference between C and PHP” to “can sometimes write a valid function” to “works reasonably well to work on single files” to “can build a full greenfield app but needs extensive guidance on architecture and APIs” to “can build a full app with an engineer in the loop and build on top of it for a few weeks” to “decent at architecture and can build smaller systems without guidance” in 3 years.

    But when I was trying to talk about labor issues and it being a paradigm shift for the industry at large, the standard response was that I was deluded and spreading FUD. The take that the tools are useless has been constant too, except the goal posts constantly move to whatever the current state of the art. Another take that never dies is that using llm based tools somehow can’t involve skill, that there is no difference between the prompting of an experienced software engineer who has spent years working with llms and the 3 prompts one has put into a random model “to try things out”. Imagine someone coming to like Elixir from Java, typing a few classes in Java, runs it and gets errors and say “elixir is kinda useless, all I got to run was this super barebones program after 17 tries and lots of compile errors”.

    Whether one like using these tools or not (especially if you don’t like them), and especially if you are relatively new to them, spend just a few minutes or hours to compare how far you get with llama (the OG) and pure copy paste by hand, to a newer 8B model in an agent harness, to a model like glm5.1 to gpt5.5 or opus4.6 in a harness.

    That’s the last 2 years in a bottle.

    #llm #llms #genai #claude #vibecoding

  11. For context:

    We went from “cannot understand the difference between C and PHP” to “can sometimes write a valid function” to “works reasonably well to work on single files” to “can build a full greenfield app but needs extensive guidance on architecture and APIs” to “can build a full app with an engineer in the loop and build on top of it for a few weeks” to “decent at architecture and can build smaller systems without guidance” in 3 years.

    But when I was trying to talk about labor issues and it being a paradigm shift for the industry at large, the standard response was that I was deluded and spreading FUD. The take that the tools are useless has been constant too, except the goal posts constantly move to whatever the current state of the art. Another take that never dies is that using llm based tools somehow can’t involve skill, that there is no difference between the prompting of an experienced software engineer who has spent years working with llms and the 3 prompts one has put into a random model “to try things out”. Imagine someone coming to like Elixir from Java, typing a few classes in Java, runs it and gets errors and say “elixir is kinda useless, all I got to run was this super barebones program after 17 tries and lots of compile errors”.

    Whether one like using these tools or not (especially if you don’t like them), and especially if you are relatively new to them, spend just a few minutes or hours to compare how far you get with llama (the OG) and pure copy paste by hand, to a newer 8B model in an agent harness, to a model like glm5.1 to gpt5.5 or opus4.6 in a harness.

    That’s the last 2 years in a bottle.

    #llm #llms #genai #claude #vibecoding

  12. For context:

    We went from “cannot understand the difference between C and PHP” to “can sometimes write a valid function” to “works reasonably well to work on single files” to “can build a full greenfield app but needs extensive guidance on architecture and APIs” to “can build a full app with an engineer in the loop and build on top of it for a few weeks” to “decent at architecture and can build smaller systems without guidance” in 3 years.

    But when I was trying to talk about labor issues and it being a paradigm shift for the industry at large, the standard response was that I was deluded and spreading FUD. The take that the tools are useless has been constant too, except the goal posts constantly move to whatever the current state of the art. Another take that never dies is that using llm based tools somehow can’t involve skill, that there is no difference between the prompting of an experienced software engineer who has spent years working with llms and the 3 prompts one has put into a random model “to try things out”. Imagine someone coming to like Elixir from Java, typing a few classes in Java, runs it and gets errors and say “elixir is kinda useless, all I got to run was this super barebones program after 17 tries and lots of compile errors”.

    Whether one like using these tools or not (especially if you don’t like them), and especially if you are relatively new to them, spend just a few minutes or hours to compare how far you get with llama (the OG) and pure copy paste by hand, to a newer 8B model in an agent harness, to a model like glm5.1 to gpt5.5 or opus4.6 in a harness.

    That’s the last 2 years in a bottle.

    #llm #llms #genai #claude #vibecoding

  13. Ищем самый быстрый XML парсер для Apple платформы с помощью ИИ

    Нет, это не déjà vu, это продолжение моей прошлой статьи Самый быстрый XML парсер для iOS в 2026 году? Чтобы вам не тратить время на ее чтение, вот краткий пересказ. В прошлой статье происходит поиск самого быстрого XML парсера со следующими характиристиками: Для Apple платформы (iOS, tvOS, macOS) Язык Objective-C или Swift GitHub как источник исходников Популярный (хотя бы больше 500 звезд) Любая интеграция (CocoaPods, SwiftPM) И самое важное, весь бенчмарк я писал сам с небольшой помощью ИИ, не спеша, под несколько чашечек кофе за 3 часа я нашел нужный мне XML парсер. Спустя пару месяцев после выхода первой статьи, мне пришла мысль, зачем я тратил 3 часа на эту задачу, если можно было просто это самое задание “скормить” ИИшке и она бы за 5 минут решила бы ее (так пишут в интернетах). Тут же пришла вторая идея. Так как у меня есть мною лично проверенный результат, то я могу загрузить этой задачей все популярные ИИ и их результаты сравнить со своим. Даже не исключаю, что у меня где-то есть ошибка и тогда рейтинг парсеров будет выглядеть совсем иначе и я выбрал не самый быстрый как хотел. Собственно, что я и сделал. Загнал задачу в топ 15 ИИ и сравнил их результаты со своим. Если вам интересно, кто справился с задачей, кто спасовал, будет описано в развернутой статье под катом. Для затравки, наихудший результат и последнее место занимает GPT 5.5 Pro. А Claude Opus 4.7 не смог взять первое место.

    habr.com/ru/articles/1035210/

    #ииагенты #swift #xcode #claude #gpt #gemini

  14. Ищем самый быстрый XML парсер для Apple платформы с помощью ИИ

    Нет, это не déjà vu, это продолжение моей прошлой статьи Самый быстрый XML парсер для iOS в 2026 году? Чтобы вам не тратить время на ее чтение, вот краткий пересказ. В прошлой статье происходит поиск самого быстрого XML парсера со следующими характиристиками: Для Apple платформы (iOS, tvOS, macOS) Язык Objective-C или Swift GitHub как источник исходников Популярный (хотя бы больше 500 звезд) Любая интеграция (CocoaPods, SwiftPM) И самое важное, весь бенчмарк я писал сам с небольшой помощью ИИ, не спеша, под несколько чашечек кофе за 3 часа я нашел нужный мне XML парсер. Спустя пару месяцев после выхода первой статьи, мне пришла мысль, зачем я тратил 3 часа на эту задачу, если можно было просто это самое задание “скормить” ИИшке и она бы за 5 минут решила бы ее (так пишут в интернетах). Тут же пришла вторая идея. Так как у меня есть мною лично проверенный результат, то я могу загрузить этой задачей все популярные ИИ и их результаты сравнить со своим. Даже не исключаю, что у меня где-то есть ошибка и тогда рейтинг парсеров будет выглядеть совсем иначе и я выбрал не самый быстрый как хотел. Собственно, что я и сделал. Загнал задачу в топ 15 ИИ и сравнил их результаты со своим. Если вам интересно, кто справился с задачей, кто спасовал, будет описано в развернутой статье под катом. Для затравки, наихудший результат и последнее место занимает GPT 5.5 Pro. А Claude Opus 4.7 не смог взять первое место.

    habr.com/ru/articles/1035210/

    #ииагенты #swift #xcode #claude #gpt #gemini

  15. Ищем самый быстрый XML парсер для Apple платформы с помощью ИИ

    Нет, это не déjà vu, это продолжение моей прошлой статьи Самый быстрый XML парсер для iOS в 2026 году? Чтобы вам не тратить время на ее чтение, вот краткий пересказ. В прошлой статье происходит поиск самого быстрого XML парсера со следующими характиристиками: Для Apple платформы (iOS, tvOS, macOS) Язык Objective-C или Swift GitHub как источник исходников Популярный (хотя бы больше 500 звезд) Любая интеграция (CocoaPods, SwiftPM) И самое важное, весь бенчмарк я писал сам с небольшой помощью ИИ, не спеша, под несколько чашечек кофе за 3 часа я нашел нужный мне XML парсер. Спустя пару месяцев после выхода первой статьи, мне пришла мысль, зачем я тратил 3 часа на эту задачу, если можно было просто это самое задание “скормить” ИИшке и она бы за 5 минут решила бы ее (так пишут в интернетах). Тут же пришла вторая идея. Так как у меня есть мною лично проверенный результат, то я могу загрузить этой задачей все популярные ИИ и их результаты сравнить со своим. Даже не исключаю, что у меня где-то есть ошибка и тогда рейтинг парсеров будет выглядеть совсем иначе и я выбрал не самый быстрый как хотел. Собственно, что я и сделал. Загнал задачу в топ 15 ИИ и сравнил их результаты со своим. Если вам интересно, кто справился с задачей, кто спасовал, будет описано в развернутой статье под катом. Для затравки, наихудший результат и последнее место занимает GPT 5.5 Pro. А Claude Opus 4.7 не смог взять первое место.

    habr.com/ru/articles/1035210/

    #ииагенты #swift #xcode #claude #gpt #gemini

  16. Ищем самый быстрый XML парсер для Apple платформы с помощью ИИ

    Нет, это не déjà vu, это продолжение моей прошлой статьи Самый быстрый XML парсер для iOS в 2026 году? Чтобы вам не тратить время на ее чтение, вот краткий пересказ. В прошлой статье происходит поиск самого быстрого XML парсера со следующими характиристиками: Для Apple платформы (iOS, tvOS, macOS) Язык Objective-C или Swift GitHub как источник исходников Популярный (хотя бы больше 500 звезд) Любая интеграция (CocoaPods, SwiftPM) И самое важное, весь бенчмарк я писал сам с небольшой помощью ИИ, не спеша, под несколько чашечек кофе за 3 часа я нашел нужный мне XML парсер. Спустя пару месяцев после выхода первой статьи, мне пришла мысль, зачем я тратил 3 часа на эту задачу, если можно было просто это самое задание “скормить” ИИшке и она бы за 5 минут решила бы ее (так пишут в интернетах). Тут же пришла вторая идея. Так как у меня есть мною лично проверенный результат, то я могу загрузить этой задачей все популярные ИИ и их результаты сравнить со своим. Даже не исключаю, что у меня где-то есть ошибка и тогда рейтинг парсеров будет выглядеть совсем иначе и я выбрал не самый быстрый как хотел. Собственно, что я и сделал. Загнал задачу в топ 15 ИИ и сравнил их результаты со своим. Если вам интересно, кто справился с задачей, кто спасовал, будет описано в развернутой статье под катом. Для затравки, наихудший результат и последнее место занимает GPT 5.5 Pro. А Claude Opus 4.7 не смог взять первое место.

    habr.com/ru/articles/1035210/

    #ииагенты #swift #xcode #claude #gpt #gemini

  17. 【Claude Mythosがまた進化】三菱UFJ・みずほ・三井住友がアクセス権入手へ「でも必要な会社はまだある」/GPT-5.5も猛追/“プロ超え”のサイバー攻撃が誰でも可能に【1on1 Tech】 | TBS CROSS DIG with Bloomberg yayafa.com/2800389/ #AgenticAi #AI #Anthropic #AnthropicClaude #ArtificialGeneralIntelligence #ArtificialIntelligence #claude #エージェント型AI #人工知能 #汎用人工知能

  18. 【Claude Mythosがまた進化】三菱UFJ・みずほ・三井住友がアクセス権入手へ「でも必要な会社はまだある」/GPT-5.5も猛追/“プロ超え”のサイバー攻撃が誰でも可能に【1on1 Tech】 | TBS CROSS DIG with Bloomberg yayafa.com/2800389/ #AgenticAi #AI #Anthropic #AnthropicClaude #ArtificialGeneralIntelligence #ArtificialIntelligence #claude #エージェント型AI #人工知能 #汎用人工知能

  19. 【Claude Mythosがまた進化】三菱UFJ・みずほ・三井住友がアクセス権入手へ「でも必要な会社はまだある」/GPT-5.5も猛追/“プロ超え”のサイバー攻撃が誰でも可能に【1on1 Tech】 | TBS CROSS DIG with Bloomberg yayafa.com/2800389/ #AgenticAi #AI #Anthropic #AnthropicClaude #ArtificialGeneralIntelligence #ArtificialIntelligence #claude #エージェント型AI #人工知能 #汎用人工知能

  20. 【Claude Mythosがまた進化】三菱UFJ・みずほ・三井住友がアクセス権入手へ「でも必要な会社はまだある」/GPT-5.5も猛追/“プロ超え”のサイバー攻撃が誰でも可能に【1on1 Tech】 | TBS CROSS DIG with Bloomberg yayafa.com/2800389/ #AgenticAi #AI #Anthropic #AnthropicClaude #ArtificialGeneralIntelligence #ArtificialIntelligence #claude #エージェント型AI #人工知能 #汎用人工知能

  21. The Vice-Chair of the Supervisory Board of the European Central Bank, urged euro area banks to quickly prepare for cyberattacks launched with the help of Anthropic's Mythos AI model or similar tools. Most EU banks have no access to Mythos. This is no excuse for inaction. The intervention turns AI cybersecurity from a corporate IT concern into a bank supervisory one.

    builtineu.eu/news/ecb-mythos-a

    #ECB #Cybersecurity #Banking #AI #claude #EUTech

  22. The Vice-Chair of the Supervisory Board of the European Central Bank, urged euro area banks to quickly prepare for cyberattacks launched with the help of Anthropic's Mythos AI model or similar tools. Most EU banks have no access to Mythos. This is no excuse for inaction. The intervention turns AI cybersecurity from a corporate IT concern into a bank supervisory one.

    builtineu.eu/news/ecb-mythos-a

    #ECB #Cybersecurity #Banking #AI #claude #EUTech

  23. The Vice-Chair of the Supervisory Board of the European Central Bank, urged euro area banks to quickly prepare for cyberattacks launched with the help of Anthropic's Mythos AI model or similar tools. Most EU banks have no access to Mythos. This is no excuse for inaction. The intervention turns AI cybersecurity from a corporate IT concern into a bank supervisory one.

    builtineu.eu/news/ecb-mythos-a

    #ECB #Cybersecurity #Banking #AI #claude #EUTech

  24. The Vice-Chair of the Supervisory Board of the European Central Bank, urged euro area banks to quickly prepare for cyberattacks launched with the help of Anthropic's Mythos AI model or similar tools. Most EU banks have no access to Mythos. This is no excuse for inaction. The intervention turns AI cybersecurity from a corporate IT concern into a bank supervisory one.

    builtineu.eu/news/ecb-mythos-a

    #ECB #Cybersecurity #Banking #AI #claude #EUTech

  25. The Vice-Chair of the Supervisory Board of the European Central Bank, urged euro area banks to quickly prepare for cyberattacks launched with the help of Anthropic's Mythos AI model or similar tools. Most EU banks have no access to Mythos. This is no excuse for inaction. The intervention turns AI cybersecurity from a corporate IT concern into a bank supervisory one.

    builtineu.eu/news/ecb-mythos-a

    #ECB #Cybersecurity #Banking #AI #claude #EUTech

  26. #wtf they rewrote #bun in #rust using an #llm: github.com/oven-sh/bun/pull/30

    only one month after we saw the #claude sacrifice to the spaghetti monster from the leaked code of #anthropic.

    of course the testuite passes with sleep(1) fixes: github.com/oven-sh/bun/pull/30

    we need to open the strait of hormuz for strategic popcorn reserves...

    1M LoC change merged. m(

  27. #wtf they rewrote #bun in #rust using an #llm: github.com/oven-sh/bun/pull/30

    only one month after we saw the #claude sacrifice to the spaghetti monster from the leaked code of #anthropic.

    of course the testuite passes with sleep(1) fixes: github.com/oven-sh/bun/pull/30

    we need to open the strait of hormuz for strategic popcorn reserves...

    1M LoC change merged. m(

  28. #wtf they rewrote #bun in #rust using an #llm: github.com/oven-sh/bun/pull/30

    only one month after we saw the #claude sacrifice to the spaghetti monster from the leaked code of #anthropic.

    of course the testuite passes with sleep(1) fixes: github.com/oven-sh/bun/pull/30

    we need to open the strait of hormuz for strategic popcorn reserves...

    1M LoC change merged. m(

  29. #wtf they rewrote #bun in #rust using an #llm: github.com/oven-sh/bun/pull/30

    only one month after we saw the #claude sacrifice to the spaghetti monster from the leaked code of #anthropic.

    of course the testuite passes with sleep(1) fixes: github.com/oven-sh/bun/pull/30

    we need to open the strait of hormuz for strategic popcorn reserves...

    1M LoC change merged. m(

  30. #wtf they rewrote #bun in #rust using an #llm: github.com/oven-sh/bun/pull/30

    only one month after we saw the #claude sacrifice to the spaghetti monster from the leaked code of #anthropic.

    of course the testuite passes with sleep(1) fixes: github.com/oven-sh/bun/pull/30

    we need to open the strait of hormuz for strategic popcorn reserves...

    1M LoC change merged. m(