home.social

#openrouter — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #openrouter, aggregated by home.social.

  1. Агрегатор LLM, как выбирать живые free-модели и переживать сбои провайдера

    Если в проекте появляется выбор LLM, почти сразу возникает соблазн сделать это как можно проще. Взять один большой список моделей, показать его в интерфейсе, выбрать первую free-модель по умолчанию и считать задачу закрытой. На короткой дистанции это выглядит рабочим вариантом. На длинной начинает ломаться сразу в нескольких местах. Часть моделей числится бесплатными, но отвечает нестабильно. Часть внезапно исчезает из выдачи провайдера. Часть формально жива, но по качеству ответа годится только для демо. Иногда пользователь выбрал одну модель, а провайдер вернул ошибку. Иногда ответ пришел, но уже от другой модели. Иногда список моделей на фронте устарел, а backend уже живет в другой реальности. То есть проблема тут не в том, как красиво показать список LLM. Проблема в том, как построить агрегатор, который умеет выбирать живые free-модели, переживать сбои провайдера и не врать интерфейсу о том, какая модель реально ответила. В одном из своих проектов эта задача решалась не через бесконечный каталог моделей, а через более жесткий инженерный контур. Backend получает сырой список моделей от провайдера, очищает его, отбирает только подходящие free-варианты, оставляет по одной модели на бренд, отдает этот набор на фронт, а во время реального запроса умеет сделать fallback на модель другого бренда. При этом в ответе возвращается не только текст, но и actual_model , чтобы интерфейс знал, кто реально сгенерировал результат.

    habr.com/ru/articles/1033790/

    #LLM #OpenRouter #Django #Python #Nextjs #TypeScript #RTK_Query #AI #API #Fullstack

  2. Агрегатор LLM, как выбирать живые free-модели и переживать сбои провайдера

    Если в проекте появляется выбор LLM, почти сразу возникает соблазн сделать это как можно проще. Взять один большой список моделей, показать его в интерфейсе, выбрать первую free-модель по умолчанию и считать задачу закрытой. На короткой дистанции это выглядит рабочим вариантом. На длинной начинает ломаться сразу в нескольких местах. Часть моделей числится бесплатными, но отвечает нестабильно. Часть внезапно исчезает из выдачи провайдера. Часть формально жива, но по качеству ответа годится только для демо. Иногда пользователь выбрал одну модель, а провайдер вернул ошибку. Иногда ответ пришел, но уже от другой модели. Иногда список моделей на фронте устарел, а backend уже живет в другой реальности. То есть проблема тут не в том, как красиво показать список LLM. Проблема в том, как построить агрегатор, который умеет выбирать живые free-модели, переживать сбои провайдера и не врать интерфейсу о том, какая модель реально ответила. В одном из своих проектов эта задача решалась не через бесконечный каталог моделей, а через более жесткий инженерный контур. Backend получает сырой список моделей от провайдера, очищает его, отбирает только подходящие free-варианты, оставляет по одной модели на бренд, отдает этот набор на фронт, а во время реального запроса умеет сделать fallback на модель другого бренда. При этом в ответе возвращается не только текст, но и actual_model , чтобы интерфейс знал, кто реально сгенерировал результат.

    habr.com/ru/articles/1033790/

    #LLM #OpenRouter #Django #Python #Nextjs #TypeScript #RTK_Query #AI #API #Fullstack

  3. AI Review не делает код лучше. И вот почему

    Я делал AI Review как простой инженерный инструмент. Но реальный фейл оказался не в архитектуре и не в LLM — а в том, чего люди от него ждали.

    habr.com/ru/articles/979862/

    #ai_review #code_review #llm #cicd #chatgpt #claude #gemini #openrouter #gitlab #github

  4. AI Review не делает код лучше. И вот почему

    Я делал AI Review как простой инженерный инструмент. Но реальный фейл оказался не в архитектуре и не в LLM — а в том, чего люди от него ждали.

    habr.com/ru/articles/979862/

    #ai_review #code_review #llm #cicd #chatgpt #claude #gemini #openrouter #gitlab #github

  5. AI Review не делает код лучше. И вот почему

    Я делал AI Review как простой инженерный инструмент. Но реальный фейл оказался не в архитектуре и не в LLM — а в том, чего люди от него ждали.

    habr.com/ru/articles/979862/

    #ai_review #code_review #llm #cicd #chatgpt #claude #gemini #openrouter #gitlab #github

  6. AI Review не делает код лучше. И вот почему

    Я делал AI Review как простой инженерный инструмент. Но реальный фейл оказался не в архитектуре и не в LLM — а в том, чего люди от него ждали.

    habr.com/ru/articles/979862/

    #ai_review #code_review #llm #cicd #chatgpt #claude #gemini #openrouter #gitlab #github

  7. Вайбкодинг — это гемблинг

    Наблюдая за тем, как ИИ внедряется на работе и дома, я всё чаще ловлю себя на простой мысли: всё труднее писать код самому и всё больше хочется делегировать ИИ. Да ещё и провайдеры ИИ призывают тратить больше токенов, руководители всё чаще призывают команды активнее пользоваться ИИ. В соцсетях регулярно попадаются шуточные видео про то, как CEO предлагает потреблять токены ради самого потребления, а в крупных компаниях уже идёт негласное соревнование: кто больше использует AI‑инструменты, кто больше автоматизирует, кто быстрее покажет, что «мы тоже в игре». Из названия понятно, к чему я веду. Но мне хочется поговорить не про хайп и не про страх перед ИИ, а про более бытовую, инженерную и неприятную сторону: вайбкодинг очень легко превращается в гемблинг.

    habr.com/ru/articles/1033130/

    #ai #vibe_coding #llm #java #openrouter #ai_agents #telegram_bot #ollama #agentic_engineering

  8. Вайбкодинг — это гемблинг

    Наблюдая за тем, как ИИ внедряется на работе и дома, я всё чаще ловлю себя на простой мысли: всё труднее писать код самому и всё больше хочется делегировать ИИ. Да ещё и провайдеры ИИ призывают тратить больше токенов, руководители всё чаще призывают команды активнее пользоваться ИИ. В соцсетях регулярно попадаются шуточные видео про то, как CEO предлагает потреблять токены ради самого потребления, а в крупных компаниях уже идёт негласное соревнование: кто больше использует AI‑инструменты, кто больше автоматизирует, кто быстрее покажет, что «мы тоже в игре». Из названия понятно, к чему я веду. Но мне хочется поговорить не про хайп и не про страх перед ИИ, а про более бытовую, инженерную и неприятную сторону: вайбкодинг очень легко превращается в гемблинг.

    habr.com/ru/articles/1033130/

    #ai #vibe_coding #llm #java #openrouter #ai_agents #telegram_bot #ollama #agentic_engineering

  9. Part-DB's #AI features utilize the new @symfony AI component, especially AI platform to make it platform agnostic and allow for different AI providers.
    Currently there is support for #openrouter to support a variety of cloud based LLMs, and #lmstudio for self hosted AI on your local GPU.

    #symfony #php #opensource #webdev

  10. Part-DB's #AI features utilize the new @symfony AI component, especially AI platform to make it platform agnostic and allow for different AI providers.
    Currently there is support for #openrouter to support a variety of cloud based LLMs, and #lmstudio for self hosted AI on your local GPU.

    #symfony #php #opensource #webdev

  11. Прогнал 6 апрельских LLM через battle test. Победил не самый новый и не самый дорогой

    DeepSeek V4 Pro вышел 24 апреля. Огромная модель, топ AIME и SWE-bench, передовая reasoning-архитектура. Я ждал Tier S — 95+ из 100 в нашем battle test на русском контенте. Получил 89. Запустил его собственный Flash — 83. Pro выше на 6 пунктов, но в 13 раз дороже. Перетестировал Qwen 3.6 Plus, который вышел на 22 дня раньше V4 Pro: 92 балла. Старый Qwen обогнал новейший флагман DeepSeek и по качеству, и по цене. В статье: парадокс Pro vs Flash с экономикой production, гипотезы почему reasoning-оптимизация не вытягивает narrative, обновления методологии (max_tokens, paid re-test), формула score-per-dollar и обновлённые рекомендации.

    habr.com/ru/articles/1029044/

    #LLM #DeepSeek #Qwen #Kimi #Benchmarks #AI #OpenRouter #Russian_NLP

  12. Прогнал 6 апрельских LLM через battle test. Победил не самый новый и не самый дорогой

    DeepSeek V4 Pro вышел 24 апреля. Огромная модель, топ AIME и SWE-bench, передовая reasoning-архитектура. Я ждал Tier S — 95+ из 100 в нашем battle test на русском контенте. Получил 89. Запустил его собственный Flash — 83. Pro выше на 6 пунктов, но в 13 раз дороже. Перетестировал Qwen 3.6 Plus, который вышел на 22 дня раньше V4 Pro: 92 балла. Старый Qwen обогнал новейший флагман DeepSeek и по качеству, и по цене. В статье: парадокс Pro vs Flash с экономикой production, гипотезы почему reasoning-оптимизация не вытягивает narrative, обновления методологии (max_tokens, paid re-test), формула score-per-dollar и обновлённые рекомендации.

    habr.com/ru/articles/1029044/

    #LLM #DeepSeek #Qwen #Kimi #Benchmarks #AI #OpenRouter #Russian_NLP

  13. Прогнал 6 апрельских LLM через battle test. Победил не самый новый и не самый дорогой DeepSeek V4 Pro вышел 24 апреля. Огром...

    #LLM #DeepSeek #Qwen #Kimi #Benchmarks #AI #OpenRouter #Russian #NLP

    Origin | Interest | Match
  14. DeepSeek V4 - almost on the frontier, a fraction of the price Chinese AI lab DeepSeek's last model release was V3.2 (and V3.2 Speciale) last December . They just dropped the first of their hotl...

    #ai #generative-ai #llms #llm #llm-pricing #pelican-riding-a-bicycle #deepseek #llm-release #openrouter #ai-in-china

    Origin | Interest | Match
  15. DeepSeek V4 - almost on the frontier, a fraction of the price Chinese AI lab DeepSeek's last model release was V3.2 (and V3.2 Speciale) last December. They just dropped the first of their hotly...

    #ai #generative-ai #llms #llm #llm-pricing #pelican-riding-a-bicycle #deepseek #llm-release #openrouter #ai-in-china

    Origin | Interest | Match
  16. Какую LLM ставить в production для контента на русском? Протестировали 18 моделей — одна в 130× дешевле при 91% качества

    GPT-5.4 пишет лучше всех — 97 баллов из 100. Но $0.10 за вызов. При 10 000 генераций в месяц — $1000. А мы нашли модель, которая справляется на 91% и стоит $0.0008. Те же 10 000 генераций — $8. Разница — $992 каждый месяц. Мы строим продукт, где LLM генерирует образовательный контент для клиентов. Публичные бенчмарки (MMLU, HumanEval, LMSYS) не помогают — они не тестируют генерацию длинных текстов на русском и не учитывают стоимость. Поэтому мы за свои $95 построили собственный battle test и прогнали через него 18 моделей. Что обнаружили: 7 из 18 моделей вставляют китайские иероглифы в русский текст. Одна копирует инструкции из промпта прямо в заголовки. А LLM-судья поставил сам себе 127 баллов из 100. В статье: полная методология, таблицы с результатами, формула value score (цена/качество), и открытый лидерборд.

    habr.com/ru/articles/1021388/

    #LLM #Benchmarks #AI #OpenRouter #Claude #GPT #Qwen #Quality_Assessment #NLP

  17. Какую LLM ставить в production для контента на русском? Протестировали 18 моделей — одна в 130× дешевле при 91% качества

    GPT-5.4 пишет лучше всех — 97 баллов из 100. Но $0.10 за вызов. При 10 000 генераций в месяц — $1000. А мы нашли модель, которая справляется на 91% и стоит $0.0008. Те же 10 000 генераций — $8. Разница — $992 каждый месяц. Мы строим продукт, где LLM генерирует образовательный контент для клиентов. Публичные бенчмарки (MMLU, HumanEval, LMSYS) не помогают — они не тестируют генерацию длинных текстов на русском и не учитывают стоимость. Поэтому мы за свои $95 построили собственный battle test и прогнали через него 18 моделей. Что обнаружили: 7 из 18 моделей вставляют китайские иероглифы в русский текст. Одна копирует инструкции из промпта прямо в заголовки. А LLM-судья поставил сам себе 127 баллов из 100. В статье: полная методология, таблицы с результатами, формула value score (цена/качество), и открытый лидерборд.

    habr.com/ru/articles/1021388/

    #LLM #Benchmarks #AI #OpenRouter #Claude #GPT #Qwen #Quality_Assessment #NLP

  18. Oh, look! 🤑 Someone's reallocating an impressive $100/month from Claude Code to #Zed and #OpenRouter. Because clearly, the infinite wisdom of switching between obscure tools is the pinnacle of financial genius. 🚀 The excitement of moving virtual monopoly money never gets old, does it? 🤦‍♂️
    braw.dev/blog/2026-04-06-reall #HackerNews #ClaudeCode #FinancialGenius #VirtualMonopoly #HackerNews #ngated

  19. Глухой телефон для ИИ: мы замерили физику LLM-графов и поняли, почему добавление агентов всё ломает

    Индустрия ИИ переживает бум мультиагентных систем . Кажется, рецепт AGI найден: просто соедините 10 умных нейросетей в команду, дайте им роли, и они свернут горы. Но на практике мы часто сталкиваемся с магией «черного ящика». Иногда агенты действительно решают сложнейшие задачи. А иногда - скатываются в бесконечные галлюцинации, теряют контекст и выдают результат хуже, чем базовая модель соло. Индустрия решает эту проблему в стиле средневековых алхимиков: «просто добавьте еще агентов» или «дайте им больше токенов на болтовню». Никто не измеряет физику процесса. Мы решили, что с нас хватит алхимии. Нам понадобился измерительный прибор - эдакий МРТ-аппарат для мультиагентных сетей, который покажет механику общения LLM изнутри. Так появился опенсорсный проект llm-coordination-harness - строгий измерительный стенд (measurement rig), который доказывает, что у общения нейросетей есть своя физика, которую можно и нужно измерять. Под катом рассказываем и показываем на графиках. Никаких заявлений про AGI - только честный хардкорный ресёрч, физика графов и отрицательные результаты, которые оказались важнее положительных. Заглянуть в черный ящик

    habr.com/ru/articles/1019490/

    #llm #ииагенты #multiagent_systems #машинное_обучение #графы #топология_сети #data_science #безопасность_ии #openrouter #бенчмарки

  20. Как я удалил OpenClaw

    Статья о том, с какими сложностями могут столкнуться пользователи, установившие ИИ-агента OpenClaw, построенная на личном опыте. Спойлер: монстр под капотом, 81 млн токенов за три дня, конфликты с сервером и почему он не просто бот, а ниндзя-одиночка.

    habr.com/ru/articles/1015692/

    #openclaw #openclaw_set_up #aiagents #costofliving #ollama #openrouter #zerocoding #vibecoding

  21. Как я удалил OpenClaw

    Статья о том, с какими сложностями могут столкнуться пользователи, установившие ИИ-агента OpenClaw, построенная на личном опыте. Спойлер: монстр под капотом, 81 млн токенов за три дня, конфликты с сервером и почему он не просто бот, а ниндзя-одиночка.

    habr.com/ru/articles/1015692/

    #openclaw #openclaw_set_up #aiagents #costofliving #ollama #openrouter #zerocoding #vibecoding

  22. Как я удалил OpenClaw

    Статья о том, с какими сложностями могут столкнуться пользователи, установившие ИИ-агента OpenClaw, построенная на личном опыте. Спойлер: монстр под капотом, 81 млн токенов за три дня, конфликты с сервером и почему он не просто бот, а ниндзя-одиночка.

    habr.com/ru/articles/1015692/

    #openclaw #openclaw_set_up #aiagents #costofliving #ollama #openrouter #zerocoding #vibecoding

  23. Как я удалил OpenClaw

    Статья о том, с какими сложностями могут столкнуться пользователи, установившие ИИ-агента OpenClaw, построенная на личном опыте. Спойлер: монстр под капотом, 81 млн токенов за три дня, конфликты с сервером и почему он не просто бот, а ниндзя-одиночка.

    habr.com/ru/articles/1015692/

    #openclaw #openclaw_set_up #aiagents #costofliving #ollama #openrouter #zerocoding #vibecoding

  24. Релиз Java 26, Xiaomi в топе и сертификация вайбкодеров

    Шестой выпуск еженедельных IT-новостей от OpenIDE: Java прощается с аплетами навсегда, Cursor не соблюдает лицензию Kimi, а менеджеры придумали новую единицу измерения продуктивности разработчика.

    habr.com/ru/companies/haulmont

    #Java_26 #Applet_API #OpenRouter #Xiaomi_MiMo #Cursor_Composer_2 #Kimi_K2 #Claude_Certified_Architect #токены_разработчика #JavaOne_2026 #заменимость_профессий_ИИ

  25. Релиз Java 26, Xiaomi в топе и сертификация вайбкодеров

    Шестой выпуск еженедельных IT-новостей от OpenIDE: Java прощается с аплетами навсегда, Cursor не соблюдает лицензию Kimi, а менеджеры придумали новую единицу измерения продуктивности разработчика.

    habr.com/ru/companies/haulmont

    #Java_26 #Applet_API #OpenRouter #Xiaomi_MiMo #Cursor_Composer_2 #Kimi_K2 #Claude_Certified_Architect #токены_разработчика #JavaOne_2026 #заменимость_профессий_ИИ

  26. Релиз Java 26, Xiaomi в топе и сертификация вайбкодеров

    Шестой выпуск еженедельных IT-новостей от OpenIDE: Java прощается с аплетами навсегда, Cursor не соблюдает лицензию Kimi, а менеджеры придумали новую единицу измерения продуктивности разработчика.

    habr.com/ru/companies/haulmont

    #Java_26 #Applet_API #OpenRouter #Xiaomi_MiMo #Cursor_Composer_2 #Kimi_K2 #Claude_Certified_Architect #токены_разработчика #JavaOne_2026 #заменимость_профессий_ИИ

  27. Релиз Java 26, Xiaomi в топе и сертификация вайбкодеров

    Шестой выпуск еженедельных IT-новостей от OpenIDE: Java прощается с аплетами навсегда, Cursor не соблюдает лицензию Kimi, а менеджеры придумали новую единицу измерения продуктивности разработчика.

    habr.com/ru/companies/haulmont

    #Java_26 #Applet_API #OpenRouter #Xiaomi_MiMo #Cursor_Composer_2 #Kimi_K2 #Claude_Certified_Architect #токены_разработчика #JavaOne_2026 #заменимость_профессий_ИИ

  28. Юридическое поле экспериментов для RAG

    Можно ли делать RAG на MacStudio M3 Ultra? CAG - убийца RAG? Самый лучший RAG от OpenAI и Grok? Ответы на эти вопросы мы узнали во время участия в соревновании Agentic RAG Legal Challenge . Стоит отметить хорошую организацию соревнования и продуманные метрики. Более 300 команд со всего мира. Ответы на вопросы - под катом

    habr.com/ru/articles/1014690/

    #RAG #CAG #ARLC_2026 #хакатон #выгорание #qdrant #opensourse #llmагент #безумный_план #openrouter

  29. RE: mstdn.feddit.social/@admin/115

    再换成了deepseek/deepseek-chat,直接给我打了十几个tag,何意味......

    然后AI Tag再次失败的原因是没有打开“Enable paid endpoints that may train on inputs”

    #deepseek #karakeep #openrouter #pricacy

  30. RE: mstdn.feddit.social/@admin/115

    再换成了deepseek/deepseek-chat,直接给我打了十几个tag,何意味......

    然后AI Tag再次失败的原因是没有打开“Enable paid endpoints that may train on inputs”

    #deepseek #karakeep #openrouter #pricacy

  31. RE: mstdn.feddit.social/@admin/115

    再换成了deepseek/deepseek-chat,直接给我打了十几个tag,何意味......

    然后AI Tag再次失败的原因是没有打开“Enable paid endpoints that may train on inputs”

    #deepseek #karakeep #openrouter #pricacy

  32. RE: mstdn.feddit.social/@admin/115

    免费的才是最贵的,换成付费模型,虽然不贵,但是效果还是不错的,速度比免费模型快几倍

    INFERENCE_TEXT_MODEL=openai/gpt-oss-120b
    INFERENCE_IMAGE_MODEL=openai/gpt-4.1-nano

    #openrouter #openai #karakeep #gpt_oss_120b #gpt_4.1_nano

  33. RE: mstdn.feddit.social/@admin/115

    Linux Do 开启了Cloudflare 验证,也无法AI打Tag和生产总结

    4:23开始任何书签都无法生成Tag和Summary了,用Curl测试了API,发现触发了 OpenRouter 的每日免费模型额度限制。
    "Rate limit exceeded: free-models-per-day. Add 10 credits to unlock 1000 free model requests per day"

    在.env添加 INFERENCE_ENABLE_AUTO_SUMMARIZATION=true 使其自动生成summary

    karakeep可以和singlefile联动
    但是目前我测试先用karakeep extinsion生成了书签,再使用singlefile生成存档,存档无法正常显示
    先使用singlefile生成存档,则书签没有banner
    docs.karakeep.app/integrations

    #openrouter #karakeep #singlefile

  34. 用openrouter的免费模型给karakeep打tag,需要在 openrouter.ai/settings/privacy 允许两个权限

    不过library.kiwix.org开了anibus好像就无法打AI Tag

    #karakeep #bookmark #openrouter #tag

  35. 🔧 #OpenRouter launches Response Healing: automatically fixes malformed #JSON responses from #LLMs before they reach your app #AI #API #devops

    📊 Results from 1.6M+ requests analyzed at inference time:
    #Gemini 2.0 Flash: 80% defect reduction (99.61% → 99.92%)
    #Qwen3 235B: 99.8% defect reduction (88% → 99.98%)
    #Deepseek Chat v3.1: 85% defect reduction (82.5% → 97.4%)
    #Devstral 2512: 99.6% defect reduction (96.6% → 99.99%)

    🧵 👇

  36. Нейро-дайджест: ключевые события мира AI за 2-ю неделю декабря 2025

    Привет! Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий. Неделя выдалась насыщенной: Mistral выкатили Devstral 2 , Photoshop, Express и Acrobat встроили прямо в ChatGPT , а исследования показывают, что более 80% вайб-кода могут содержать уязвимости. Криштиану Роналду инвестирует в Perplexity, а Сэм Альтман считает, что сейчас невозможно воспитывать детей без ИИ. Всё самое важное — в одном месте. Поехали! Читать дайджест →

    habr.com/ru/companies/timeweb/

    #новости #ии #дайджест #нейросети #devstral #openrouter #timeweb_дайджест #искусственный_интеллект #perplexity #сэм_альтман