#openrouter — Public Fediverse posts on home.social

Habr @[email protected] · 2026-05-28 · 15:52 UTC

Gemini-3.5-flash догнал GPT-5.5 на 97/S и в 2.5× дешевле. Но главное — китайцы выигрывают по цене и качеству

Месяц назад я писал про парадокс DeepSeek V4 Pro — модель проиграла собственному Flash и Qwen 3.6 Plus трёхнедельной давности. Сегодня прогнал свежий battle на пяти моделях — два американских флагмана и три китайских — и расклад снова поменялся. Главное: Gemini-3.5-flash взял 97/S, тот же балл, что у GPT-5.5, и в 2.5 раза дешевле. Google впервые на моём тесте встал рядом с OpenAI на длинном русском контенте. Tencent Hy3-preview даёт A-tier за $0.0017 за вызов — в 134 раза дешевле GPT-5.5. DeepSeek V4 Pro я прогнал третий раз — качество стоит на месте (87), но цена упала в 5.4× и она снова в зоне полезного. Qwen 3.7 Max упорно вставляет китайские иероглифы в русский текст — регрессия относительно собственной 3.6, где этой проблемы не было. По дороге заметил, что наша формула cost_per_call жила полгода с приближением, которое занижало стоимость на 50–140%. Починили — теперь берём реальные токены из OpenRouter response.usage . И отдельно — почему при такой скорости релизов модель в продукте стоит держать заменяемой, а не зашитой в код намертво.

https://habr.com/ru/articles/1040770/

#LLM #Gemini #gpt5 #DeepSeek #Qwen #Tencent #Benchmarks #AI #OpenRouter #Russian_NLP

#russian_nlp #openrouter #ai #benchmarks #tencent #qwen

deepseek @[email protected] · 2026-05-28 · 15:40 UTC

Gemini-3.5-flash догнал GPT-5.5 на 97/S и в 2.5× дешевле. Но главное — китайцы выигрывают по цене и качеству Месяц назад я п...

#LLM #Gemini #gpt-5 #DeepSeek #Qwen #Tencent #Benchmarks #AI #OpenRouter #Russian #NLP

Origin | Interest | Match

#llm #gemini #gpt5 #deepseek #qwen #tencent

Habr @[email protected] · 2026-05-18 · 12:32 UTC

Прогнал семь LLM через свой русский спортивный бенчмарк. Базовой моделью всё равно оставляю Gemma 4 31B

Прогнали семь LLM через свой русский спортивный бенчмарк. Топовые модели closed-source выигрывают 1.5-1.7 балла. Базовой моделью всё равно остаётся Gemma 4 31B — рассказываю почему.

https://habr.com/ru/articles/1036448/

#llm #бенчмарк #gemma #qwen #openrouter #русский_язык #dora #sft #спорт #llmjudge

#llmjudge #спорт #sft #dora #русский_язык #openrouter

Habr @[email protected] · 2026-05-18 · 12:32 UTC

Прогнал семь LLM через свой русский спортивный бенчмарк. Базовой моделью всё равно оставляю Gemma 4 31B

Прогнали семь LLM через свой русский спортивный бенчмарк. Топовые модели closed-source выигрывают 1.5-1.7 балла. Базовой моделью всё равно остаётся Gemma 4 31B — рассказываю почему.

https://habr.com/ru/articles/1036448/

#llm #бенчмарк #gemma #qwen #openrouter #русский_язык #dora #sft #спорт #llmjudge

#openrouter #qwen #gemma #бенчмарк #llm #llmjudge

Habr @[email protected] · 2026-05-18 · 12:32 UTC

Прогнал семь LLM через свой русский спортивный бенчмарк. Базовой моделью всё равно оставляю Gemma 4 31B

Прогнали семь LLM через свой русский спортивный бенчмарк. Топовые модели closed-source выигрывают 1.5-1.7 балла. Базовой моделью всё равно остаётся Gemma 4 31B — рассказываю почему.

https://habr.com/ru/articles/1036448/

#llm #бенчмарк #gemma #qwen #openrouter #русский_язык #dora #sft #спорт #llmjudge

#llmjudge #спорт #sft #dora #русский_язык #openrouter

Habr @[email protected] · 2026-05-18 · 12:32 UTC

Прогнал семь LLM через свой русский спортивный бенчмарк. Базовой моделью всё равно оставляю Gemma 4 31B

Прогнали семь LLM через свой русский спортивный бенчмарк. Топовые модели closed-source выигрывают 1.5-1.7 балла. Базовой моделью всё равно остаётся Gemma 4 31B — рассказываю почему.

https://habr.com/ru/articles/1036448/

#llm #бенчмарк #gemma #qwen #openrouter #русский_язык #dora #sft #спорт #llmjudge

#llm #бенчмарк #gemma #qwen #openrouter #русский_язык

Arint - SEO+KI @[email protected] · 2026-05-18 · 10:02 UTC

RT @burkov: Dass die Modelle ständig aktualisiert werden und ältere Versionen dann abgekündigt werden, ist extrem ärgerlich. Man hat gerade ein Modell gefunden, das für einen bestimmten Anwendungsfall gut funktioniert und auch kosteneffizient ist. Also nutzt man es direkt vom Anbieter oder über OpenRouter. Dann entscheiden sie, es abzukündigen, und die einzige Option, falls das Modell Open-Weight ist, besteht darin, GPUs zu mieten, um es zu betreiben, was für den Anwendungsfall zu teuer ist. Ansonsten muss man alle Modelle erneut testen, bis man eines findet, das für einen angemessenen Preis für seinen Anwendungsfall vernünftig gut funktioniert.

mehr auf Arint.info

#GPU #KI #MaschinellesLernen #Modellmanagement #OpenRouter #Technologie #arint_info

https://x.com/burkov/status/2056158991885926863#m

#gpu #ki #maschinelleslernen #modellmanagement #openrouter #technologie

Bryan :tng_badge: @[email protected] · 2026-05-17 · 20:00 UTC

Pretty good argument for just using #openrouter over a #LocalLLM. I think the math will change once all these AI providers stop burning VC money. Specifically, the author is looking at rounded-up utility and hardware pricing on #Apple Silicon.
https://www.williamangel.net/blog/2026/05/17/offline-llm-energy-use.html

#openrouter #localllm #apple

Bryan :tng_badge: @[email protected] · 2026-05-17 · 20:00 UTC

Pretty good argument for just using #openrouter over a #LocalLLM. I think the math will change once all these AI providers stop burning VC money. Specifically, the author is looking at rounded-up utility and hardware pricing on #Apple Silicon.
https://www.williamangel.net/blog/2026/05/17/offline-llm-energy-use.html

#openrouter #localllm #apple

Bryan :tng_badge: @[email protected] · 2026-05-17 · 20:00 UTC

Pretty good argument for just using #openrouter over a #LocalLLM. I think the math will change once all these AI providers stop burning VC money. Specifically, the author is looking at rounded-up utility and hardware pricing on #Apple Silicon.
https://www.williamangel.net/blog/2026/05/17/offline-llm-energy-use.html

#openrouter #localllm #apple

Bryan :tng_badge: @[email protected] · 2026-05-17 · 20:00 UTC

Pretty good argument for just using #openrouter over a #LocalLLM. I think the math will change once all these AI providers stop burning VC money. Specifically, the author is looking at rounded-up utility and hardware pricing on #Apple Silicon.
https://www.williamangel.net/blog/2026/05/17/offline-llm-energy-use.html

#apple #localllm #openrouter

Bryan :tng_badge: @[email protected] · 2026-05-17 · 20:00 UTC

Pretty good argument for just using #openrouter over a #LocalLLM. I think the math will change once all these AI providers stop burning VC money. Specifically, the author is looking at rounded-up utility and hardware pricing on #Apple Silicon.
https://www.williamangel.net/blog/2026/05/17/offline-llm-energy-use.html

#openrouter #localllm #apple