#суверенный_ии — Public Fediverse posts on home.social

Habr @[email protected] · 2026-05-17 · 14:32 UTC

MELT-1: трансформер 7B сдыхает за 11 часов, а наш агент живёт 95

TL;DR. Мы выкатили открытый бенчмарк MELT-1 — он меряет не сколько модель знает в идеальных условиях (MMLU & co), а сколько она проживёт под дрифтом распределения и сколько стоит держать её живой. Три оси: $/1M успешных решений, часы до деградации без ретрейна, p99-латентность сенсор→актуатор под 40 °C. 30 суток непрерывного инференса, 5 сидов, два температурных профиля, sensitivity-анализ. На closed-loop manipulation наш агент (Metabolic AI, non-transformer) против Llama-class 7B INT8 показал 9.4× по стоимости, 8.5× по выживанию под дрифтом, ~1600× композитно. Архитектура закрыта — патент на стадии экспертизы. Бенч открытый: харнесс, сцены, оракул, sensitivity-скрипты, опубликованный VAE-энкодер дрифта. Прогоните своих агентов и положите рядом. PDF с полной методологией и threats to validity — в конце статьи. Посмотреть

https://habr.com/ru/articles/1036098/

#inference #aiагенты #суверенный_ии

#суверенный_ии #aiагенты #inference

Habr @[email protected] · 2026-05-17 · 14:32 UTC

MELT-1: трансформер 7B сдыхает за 11 часов, а наш агент живёт 95

TL;DR. Мы выкатили открытый бенчмарк MELT-1 — он меряет не сколько модель знает в идеальных условиях (MMLU & co), а сколько она проживёт под дрифтом распределения и сколько стоит держать её живой. Три оси: $/1M успешных решений, часы до деградации без ретрейна, p99-латентность сенсор→актуатор под 40 °C. 30 суток непрерывного инференса, 5 сидов, два температурных профиля, sensitivity-анализ. На closed-loop manipulation наш агент (Metabolic AI, non-transformer) против Llama-class 7B INT8 показал 9.4× по стоимости, 8.5× по выживанию под дрифтом, ~1600× композитно. Архитектура закрыта — патент на стадии экспертизы. Бенч открытый: харнесс, сцены, оракул, sensitivity-скрипты, опубликованный VAE-энкодер дрифта. Прогоните своих агентов и положите рядом. PDF с полной методологией и threats to validity — в конце статьи. Посмотреть

https://habr.com/ru/articles/1036098/

#inference #aiагенты #суверенный_ии

#суверенный_ии #aiагенты #inference

Habr @[email protected] · 2026-05-17 · 14:32 UTC

MELT-1: трансформер 7B сдыхает за 11 часов, а наш агент живёт 95

TL;DR. Мы выкатили открытый бенчмарк MELT-1 — он меряет не сколько модель знает в идеальных условиях (MMLU & co), а сколько она проживёт под дрифтом распределения и сколько стоит держать её живой. Три оси: $/1M успешных решений, часы до деградации без ретрейна, p99-латентность сенсор→актуатор под 40 °C. 30 суток непрерывного инференса, 5 сидов, два температурных профиля, sensitivity-анализ. На closed-loop manipulation наш агент (Metabolic AI, non-transformer) против Llama-class 7B INT8 показал 9.4× по стоимости, 8.5× по выживанию под дрифтом, ~1600× композитно. Архитектура закрыта — патент на стадии экспертизы. Бенч открытый: харнесс, сцены, оракул, sensitivity-скрипты, опубликованный VAE-энкодер дрифта. Прогоните своих агентов и положите рядом. PDF с полной методологией и threats to validity — в конце статьи. Посмотреть

https://habr.com/ru/articles/1036098/

#inference #aiагенты #суверенный_ии

#суверенный_ии #aiагенты #inference

Habr @[email protected] · 2026-05-17 · 14:32 UTC

MELT-1: трансформер 7B сдыхает за 11 часов, а наш агент живёт 95

TL;DR. Мы выкатили открытый бенчмарк MELT-1 — он меряет не сколько модель знает в идеальных условиях (MMLU & co), а сколько она проживёт под дрифтом распределения и сколько стоит держать её живой. Три оси: $/1M успешных решений, часы до деградации без ретрейна, p99-латентность сенсор→актуатор под 40 °C. 30 суток непрерывного инференса, 5 сидов, два температурных профиля, sensitivity-анализ. На closed-loop manipulation наш агент (Metabolic AI, non-transformer) против Llama-class 7B INT8 показал 9.4× по стоимости, 8.5× по выживанию под дрифтом, ~1600× композитно. Архитектура закрыта — патент на стадии экспертизы. Бенч открытый: харнесс, сцены, оракул, sensitivity-скрипты, опубликованный VAE-энкодер дрифта. Прогоните своих агентов и положите рядом. PDF с полной методологией и threats to validity — в конце статьи. Посмотреть

https://habr.com/ru/articles/1036098/

#inference #aiагенты #суверенный_ии

Habr @[email protected] · 2026-03-27 · 08:32 UTC

Россия — третий полюс мирового AI. Агентов запускаем на Raspberry Pi

a16z включил Россию в тройку AI-держав - наряду с Западом и Китаем. Яндекс Браузер в топ-10 мировых AI-приложений. GigaChat дебютировал в глобальном рейтинге. А потом смотришь на цифры изнутри - и видишь 48-е место, GPU-голод и агентов на Raspberry Pi.

https://habr.com/ru/articles/1015782/

#AI #Россия #суверенный_ИИ #GigaChat #YandexGPT #GPU #a16z

#a16z #gpu #yandexgpt #gigachat #суверенный_ии #россия

Habr @[email protected] · 2026-03-23 · 11:12 UTC

Geometry > Scale 2.0.: Манифест LILA: Как замерзшие пальцы и 10 строк кода обнуляют 7 триллионов Сэма Альтмана

Пока Сэм Альтман и Qualcomm греются в лучах своих триллионов и играют в гольф запуская конкурсы по эффективным SML (задним числом), через неделю после моего поста на reddit и Хабре про Lila-E8 ( с мемом про Сэма 🤣 похоже мем дошел до него ) Sovereign-Lila-Leech родилась из замерзших пальцев в маршрутке и опыта физики частиц. Я заморозил 240 корней E8 на треке физики , а затем и ядро Лича, сделав их Source of Truth для интеллекта. Математика не должна вычисляться – она должна существовать. В Lila Leech замороженное ядро – это ледяная игла, пробивающая пузырь корпоративного ИИ.

https://habr.com/ru/articles/1013680/

#leech #e8 #ai #Lila #суверенный_ии

#суверенный_ии #lila #ai #e8 #leech

Habr @[email protected] · 2026-03-09 · 12:12 UTC

Я изучил десятки ИИ-стартапов в России. Вот почему большинство из них обречены

За последний год я изучил десятки российских ИИ-стартапов на площадках Brainbox и Product Radar. Параллельно строил собственную AI-платформу, так что смотрю на рынок не как инвестор, а как инженер с 20-летним опытом в разработке. Картина неутешительная: большинство проектов, которые собирают деньги, будут мертвы через 2-3 года. И причины чисто технические.

https://habr.com/ru/articles/1008142/

#ИИстартапы #инвестиции_в_ИИ #opensource_LLM #DeepSeek #Qwen #архитектура_ИИагентов #суверенный_ИИ #импортозамещение #OpenAI_API_зависимость #LLMроутер

#llmроутер #openai_api_зависимость #импортозамещение #суверенный_ии #архитектура_ииагентов #qwen

Habr @[email protected] · 2026-03-09 · 12:12 UTC

Я изучил десятки ИИ-стартапов в России. Вот почему большинство из них обречены

За последний год я изучил десятки российских ИИ-стартапов на площадках Brainbox и Product Radar. Параллельно строил собственную AI-платформу, так что смотрю на рынок не как инвестор, а как инженер с 20-летним опытом в разработке. Картина неутешительная: большинство проектов, которые собирают деньги, будут мертвы через 2-3 года. И причины чисто технические.

https://habr.com/ru/articles/1008142/

#ИИстартапы #инвестиции_в_ИИ #opensource_LLM #DeepSeek #Qwen #архитектура_ИИагентов #суверенный_ИИ #импортозамещение #OpenAI_API_зависимость #LLMроутер

#llmроутер #openai_api_зависимость #импортозамещение #суверенный_ии #архитектура_ииагентов #qwen

Habr @[email protected] · 2026-03-09 · 12:12 UTC

Я изучил десятки ИИ-стартапов в России. Вот почему большинство из них обречены

За последний год я изучил десятки российских ИИ-стартапов на площадках Brainbox и Product Radar. Параллельно строил собственную AI-платформу, так что смотрю на рынок не как инвестор, а как инженер с 20-летним опытом в разработке. Картина неутешительная: большинство проектов, которые собирают деньги, будут мертвы через 2-3 года. И причины чисто технические.

https://habr.com/ru/articles/1008142/

#ИИстартапы #инвестиции_в_ИИ #opensource_LLM #DeepSeek #Qwen #архитектура_ИИагентов #суверенный_ИИ #импортозамещение #OpenAI_API_зависимость #LLMроутер

#llmроутер #openai_api_зависимость #импортозамещение #суверенный_ии #архитектура_ииагентов #qwen

Habr @[email protected] · 2026-03-09 · 12:12 UTC

Я изучил десятки ИИ-стартапов в России. Вот почему большинство из них обречены

За последний год я изучил десятки российских ИИ-стартапов на площадках Brainbox и Product Radar. Параллельно строил собственную AI-платформу, так что смотрю на рынок не как инвестор, а как инженер с 20-летним опытом в разработке. Картина неутешительная: большинство проектов, которые собирают деньги, будут мертвы через 2-3 года. И причины чисто технические.

https://habr.com/ru/articles/1008142/

#ИИстартапы #инвестиции_в_ИИ #opensource_LLM #DeepSeek #Qwen #архитектура_ИИагентов #суверенный_ИИ #импортозамещение #OpenAI_API_зависимость #LLMроутер

#иистартапы #инвестиции_в_ии #opensource_llm #deepseek #qwen #архитектура_ииагентов