#суверенный_ии — Public Fediverse posts
Live and recent posts from across the Fediverse tagged #суверенный_ии, aggregated by home.social.
-
MELT-1: трансформер 7B сдыхает за 11 часов, а наш агент живёт 95
TL;DR. Мы выкатили открытый бенчмарк MELT-1 — он меряет не сколько модель знает в идеальных условиях (MMLU & co), а сколько она проживёт под дрифтом распределения и сколько стоит держать её живой. Три оси: $/1M успешных решений, часы до деградации без ретрейна, p99-латентность сенсор→актуатор под 40 °C. 30 суток непрерывного инференса, 5 сидов, два температурных профиля, sensitivity-анализ. На closed-loop manipulation наш агент (Metabolic AI, non-transformer) против Llama-class 7B INT8 показал 9.4× по стоимости, 8.5× по выживанию под дрифтом, ~1600× композитно. Архитектура закрыта — патент на стадии экспертизы. Бенч открытый: харнесс, сцены, оракул, sensitivity-скрипты, опубликованный VAE-энкодер дрифта. Прогоните своих агентов и положите рядом. PDF с полной методологией и threats to validity — в конце статьи. Посмотреть
-
MELT-1: трансформер 7B сдыхает за 11 часов, а наш агент живёт 95
TL;DR. Мы выкатили открытый бенчмарк MELT-1 — он меряет не сколько модель знает в идеальных условиях (MMLU & co), а сколько она проживёт под дрифтом распределения и сколько стоит держать её живой. Три оси: $/1M успешных решений, часы до деградации без ретрейна, p99-латентность сенсор→актуатор под 40 °C. 30 суток непрерывного инференса, 5 сидов, два температурных профиля, sensitivity-анализ. На closed-loop manipulation наш агент (Metabolic AI, non-transformer) против Llama-class 7B INT8 показал 9.4× по стоимости, 8.5× по выживанию под дрифтом, ~1600× композитно. Архитектура закрыта — патент на стадии экспертизы. Бенч открытый: харнесс, сцены, оракул, sensitivity-скрипты, опубликованный VAE-энкодер дрифта. Прогоните своих агентов и положите рядом. PDF с полной методологией и threats to validity — в конце статьи. Посмотреть
-
MELT-1: трансформер 7B сдыхает за 11 часов, а наш агент живёт 95
TL;DR. Мы выкатили открытый бенчмарк MELT-1 — он меряет не сколько модель знает в идеальных условиях (MMLU & co), а сколько она проживёт под дрифтом распределения и сколько стоит держать её живой. Три оси: $/1M успешных решений, часы до деградации без ретрейна, p99-латентность сенсор→актуатор под 40 °C. 30 суток непрерывного инференса, 5 сидов, два температурных профиля, sensitivity-анализ. На closed-loop manipulation наш агент (Metabolic AI, non-transformer) против Llama-class 7B INT8 показал 9.4× по стоимости, 8.5× по выживанию под дрифтом, ~1600× композитно. Архитектура закрыта — патент на стадии экспертизы. Бенч открытый: харнесс, сцены, оракул, sensitivity-скрипты, опубликованный VAE-энкодер дрифта. Прогоните своих агентов и положите рядом. PDF с полной методологией и threats to validity — в конце статьи. Посмотреть
-
MELT-1: трансформер 7B сдыхает за 11 часов, а наш агент живёт 95
TL;DR. Мы выкатили открытый бенчмарк MELT-1 — он меряет не сколько модель знает в идеальных условиях (MMLU & co), а сколько она проживёт под дрифтом распределения и сколько стоит держать её живой. Три оси: $/1M успешных решений, часы до деградации без ретрейна, p99-латентность сенсор→актуатор под 40 °C. 30 суток непрерывного инференса, 5 сидов, два температурных профиля, sensitivity-анализ. На closed-loop manipulation наш агент (Metabolic AI, non-transformer) против Llama-class 7B INT8 показал 9.4× по стоимости, 8.5× по выживанию под дрифтом, ~1600× композитно. Архитектура закрыта — патент на стадии экспертизы. Бенч открытый: харнесс, сцены, оракул, sensitivity-скрипты, опубликованный VAE-энкодер дрифта. Прогоните своих агентов и положите рядом. PDF с полной методологией и threats to validity — в конце статьи. Посмотреть
-
Россия — третий полюс мирового AI. Агентов запускаем на Raspberry Pi
a16z включил Россию в тройку AI-держав - наряду с Западом и Китаем. Яндекс Браузер в топ-10 мировых AI-приложений. GigaChat дебютировал в глобальном рейтинге. А потом смотришь на цифры изнутри - и видишь 48-е место, GPU-голод и агентов на Raspberry Pi.
-
Geometry > Scale 2.0.: Манифест LILA: Как замерзшие пальцы и 10 строк кода обнуляют 7 триллионов Сэма Альтмана
Пока Сэм Альтман и Qualcomm греются в лучах своих триллионов и играют в гольф запуская конкурсы по эффективным SML (задним числом), через неделю после моего поста на reddit и Хабре про Lila-E8 ( с мемом про Сэма 🤣 похоже мем дошел до него ) Sovereign-Lila-Leech родилась из замерзших пальцев в маршрутке и опыта физики частиц. Я заморозил 240 корней E8 на треке физики , а затем и ядро Лича, сделав их Source of Truth для интеллекта. Математика не должна вычисляться – она должна существовать. В Lila Leech замороженное ядро – это ледяная игла, пробивающая пузырь корпоративного ИИ.
-
Я изучил десятки ИИ-стартапов в России. Вот почему большинство из них обречены
За последний год я изучил десятки российских ИИ-стартапов на площадках Brainbox и Product Radar. Параллельно строил собственную AI-платформу, так что смотрю на рынок не как инвестор, а как инженер с 20-летним опытом в разработке. Картина неутешительная: большинство проектов, которые собирают деньги, будут мертвы через 2-3 года. И причины чисто технические.
https://habr.com/ru/articles/1008142/
#ИИстартапы #инвестиции_в_ИИ #opensource_LLM #DeepSeek #Qwen #архитектура_ИИагентов #суверенный_ИИ #импортозамещение #OpenAI_API_зависимость #LLMроутер
-
Я изучил десятки ИИ-стартапов в России. Вот почему большинство из них обречены
За последний год я изучил десятки российских ИИ-стартапов на площадках Brainbox и Product Radar. Параллельно строил собственную AI-платформу, так что смотрю на рынок не как инвестор, а как инженер с 20-летним опытом в разработке. Картина неутешительная: большинство проектов, которые собирают деньги, будут мертвы через 2-3 года. И причины чисто технические.
https://habr.com/ru/articles/1008142/
#ИИстартапы #инвестиции_в_ИИ #opensource_LLM #DeepSeek #Qwen #архитектура_ИИагентов #суверенный_ИИ #импортозамещение #OpenAI_API_зависимость #LLMроутер
-
Я изучил десятки ИИ-стартапов в России. Вот почему большинство из них обречены
За последний год я изучил десятки российских ИИ-стартапов на площадках Brainbox и Product Radar. Параллельно строил собственную AI-платформу, так что смотрю на рынок не как инвестор, а как инженер с 20-летним опытом в разработке. Картина неутешительная: большинство проектов, которые собирают деньги, будут мертвы через 2-3 года. И причины чисто технические.
https://habr.com/ru/articles/1008142/
#ИИстартапы #инвестиции_в_ИИ #opensource_LLM #DeepSeek #Qwen #архитектура_ИИагентов #суверенный_ИИ #импортозамещение #OpenAI_API_зависимость #LLMроутер
-
Я изучил десятки ИИ-стартапов в России. Вот почему большинство из них обречены
За последний год я изучил десятки российских ИИ-стартапов на площадках Brainbox и Product Radar. Параллельно строил собственную AI-платформу, так что смотрю на рынок не как инвестор, а как инженер с 20-летним опытом в разработке. Картина неутешительная: большинство проектов, которые собирают деньги, будут мертвы через 2-3 года. И причины чисто технические.
https://habr.com/ru/articles/1008142/
#ИИстартапы #инвестиции_в_ИИ #opensource_LLM #DeepSeek #Qwen #архитектура_ИИагентов #суверенный_ИИ #импортозамещение #OpenAI_API_зависимость #LLMроутер