home.social

#суверенный_ии — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #суверенный_ии, aggregated by home.social.

  1. MELT-1: трансформер 7B сдыхает за 11 часов, а наш агент живёт 95

    TL;DR. Мы выкатили открытый бенчмарк MELT-1 — он меряет не сколько модель знает в идеальных условиях (MMLU & co), а сколько она проживёт под дрифтом распределения и сколько стоит держать её живой. Три оси: $/1M успешных решений, часы до деградации без ретрейна, p99-латентность сенсор→актуатор под 40 °C. 30 суток непрерывного инференса, 5 сидов, два температурных профиля, sensitivity-анализ. На closed-loop manipulation наш агент (Metabolic AI, non-transformer) против Llama-class 7B INT8 показал 9.4× по стоимости, 8.5× по выживанию под дрифтом, ~1600× композитно. Архитектура закрыта — патент на стадии экспертизы. Бенч открытый: харнесс, сцены, оракул, sensitivity-скрипты, опубликованный VAE-энкодер дрифта. Прогоните своих агентов и положите рядом. PDF с полной методологией и threats to validity — в конце статьи. Посмотреть

    habr.com/ru/articles/1036098/

    #inference #aiагенты #суверенный_ии

  2. MELT-1: трансформер 7B сдыхает за 11 часов, а наш агент живёт 95

    TL;DR. Мы выкатили открытый бенчмарк MELT-1 — он меряет не сколько модель знает в идеальных условиях (MMLU & co), а сколько она проживёт под дрифтом распределения и сколько стоит держать её живой. Три оси: $/1M успешных решений, часы до деградации без ретрейна, p99-латентность сенсор→актуатор под 40 °C. 30 суток непрерывного инференса, 5 сидов, два температурных профиля, sensitivity-анализ. На closed-loop manipulation наш агент (Metabolic AI, non-transformer) против Llama-class 7B INT8 показал 9.4× по стоимости, 8.5× по выживанию под дрифтом, ~1600× композитно. Архитектура закрыта — патент на стадии экспертизы. Бенч открытый: харнесс, сцены, оракул, sensitivity-скрипты, опубликованный VAE-энкодер дрифта. Прогоните своих агентов и положите рядом. PDF с полной методологией и threats to validity — в конце статьи. Посмотреть

    habr.com/ru/articles/1036098/

    #inference #aiагенты #суверенный_ии

  3. MELT-1: трансформер 7B сдыхает за 11 часов, а наш агент живёт 95

    TL;DR. Мы выкатили открытый бенчмарк MELT-1 — он меряет не сколько модель знает в идеальных условиях (MMLU & co), а сколько она проживёт под дрифтом распределения и сколько стоит держать её живой. Три оси: $/1M успешных решений, часы до деградации без ретрейна, p99-латентность сенсор→актуатор под 40 °C. 30 суток непрерывного инференса, 5 сидов, два температурных профиля, sensitivity-анализ. На closed-loop manipulation наш агент (Metabolic AI, non-transformer) против Llama-class 7B INT8 показал 9.4× по стоимости, 8.5× по выживанию под дрифтом, ~1600× композитно. Архитектура закрыта — патент на стадии экспертизы. Бенч открытый: харнесс, сцены, оракул, sensitivity-скрипты, опубликованный VAE-энкодер дрифта. Прогоните своих агентов и положите рядом. PDF с полной методологией и threats to validity — в конце статьи. Посмотреть

    habr.com/ru/articles/1036098/

    #inference #aiагенты #суверенный_ии

  4. MELT-1: трансформер 7B сдыхает за 11 часов, а наш агент живёт 95

    TL;DR. Мы выкатили открытый бенчмарк MELT-1 — он меряет не сколько модель знает в идеальных условиях (MMLU & co), а сколько она проживёт под дрифтом распределения и сколько стоит держать её живой. Три оси: $/1M успешных решений, часы до деградации без ретрейна, p99-латентность сенсор→актуатор под 40 °C. 30 суток непрерывного инференса, 5 сидов, два температурных профиля, sensitivity-анализ. На closed-loop manipulation наш агент (Metabolic AI, non-transformer) против Llama-class 7B INT8 показал 9.4× по стоимости, 8.5× по выживанию под дрифтом, ~1600× композитно. Архитектура закрыта — патент на стадии экспертизы. Бенч открытый: харнесс, сцены, оракул, sensitivity-скрипты, опубликованный VAE-энкодер дрифта. Прогоните своих агентов и положите рядом. PDF с полной методологией и threats to validity — в конце статьи. Посмотреть

    habr.com/ru/articles/1036098/

    #inference #aiагенты #суверенный_ии

  5. Россия — третий полюс мирового AI. Агентов запускаем на Raspberry Pi

    a16z включил Россию в тройку AI-держав - наряду с Западом и Китаем. Яндекс Браузер в топ-10 мировых AI-приложений. GigaChat дебютировал в глобальном рейтинге. А потом смотришь на цифры изнутри - и видишь 48-е место, GPU-голод и агентов на Raspberry Pi.

    habr.com/ru/articles/1015782/

    #AI #Россия #суверенный_ИИ #GigaChat #YandexGPT #GPU #a16z

  6. Geometry > Scale 2.0.: Манифест LILA: Как замерзшие пальцы и 10 строк кода обнуляют 7 триллионов Сэма Альтмана

    Пока Сэм Альтман и Qualcomm греются в лучах своих триллионов и играют в гольф запуская конкурсы по эффективным SML (задним числом), через неделю после моего поста на reddit и Хабре про Lila-E8 ( с мемом про Сэма 🤣 похоже мем дошел до него ) Sovereign-Lila-Leech родилась из замерзших пальцев в маршрутке и опыта физики частиц. Я заморозил 240 корней E8 на треке физики , а затем и ядро Лича, сделав их Source of Truth для интеллекта. Математика не должна вычисляться – она должна существовать. В Lila Leech замороженное ядро – это ледяная игла, пробивающая пузырь корпоративного ИИ.

    habr.com/ru/articles/1013680/

    #leech #e8 #ai #Lila #суверенный_ии

  7. Я изучил десятки ИИ-стартапов в России. Вот почему большинство из них обречены

    За последний год я изучил десятки российских ИИ-стартапов на площадках Brainbox и Product Radar. Параллельно строил собственную AI-платформу, так что смотрю на рынок не как инвестор, а как инженер с 20-летним опытом в разработке. Картина неутешительная: большинство проектов, которые собирают деньги, будут мертвы через 2-3 года. И причины чисто технические.

    habr.com/ru/articles/1008142/

    #ИИстартапы #инвестиции_в_ИИ #opensource_LLM #DeepSeek #Qwen #архитектура_ИИагентов #суверенный_ИИ #импортозамещение #OpenAI_API_зависимость #LLMроутер

  8. Я изучил десятки ИИ-стартапов в России. Вот почему большинство из них обречены

    За последний год я изучил десятки российских ИИ-стартапов на площадках Brainbox и Product Radar. Параллельно строил собственную AI-платформу, так что смотрю на рынок не как инвестор, а как инженер с 20-летним опытом в разработке. Картина неутешительная: большинство проектов, которые собирают деньги, будут мертвы через 2-3 года. И причины чисто технические.

    habr.com/ru/articles/1008142/

    #ИИстартапы #инвестиции_в_ИИ #opensource_LLM #DeepSeek #Qwen #архитектура_ИИагентов #суверенный_ИИ #импортозамещение #OpenAI_API_зависимость #LLMроутер

  9. Я изучил десятки ИИ-стартапов в России. Вот почему большинство из них обречены

    За последний год я изучил десятки российских ИИ-стартапов на площадках Brainbox и Product Radar. Параллельно строил собственную AI-платформу, так что смотрю на рынок не как инвестор, а как инженер с 20-летним опытом в разработке. Картина неутешительная: большинство проектов, которые собирают деньги, будут мертвы через 2-3 года. И причины чисто технические.

    habr.com/ru/articles/1008142/

    #ИИстартапы #инвестиции_в_ИИ #opensource_LLM #DeepSeek #Qwen #архитектура_ИИагентов #суверенный_ИИ #импортозамещение #OpenAI_API_зависимость #LLMроутер

  10. Я изучил десятки ИИ-стартапов в России. Вот почему большинство из них обречены

    За последний год я изучил десятки российских ИИ-стартапов на площадках Brainbox и Product Radar. Параллельно строил собственную AI-платформу, так что смотрю на рынок не как инвестор, а как инженер с 20-летним опытом в разработке. Картина неутешительная: большинство проектов, которые собирают деньги, будут мертвы через 2-3 года. И причины чисто технические.

    habr.com/ru/articles/1008142/

    #ИИстартапы #инвестиции_в_ИИ #opensource_LLM #DeepSeek #Qwen #архитектура_ИИагентов #суверенный_ИИ #импортозамещение #OpenAI_API_зависимость #LLMроутер