#hugging_face — Public Fediverse posts on home.social

CyberVeille.ch @[email protected] · 2026-05-09 · 21:30 UTC

📢 Faux dépôt OpenAI sur Hugging Face distribue un infostealer Rust via typosquatting
📝 ## 🗓️ Contexte

Source : BleepingComputer, publié le 9 mai 2026.
📖 cyberveille : https://cyberveille.ch/posts/2026-05-09-faux-depot-openai-sur-hugging-face-distribue-un-infostealer-rust-via-typosquatting/
🌐 source : https://www.bleepingcomputer.com/news/security/fake-openai-repository-on-hugging-face-pushes-infostealer-malware/
#Hugging_Face #IOC #Cyberveille

#cyberveille #ioc #hugging_face

Habr @[email protected] · 2026-04-29 · 13:12 UTC

Окружайте, так удобнее промахиваться! Встроенные в Hugging Face проверки ML-моделей против одного сканера

В предыдущей статье " Сканеры ML-моделей: разбор инструментов и некоторых методов обхода их проверок " был представлен обзор основных статических сканеров артефактов ML-моделей. В выводах сканер ModelAudit был выделен как наиболее зрелое решение среди проанализированных конкурентов по следующим критериям: - количество поддерживаемых к сканированию форматов хранения моделей; - количество проверок под каждый формат моделей; - результаты моих попыток обхода сканеров; - наличие и качество документации. Но, как известно, количество не всегда отражает качество. Для оценки возможностей сканера в более приближенных к реальности условиях я провел множество экспериментов и хочу поделиться двумя наиболее интересными: - сканирование подмножества моделей из Hugging Face, сериализованных в виде наиболее опасных форматов хранения моделей; - сканирование таких моделей из Hugging Face, помеченных самими авторами как зловредные (в названии или описании), с последующим сравнением сработок ModelAudit с результатами проверок встроенных в Hugging Face инструментов.

https://habr.com/ru/articles/1027192/

#Статические_сканеры_MLмоделей #mlsecops #ai_security #ModelAudit #hugging_face

#hugging_face #modelaudit #ai_security #mlsecops #статические_сканеры_mlмоделей

Habr @[email protected] · 2026-04-29 · 13:12 UTC

Окружайте, так удобнее промахиваться! Встроенные в Hugging Face проверки ML-моделей против одного сканера

В предыдущей статье " Сканеры ML-моделей: разбор инструментов и некоторых методов обхода их проверок " был представлен обзор основных статических сканеров артефактов ML-моделей. В выводах сканер ModelAudit был выделен как наиболее зрелое решение среди проанализированных конкурентов по следующим критериям: - количество поддерживаемых к сканированию форматов хранения моделей; - количество проверок под каждый формат моделей; - результаты моих попыток обхода сканеров; - наличие и качество документации. Но, как известно, количество не всегда отражает качество. Для оценки возможностей сканера в более приближенных к реальности условиях я провел множество экспериментов и хочу поделиться двумя наиболее интересными: - сканирование подмножества моделей из Hugging Face, сериализованных в виде наиболее опасных форматов хранения моделей; - сканирование таких моделей из Hugging Face, помеченных самими авторами как зловредные (в названии или описании), с последующим сравнением сработок ModelAudit с результатами проверок встроенных в Hugging Face инструментов.

https://habr.com/ru/articles/1027192/

#Статические_сканеры_MLмоделей #mlsecops #ai_security #ModelAudit #hugging_face

#hugging_face #modelaudit #ai_security #mlsecops #статические_сканеры_mlмоделей

Habr @[email protected] · 2026-04-29 · 13:12 UTC

Окружайте, так удобнее промахиваться! Встроенные в Hugging Face проверки ML-моделей против одного сканера

В предыдущей статье " Сканеры ML-моделей: разбор инструментов и некоторых методов обхода их проверок " был представлен обзор основных статических сканеров артефактов ML-моделей. В выводах сканер ModelAudit был выделен как наиболее зрелое решение среди проанализированных конкурентов по следующим критериям: - количество поддерживаемых к сканированию форматов хранения моделей; - количество проверок под каждый формат моделей; - результаты моих попыток обхода сканеров; - наличие и качество документации. Но, как известно, количество не всегда отражает качество. Для оценки возможностей сканера в более приближенных к реальности условиях я провел множество экспериментов и хочу поделиться двумя наиболее интересными: - сканирование подмножества моделей из Hugging Face, сериализованных в виде наиболее опасных форматов хранения моделей; - сканирование таких моделей из Hugging Face, помеченных самими авторами как зловредные (в названии или описании), с последующим сравнением сработок ModelAudit с результатами проверок встроенных в Hugging Face инструментов.

https://habr.com/ru/articles/1027192/

#Статические_сканеры_MLмоделей #mlsecops #ai_security #ModelAudit #hugging_face

#hugging_face #modelaudit #ai_security #mlsecops #статические_сканеры_mlмоделей

Habr @[email protected] · 2026-04-29 · 13:12 UTC

Окружайте, так удобнее промахиваться! Встроенные в Hugging Face проверки ML-моделей против одного сканера

В предыдущей статье " Сканеры ML-моделей: разбор инструментов и некоторых методов обхода их проверок " был представлен обзор основных статических сканеров артефактов ML-моделей. В выводах сканер ModelAudit был выделен как наиболее зрелое решение среди проанализированных конкурентов по следующим критериям: - количество поддерживаемых к сканированию форматов хранения моделей; - количество проверок под каждый формат моделей; - результаты моих попыток обхода сканеров; - наличие и качество документации. Но, как известно, количество не всегда отражает качество. Для оценки возможностей сканера в более приближенных к реальности условиях я провел множество экспериментов и хочу поделиться двумя наиболее интересными: - сканирование подмножества моделей из Hugging Face, сериализованных в виде наиболее опасных форматов хранения моделей; - сканирование таких моделей из Hugging Face, помеченных самими авторами как зловредные (в названии или описании), с последующим сравнением сработок ModelAudit с результатами проверок встроенных в Hugging Face инструментов.

https://habr.com/ru/articles/1027192/

#Статические_сканеры_MLмоделей #mlsecops #ai_security #ModelAudit #hugging_face

#статические_сканеры_mlмоделей #mlsecops #ai_security #modelaudit #hugging_face

Habr @[email protected] · 2026-04-25 · 12:32 UTC

ИИ дал одиночке студию. Проблема в том, что студия арендована

Про route.yaml, авторство в пайплайнах и почему open source без экономики рискует снова стать кормом для платформ

https://habr.com/ru/articles/1027828/

#ИИ #генеративный_ИИ #open_source #AIинфраструктура #маршруты_между_моделями #provenance #workflow #Hugging_Face #протоколы #авторство

#авторство #протоколы #hugging_face #workflow #provenance #маршруты_между_моделями

Habr @[email protected] · 2026-04-25 · 12:32 UTC

ИИ дал одиночке студию. Проблема в том, что студия арендована

Про route.yaml, авторство в пайплайнах и почему open source без экономики рискует снова стать кормом для платформ

https://habr.com/ru/articles/1027828/

#ИИ #генеративный_ИИ #open_source #AIинфраструктура #маршруты_между_моделями #provenance #workflow #Hugging_Face #протоколы #авторство

#авторство #протоколы #hugging_face #workflow #provenance #маршруты_между_моделями

Habr @[email protected] · 2026-04-25 · 12:32 UTC

ИИ дал одиночке студию. Проблема в том, что студия арендована

Про route.yaml, авторство в пайплайнах и почему open source без экономики рискует снова стать кормом для платформ

https://habr.com/ru/articles/1027828/

#ИИ #генеративный_ИИ #open_source #AIинфраструктура #маршруты_между_моделями #provenance #workflow #Hugging_Face #протоколы #авторство

#авторство #протоколы #hugging_face #workflow #provenance #маршруты_между_моделями

Habr @[email protected] · 2026-04-25 · 12:32 UTC

ИИ дал одиночке студию. Проблема в том, что студия арендована

Про route.yaml, авторство в пайплайнах и почему open source без экономики рискует снова стать кормом для платформ

https://habr.com/ru/articles/1027828/

#ИИ #генеративный_ИИ #open_source #AIинфраструктура #маршруты_между_моделями #provenance #workflow #Hugging_Face #протоколы #авторство

#ии #генеративный_ии #open_source #aiинфраструктура #маршруты_между_моделями #provenance

Habr @[email protected] · 2026-04-21 · 12:02 UTC

[Перевод] OCR всё прочитал, но ничего не понял: как мы научили систему разбирать транспортные накладные

Современные библиотеки компьютерного зрения позволяют получить результат буквально за несколько строк кода, но за этой простотой скрывается ряд практических ограничений и компромиссов. В статье разберём, как на самом деле работают модели «из коробки», где проходит граница их применимости и как из сырых выходов детекторов собрать осмысленную логику — от базового inference до сценариев видеоаналитики. Речь пойдёт о прикладном использовании инструментов вроде YOLO, OpenCV и Hugging Face в задачах, где важен не только сам факт распознавания, но и то, что с этим делать дальше.

https://habr.com/ru/companies/otus/articles/1026088/

#компьютерное_зрение #CV #YOLO #OpenCV #Hugging_Face #детекция_объектов #сегментация_изображений #видеоаналитика #анализ_изображений

#анализ_изображений #видеоаналитика #сегментация_изображений #детекция_объектов #hugging_face #opencv

Habr @[email protected] · 2026-04-13 · 07:42 UTC

Как мы провели лоботомию 744-миллиардной нейросети GLM-5.1, чтобы запустить её на 16 ГБ VRAM

У нас не было фермы. У нас была бесплатная виртуальная машина на Kaggle с одной старушкой NVIDIA T4 на 16 ГБ VRAM. И у нас была концепция экстремального MLOps под кодовым названием «Russian Winter 26» . В этой статье я расскажу, как мы вскрыли архитектуру самого тяжелого китайского гиганта, переписали математику матриц внимания, обошли хардкодные ограничения GQA и заставили ядро модели сделать первый вдох на бесплатном железе.

https://habr.com/ru/articles/1022686/

#LLM #MLOps #Hugging_Face #PyTorch #GLM51 #Kaggle #нейросети #оптимизация #тензоры #искусственный_интеллект

#искусственный_интеллект #тензоры #оптимизация #нейросети #kaggle #glm51

Habr @[email protected] · 2026-04-13 · 07:42 UTC

Как мы провели лоботомию 744-миллиардной нейросети GLM-5.1, чтобы запустить её на 16 ГБ VRAM

У нас не было фермы. У нас была бесплатная виртуальная машина на Kaggle с одной старушкой NVIDIA T4 на 16 ГБ VRAM. И у нас была концепция экстремального MLOps под кодовым названием «Russian Winter 26» . В этой статье я расскажу, как мы вскрыли архитектуру самого тяжелого китайского гиганта, переписали математику матриц внимания, обошли хардкодные ограничения GQA и заставили ядро модели сделать первый вдох на бесплатном железе.

https://habr.com/ru/articles/1022686/

#LLM #MLOps #Hugging_Face #PyTorch #GLM51 #Kaggle #нейросети #оптимизация #тензоры #искусственный_интеллект

#искусственный_интеллект #тензоры #оптимизация #нейросети #kaggle #glm51

Habr @[email protected] · 2026-04-13 · 07:42 UTC

Как мы провели лоботомию 744-миллиардной нейросети GLM-5.1, чтобы запустить её на 16 ГБ VRAM

У нас не было фермы. У нас была бесплатная виртуальная машина на Kaggle с одной старушкой NVIDIA T4 на 16 ГБ VRAM. И у нас была концепция экстремального MLOps под кодовым названием «Russian Winter 26» . В этой статье я расскажу, как мы вскрыли архитектуру самого тяжелого китайского гиганта, переписали математику матриц внимания, обошли хардкодные ограничения GQA и заставили ядро модели сделать первый вдох на бесплатном железе.

https://habr.com/ru/articles/1022686/

#LLM #MLOps #Hugging_Face #PyTorch #GLM51 #Kaggle #нейросети #оптимизация #тензоры #искусственный_интеллект

#искусственный_интеллект #тензоры #оптимизация #нейросети #kaggle #glm51

Habr @[email protected] · 2026-04-13 · 07:42 UTC

Как мы провели лоботомию 744-миллиардной нейросети GLM-5.1, чтобы запустить её на 16 ГБ VRAM

У нас не было фермы. У нас была бесплатная виртуальная машина на Kaggle с одной старушкой NVIDIA T4 на 16 ГБ VRAM. И у нас была концепция экстремального MLOps под кодовым названием «Russian Winter 26» . В этой статье я расскажу, как мы вскрыли архитектуру самого тяжелого китайского гиганта, переписали математику матриц внимания, обошли хардкодные ограничения GQA и заставили ядро модели сделать первый вдох на бесплатном железе.

https://habr.com/ru/articles/1022686/

#LLM #MLOps #Hugging_Face #PyTorch #GLM51 #Kaggle #нейросети #оптимизация #тензоры #искусственный_интеллект

#llm #mlops #hugging_face #pytorch #glm51 #kaggle

Habr @[email protected] · 2026-04-07 · 18:02 UTC

Как мы перестали писать промпты и превратили ИИ в аналоговый синтезатор через PyTorch Hooks

Спойлер: Никаких банальных ИИ-оберток, где текст конвертируется в звук через API. Только хардкорная хирургия нейросетей, кросс-модальные мосты и перехват мыслей LLM в реальном времени. За последний год Hugging Face превратился в конвейер одинаковых проектов: берем Llama/Gemma, прикручиваем к ней интерфейс на Gradio, называем это стартапом. Мы для нашего виртуального музыкального артиста Livadies решили пойти другим путем. Мы задались вопросом: как звучит чистая мысль нейросети, если не переводить ее в текст? И как звучит математическая геометрия доисторического камня или кожи рептилии? Чтобы это выяснить, нам пришлось вскрывать архитектуры SOTA-моделей и сшивать их напрямую на уровне тензоров. Вот два наших главных инженерных эксперимента.

https://habr.com/ru/articles/1020544/

#pytorch #Hugging_Face #LLM #генерация_музыки #dsp #monkey_patching #кроссмодальность #Livadies #generative_art

#generative_art #livadies #кроссмодальность #monkey_patching #dsp #генерация_музыки

Habr @[email protected] · 2026-04-07 · 18:02 UTC

Как мы перестали писать промпты и превратили ИИ в аналоговый синтезатор через PyTorch Hooks

Спойлер: Никаких банальных ИИ-оберток, где текст конвертируется в звук через API. Только хардкорная хирургия нейросетей, кросс-модальные мосты и перехват мыслей LLM в реальном времени. За последний год Hugging Face превратился в конвейер одинаковых проектов: берем Llama/Gemma, прикручиваем к ней интерфейс на Gradio, называем это стартапом. Мы для нашего виртуального музыкального артиста Livadies решили пойти другим путем. Мы задались вопросом: как звучит чистая мысль нейросети, если не переводить ее в текст? И как звучит математическая геометрия доисторического камня или кожи рептилии? Чтобы это выяснить, нам пришлось вскрывать архитектуры SOTA-моделей и сшивать их напрямую на уровне тензоров. Вот два наших главных инженерных эксперимента.

https://habr.com/ru/articles/1020544/

#pytorch #Hugging_Face #LLM #генерация_музыки #dsp #monkey_patching #кроссмодальность #Livadies #generative_art

#generative_art #livadies #кроссмодальность #monkey_patching #dsp #генерация_музыки

Habr @[email protected] · 2026-04-07 · 18:02 UTC

Как мы перестали писать промпты и превратили ИИ в аналоговый синтезатор через PyTorch Hooks

Спойлер: Никаких банальных ИИ-оберток, где текст конвертируется в звук через API. Только хардкорная хирургия нейросетей, кросс-модальные мосты и перехват мыслей LLM в реальном времени. За последний год Hugging Face превратился в конвейер одинаковых проектов: берем Llama/Gemma, прикручиваем к ней интерфейс на Gradio, называем это стартапом. Мы для нашего виртуального музыкального артиста Livadies решили пойти другим путем. Мы задались вопросом: как звучит чистая мысль нейросети, если не переводить ее в текст? И как звучит математическая геометрия доисторического камня или кожи рептилии? Чтобы это выяснить, нам пришлось вскрывать архитектуры SOTA-моделей и сшивать их напрямую на уровне тензоров. Вот два наших главных инженерных эксперимента.

https://habr.com/ru/articles/1020544/

#pytorch #Hugging_Face #LLM #генерация_музыки #dsp #monkey_patching #кроссмодальность #Livadies #generative_art

#generative_art #livadies #кроссмодальность #monkey_patching #dsp #генерация_музыки

Habr @[email protected] · 2026-04-07 · 18:02 UTC

Как мы перестали писать промпты и превратили ИИ в аналоговый синтезатор через PyTorch Hooks

Спойлер: Никаких банальных ИИ-оберток, где текст конвертируется в звук через API. Только хардкорная хирургия нейросетей, кросс-модальные мосты и перехват мыслей LLM в реальном времени. За последний год Hugging Face превратился в конвейер одинаковых проектов: берем Llama/Gemma, прикручиваем к ней интерфейс на Gradio, называем это стартапом. Мы для нашего виртуального музыкального артиста Livadies решили пойти другим путем. Мы задались вопросом: как звучит чистая мысль нейросети, если не переводить ее в текст? И как звучит математическая геометрия доисторического камня или кожи рептилии? Чтобы это выяснить, нам пришлось вскрывать архитектуры SOTA-моделей и сшивать их напрямую на уровне тензоров. Вот два наших главных инженерных эксперимента.

https://habr.com/ru/articles/1020544/

#pytorch #Hugging_Face #LLM #генерация_музыки #dsp #monkey_patching #кроссмодальность #Livadies #generative_art

#pytorch #hugging_face #llm #генерация_музыки #dsp #monkey_patching

Habr @[email protected] · 2026-04-05 · 18:02 UTC

Топ локальных нейросетей 2026: полный суверенитет без интернета

Я долгое время была в отношениях с облачными нейросетями. Это было удобно, даже комфортно. Открыла браузер, написала промпт и через пару секунд получила ответ. Но в последнее время отношения начали давать трещину. Интернет стал неотъемлемой частью нашей жизни, но в 2026 году мир переживает непростые времена. Ситуация крайне нестабильна, и это вызывает у каждого чувство неуверенности. Возникает закономерный вопрос: а можно ли как-то подстраховаться? Чтобы нейросеть всегда была под рукой, даже когда провайдер решил устроить себе выходной или на телефон пришло очередное оповещение о беспилотной опасности. Оказалось, что можно. И не просто можно, а вполне себе комфортно. К 2026 году локальные нейросети доросли до того состояния, когда их действительно имеет смысл использовать. Не как хобби для гиков с тремя видеокартами в башне, а как рабочий инструмент. Они всё ещё требуют некоторых технических знаний (куда без них). Но порог входа заметно снизился. В этой статье я собрала шесть инструментов, которые работают полностью без интернета. Ну, почти полностью - устанавливать их придётся онлайн, но после этого можно смело отключать Wi-Fi и наслаждаться цифровым суверенитетом. Приятного прочтения!

https://habr.com/ru/companies/bothub/articles/1019314/

#ии #ии_и_машинное_обучение #ai #локальные_модели #ии_модели #облачные_нейросети #цифровой_суверенитет #Hugging_Face #GPT4All

#gpt4all #hugging_face #цифровой_суверенитет #облачные_нейросети #ии_модели #локальные_модели

Habr @[email protected] · 2026-04-05 · 18:02 UTC

Топ локальных нейросетей 2026: полный суверенитет без интернета

Я долгое время была в отношениях с облачными нейросетями. Это было удобно, даже комфортно. Открыла браузер, написала промпт и через пару секунд получила ответ. Но в последнее время отношения начали давать трещину. Интернет стал неотъемлемой частью нашей жизни, но в 2026 году мир переживает непростые времена. Ситуация крайне нестабильна, и это вызывает у каждого чувство неуверенности. Возникает закономерный вопрос: а можно ли как-то подстраховаться? Чтобы нейросеть всегда была под рукой, даже когда провайдер решил устроить себе выходной или на телефон пришло очередное оповещение о беспилотной опасности. Оказалось, что можно. И не просто можно, а вполне себе комфортно. К 2026 году локальные нейросети доросли до того состояния, когда их действительно имеет смысл использовать. Не как хобби для гиков с тремя видеокартами в башне, а как рабочий инструмент. Они всё ещё требуют некоторых технических знаний (куда без них). Но порог входа заметно снизился. В этой статье я собрала шесть инструментов, которые работают полностью без интернета. Ну, почти полностью - устанавливать их придётся онлайн, но после этого можно смело отключать Wi-Fi и наслаждаться цифровым суверенитетом. Приятного прочтения!

https://habr.com/ru/companies/bothub/articles/1019314/

#ии #ии_и_машинное_обучение #ai #локальные_модели #ии_модели #облачные_нейросети #цифровой_суверенитет #Hugging_Face #GPT4All

#gpt4all #hugging_face #цифровой_суверенитет #облачные_нейросети #ии_модели #локальные_модели

Habr @[email protected] · 2026-04-05 · 18:02 UTC

Топ локальных нейросетей 2026: полный суверенитет без интернета

Я долгое время была в отношениях с облачными нейросетями. Это было удобно, даже комфортно. Открыла браузер, написала промпт и через пару секунд получила ответ. Но в последнее время отношения начали давать трещину. Интернет стал неотъемлемой частью нашей жизни, но в 2026 году мир переживает непростые времена. Ситуация крайне нестабильна, и это вызывает у каждого чувство неуверенности. Возникает закономерный вопрос: а можно ли как-то подстраховаться? Чтобы нейросеть всегда была под рукой, даже когда провайдер решил устроить себе выходной или на телефон пришло очередное оповещение о беспилотной опасности. Оказалось, что можно. И не просто можно, а вполне себе комфортно. К 2026 году локальные нейросети доросли до того состояния, когда их действительно имеет смысл использовать. Не как хобби для гиков с тремя видеокартами в башне, а как рабочий инструмент. Они всё ещё требуют некоторых технических знаний (куда без них). Но порог входа заметно снизился. В этой статье я собрала шесть инструментов, которые работают полностью без интернета. Ну, почти полностью - устанавливать их придётся онлайн, но после этого можно смело отключать Wi-Fi и наслаждаться цифровым суверенитетом. Приятного прочтения!

https://habr.com/ru/companies/bothub/articles/1019314/

#ии #ии_и_машинное_обучение #ai #локальные_модели #ии_модели #облачные_нейросети #цифровой_суверенитет #Hugging_Face #GPT4All

#gpt4all #hugging_face #цифровой_суверенитет #облачные_нейросети #ии_модели #локальные_модели

Habr @[email protected] · 2026-04-05 · 18:02 UTC

Топ локальных нейросетей 2026: полный суверенитет без интернета

Я долгое время была в отношениях с облачными нейросетями. Это было удобно, даже комфортно. Открыла браузер, написала промпт и через пару секунд получила ответ. Но в последнее время отношения начали давать трещину. Интернет стал неотъемлемой частью нашей жизни, но в 2026 году мир переживает непростые времена. Ситуация крайне нестабильна, и это вызывает у каждого чувство неуверенности. Возникает закономерный вопрос: а можно ли как-то подстраховаться? Чтобы нейросеть всегда была под рукой, даже когда провайдер решил устроить себе выходной или на телефон пришло очередное оповещение о беспилотной опасности. Оказалось, что можно. И не просто можно, а вполне себе комфортно. К 2026 году локальные нейросети доросли до того состояния, когда их действительно имеет смысл использовать. Не как хобби для гиков с тремя видеокартами в башне, а как рабочий инструмент. Они всё ещё требуют некоторых технических знаний (куда без них). Но порог входа заметно снизился. В этой статье я собрала шесть инструментов, которые работают полностью без интернета. Ну, почти полностью - устанавливать их придётся онлайн, но после этого можно смело отключать Wi-Fi и наслаждаться цифровым суверенитетом. Приятного прочтения!

https://habr.com/ru/companies/bothub/articles/1019314/

#ии #ии_и_машинное_обучение #ai #локальные_модели #ии_модели #облачные_нейросети #цифровой_суверенитет #Hugging_Face #GPT4All

#ии #ии_и_машинное_обучение #ai #локальные_модели #ии_модели #облачные_нейросети

Habr @[email protected] · 2026-04-02 · 18:42 UTC

Как засунуть 62ГБ в 15ГБ и не сойти с ума: Партизанский MLOps на примере Gemma 4 31B

TL;DR: В этой статье мы возьмем новейшую Gemma 4 31B, которая в оригинале весит 62 ГБ, и заставим её работать и выгружаться на бесплатном Kaggle с лимитом диска в 57 ГБ. Спойлер: нам придется удалять исходники прямо во время работы Python-скрипта.

https://habr.com/ru/articles/1018682/

#Gemma_4 #LLM #MLOps #Kaggle #Hugging_Face #bitsandbytes #Квантование #NF4 #Transformers #Python

#python #transformers #nf4 #квантование #bitsandbytes #hugging_face

Habr @[email protected] · 2026-04-02 · 18:42 UTC

Как засунуть 62ГБ в 15ГБ и не сойти с ума: Партизанский MLOps на примере Gemma 4 31B

TL;DR: В этой статье мы возьмем новейшую Gemma 4 31B, которая в оригинале весит 62 ГБ, и заставим её работать и выгружаться на бесплатном Kaggle с лимитом диска в 57 ГБ. Спойлер: нам придется удалять исходники прямо во время работы Python-скрипта.

https://habr.com/ru/articles/1018682/

#Gemma_4 #LLM #MLOps #Kaggle #Hugging_Face #bitsandbytes #Квантование #NF4 #Transformers #Python

#python #transformers #nf4 #квантование #bitsandbytes #hugging_face

Habr @[email protected] · 2026-04-02 · 18:42 UTC

Как засунуть 62ГБ в 15ГБ и не сойти с ума: Партизанский MLOps на примере Gemma 4 31B

TL;DR: В этой статье мы возьмем новейшую Gemma 4 31B, которая в оригинале весит 62 ГБ, и заставим её работать и выгружаться на бесплатном Kaggle с лимитом диска в 57 ГБ. Спойлер: нам придется удалять исходники прямо во время работы Python-скрипта.

https://habr.com/ru/articles/1018682/

#Gemma_4 #LLM #MLOps #Kaggle #Hugging_Face #bitsandbytes #Квантование #NF4 #Transformers #Python

#python #transformers #nf4 #квантование #bitsandbytes #hugging_face

Habr @[email protected] · 2026-04-02 · 18:42 UTC

Как засунуть 62ГБ в 15ГБ и не сойти с ума: Партизанский MLOps на примере Gemma 4 31B

TL;DR: В этой статье мы возьмем новейшую Gemma 4 31B, которая в оригинале весит 62 ГБ, и заставим её работать и выгружаться на бесплатном Kaggle с лимитом диска в 57 ГБ. Спойлер: нам придется удалять исходники прямо во время работы Python-скрипта.

https://habr.com/ru/articles/1018682/

#Gemma_4 #LLM #MLOps #Kaggle #Hugging_Face #bitsandbytes #Квантование #NF4 #Transformers #Python

#gemma_4 #llm #mlops #kaggle #hugging_face #bitsandbytes

Habr @[email protected] · 2026-03-29 · 16:22 UTC

MitM-прокси для LLM

Многие разработчики в последнее время используют облачные LLM для генерации программного кода, в том числе с помощью агентов. Но это вызывает как минимум две проблемы: Утечка информации: мы не знаем, какие данные LLM передаёт в облако Бесконтрольный расход токенов, особенно в случае автоматических агентов, которые запускаются в автономную работу на длительный период Для этого есть специальные инструменты мониторинга. Например, Tokentap (бывший Sherlock) отслеживает использование токенов для LLM CLI в реальном времени на панели в консоли. Такой MitM-прокси полезен для информационной безопасности и просто для учёта расходов.

https://habr.com/ru/companies/globalsign/articles/1016612/

#MitM #Hugging_Face #llamaccp #ggml #Local_AI #Gemini_CLI #Claude_Code #OpenAI_Codex #mitmproxy #HTTPSпрокси

#httpsпрокси #mitmproxy #openai_codex #claude_code #gemini_cli #local_ai

Habr @[email protected] · 2026-03-29 · 16:22 UTC

MitM-прокси для LLM

Многие разработчики в последнее время используют облачные LLM для генерации программного кода, в том числе с помощью агентов. Но это вызывает как минимум две проблемы: Утечка информации: мы не знаем, какие данные LLM передаёт в облако Бесконтрольный расход токенов, особенно в случае автоматических агентов, которые запускаются в автономную работу на длительный период Для этого есть специальные инструменты мониторинга. Например, Tokentap (бывший Sherlock) отслеживает использование токенов для LLM CLI в реальном времени на панели в консоли. Такой MitM-прокси полезен для информационной безопасности и просто для учёта расходов.

https://habr.com/ru/companies/globalsign/articles/1016612/

#MitM #Hugging_Face #llamaccp #ggml #Local_AI #Gemini_CLI #Claude_Code #OpenAI_Codex #mitmproxy #HTTPSпрокси

#httpsпрокси #mitmproxy #openai_codex #claude_code #gemini_cli #local_ai

Habr @[email protected] · 2026-03-29 · 16:22 UTC

MitM-прокси для LLM

Многие разработчики в последнее время используют облачные LLM для генерации программного кода, в том числе с помощью агентов. Но это вызывает как минимум две проблемы: Утечка информации: мы не знаем, какие данные LLM передаёт в облако Бесконтрольный расход токенов, особенно в случае автоматических агентов, которые запускаются в автономную работу на длительный период Для этого есть специальные инструменты мониторинга. Например, Tokentap (бывший Sherlock) отслеживает использование токенов для LLM CLI в реальном времени на панели в консоли. Такой MitM-прокси полезен для информационной безопасности и просто для учёта расходов.

https://habr.com/ru/companies/globalsign/articles/1016612/

#MitM #Hugging_Face #llamaccp #ggml #Local_AI #Gemini_CLI #Claude_Code #OpenAI_Codex #mitmproxy #HTTPSпрокси

#httpsпрокси #mitmproxy #openai_codex #claude_code #gemini_cli #local_ai

Habr @[email protected] · 2026-03-29 · 16:22 UTC

MitM-прокси для LLM

Многие разработчики в последнее время используют облачные LLM для генерации программного кода, в том числе с помощью агентов. Но это вызывает как минимум две проблемы: Утечка информации: мы не знаем, какие данные LLM передаёт в облако Бесконтрольный расход токенов, особенно в случае автоматических агентов, которые запускаются в автономную работу на длительный период Для этого есть специальные инструменты мониторинга. Например, Tokentap (бывший Sherlock) отслеживает использование токенов для LLM CLI в реальном времени на панели в консоли. Такой MitM-прокси полезен для информационной безопасности и просто для учёта расходов.

https://habr.com/ru/companies/globalsign/articles/1016612/

#MitM #Hugging_Face #llamaccp #ggml #Local_AI #Gemini_CLI #Claude_Code #OpenAI_Codex #mitmproxy #HTTPSпрокси

#mitm #hugging_face #llamaccp #ggml #local_ai #gemini_cli

Habr @[email protected] · 2026-03-22 · 08:12 UTC

От вет-ИИ для коров до имперского глянца: хардкорный MLOps на бесплатных GPU

В начале 2026 года ленты новостей принесли тревожные сообщения из Сибири: массовые вспышки опасных заболеваний у КРС (крупного рогатого скота) привели к необходимости вынужденного забоя тысяч голов. Для многих фермеров это означало потерю бизнеса и средств к существованию. Мы задались вопросом: может ли доступный Computer Vision стать первой линией обороны? Инструментом, который позволит фермеру в отдаленном районе провести первичный скрининг (триаж) животного с помощью обычного смартфона и вовремя вызвать ветеринара, не дожидаясь начала эпидемии. Так родился проект AI-Vet-Scanner ( наше пространство на Hugging Face ), определяющий признаки заболеваний по фотографии.

https://habr.com/ru/articles/1013214/

#MLOps #Kaggle #Computer_Vision #OpenCV #PyMuPDF #Hugging_Face #датасет #парсинг #оптимизация_памяти #SDXL_LoRA

#sdxl_lora #оптимизация_памяти #парсинг #датасет #hugging_face #pymupdf

Habr @[email protected] · 2026-03-22 · 08:12 UTC

От вет-ИИ для коров до имперского глянца: хардкорный MLOps на бесплатных GPU

В начале 2026 года ленты новостей принесли тревожные сообщения из Сибири: массовые вспышки опасных заболеваний у КРС (крупного рогатого скота) привели к необходимости вынужденного забоя тысяч голов. Для многих фермеров это означало потерю бизнеса и средств к существованию. Мы задались вопросом: может ли доступный Computer Vision стать первой линией обороны? Инструментом, который позволит фермеру в отдаленном районе провести первичный скрининг (триаж) животного с помощью обычного смартфона и вовремя вызвать ветеринара, не дожидаясь начала эпидемии. Так родился проект AI-Vet-Scanner ( наше пространство на Hugging Face ), определяющий признаки заболеваний по фотографии.

https://habr.com/ru/articles/1013214/

#MLOps #Kaggle #Computer_Vision #OpenCV #PyMuPDF #Hugging_Face #датасет #парсинг #оптимизация_памяти #SDXL_LoRA

#sdxl_lora #оптимизация_памяти #парсинг #датасет #hugging_face #pymupdf

Habr @[email protected] · 2026-03-22 · 08:12 UTC

От вет-ИИ для коров до имперского глянца: хардкорный MLOps на бесплатных GPU

В начале 2026 года ленты новостей принесли тревожные сообщения из Сибири: массовые вспышки опасных заболеваний у КРС (крупного рогатого скота) привели к необходимости вынужденного забоя тысяч голов. Для многих фермеров это означало потерю бизнеса и средств к существованию. Мы задались вопросом: может ли доступный Computer Vision стать первой линией обороны? Инструментом, который позволит фермеру в отдаленном районе провести первичный скрининг (триаж) животного с помощью обычного смартфона и вовремя вызвать ветеринара, не дожидаясь начала эпидемии. Так родился проект AI-Vet-Scanner ( наше пространство на Hugging Face ), определяющий признаки заболеваний по фотографии.

https://habr.com/ru/articles/1013214/

#MLOps #Kaggle #Computer_Vision #OpenCV #PyMuPDF #Hugging_Face #датасет #парсинг #оптимизация_памяти #SDXL_LoRA

#sdxl_lora #оптимизация_памяти #парсинг #датасет #hugging_face #pymupdf

Habr @[email protected] · 2026-03-22 · 08:12 UTC

От вет-ИИ для коров до имперского глянца: хардкорный MLOps на бесплатных GPU

В начале 2026 года ленты новостей принесли тревожные сообщения из Сибири: массовые вспышки опасных заболеваний у КРС (крупного рогатого скота) привели к необходимости вынужденного забоя тысяч голов. Для многих фермеров это означало потерю бизнеса и средств к существованию. Мы задались вопросом: может ли доступный Computer Vision стать первой линией обороны? Инструментом, который позволит фермеру в отдаленном районе провести первичный скрининг (триаж) животного с помощью обычного смартфона и вовремя вызвать ветеринара, не дожидаясь начала эпидемии. Так родился проект AI-Vet-Scanner ( наше пространство на Hugging Face ), определяющий признаки заболеваний по фотографии.

https://habr.com/ru/articles/1013214/

#MLOps #Kaggle #Computer_Vision #OpenCV #PyMuPDF #Hugging_Face #датасет #парсинг #оптимизация_памяти #SDXL_LoRA

#mlops #kaggle #computer_vision #opencv #pymupdf #hugging_face

Habr @[email protected] · 2026-02-24 · 06:42 UTC

Базовый минимум. Часть 3: RAG-системы

Большая языковая модель это не источник актуальных сведений, а статистическая система, обученная на данных прошлого. Она не обращается к внешним базам знаний и не узнает о новых событиях. Все что она знает было усвоено на этапе обучения и зафиксировано в ее параметрах. В современных прикладных системах это ограничение часто скрыто за инструментами, поиском и дополнительными модулями. Однако именно архитектурный подход Retrieval-Augmented Generation, RAG стал стандартным способом расширения возможностей модели без ее дообучения. Он позволяет подключать внешние базы знаний, работать с актуальными документами и заметно снижать количество галлюцинаций. В третьей части серии Базовый минимум разбирается как устроен RAG и как реализовать его минимальную рабочую версию на практике.

https://habr.com/ru/articles/1002152/

#RAG #RetrievalAugmented_Generation #языковые_модели #векторная_база_данных #эмбеддинги #чанкование #семантический_поиск #векторный_индекс #ChromaDB #Hugging_Face

#hugging_face #chromadb #векторный_индекс #семантический_поиск #чанкование #эмбеддинги

Habr @[email protected] · 2026-02-24 · 06:42 UTC

Базовый минимум. Часть 3: RAG-системы

Большая языковая модель это не источник актуальных сведений, а статистическая система, обученная на данных прошлого. Она не обращается к внешним базам знаний и не узнает о новых событиях. Все что она знает было усвоено на этапе обучения и зафиксировано в ее параметрах. В современных прикладных системах это ограничение часто скрыто за инструментами, поиском и дополнительными модулями. Однако именно архитектурный подход Retrieval-Augmented Generation, RAG стал стандартным способом расширения возможностей модели без ее дообучения. Он позволяет подключать внешние базы знаний, работать с актуальными документами и заметно снижать количество галлюцинаций. В третьей части серии Базовый минимум разбирается как устроен RAG и как реализовать его минимальную рабочую версию на практике.

https://habr.com/ru/articles/1002152/

#RAG #RetrievalAugmented_Generation #языковые_модели #векторная_база_данных #эмбеддинги #чанкование #семантический_поиск #векторный_индекс #ChromaDB #Hugging_Face

#hugging_face #chromadb #векторный_индекс #семантический_поиск #чанкование #эмбеддинги

Habr @[email protected] · 2026-02-24 · 06:42 UTC

Базовый минимум. Часть 3: RAG-системы

Большая языковая модель это не источник актуальных сведений, а статистическая система, обученная на данных прошлого. Она не обращается к внешним базам знаний и не узнает о новых событиях. Все что она знает было усвоено на этапе обучения и зафиксировано в ее параметрах. В современных прикладных системах это ограничение часто скрыто за инструментами, поиском и дополнительными модулями. Однако именно архитектурный подход Retrieval-Augmented Generation, RAG стал стандартным способом расширения возможностей модели без ее дообучения. Он позволяет подключать внешние базы знаний, работать с актуальными документами и заметно снижать количество галлюцинаций. В третьей части серии Базовый минимум разбирается как устроен RAG и как реализовать его минимальную рабочую версию на практике.

https://habr.com/ru/articles/1002152/

#RAG #RetrievalAugmented_Generation #языковые_модели #векторная_база_данных #эмбеддинги #чанкование #семантический_поиск #векторный_индекс #ChromaDB #Hugging_Face

#hugging_face #chromadb #векторный_индекс #семантический_поиск #чанкование #эмбеддинги

Habr @[email protected] · 2026-02-24 · 06:42 UTC

Базовый минимум. Часть 3: RAG-системы

Большая языковая модель это не источник актуальных сведений, а статистическая система, обученная на данных прошлого. Она не обращается к внешним базам знаний и не узнает о новых событиях. Все что она знает было усвоено на этапе обучения и зафиксировано в ее параметрах. В современных прикладных системах это ограничение часто скрыто за инструментами, поиском и дополнительными модулями. Однако именно архитектурный подход Retrieval-Augmented Generation, RAG стал стандартным способом расширения возможностей модели без ее дообучения. Он позволяет подключать внешние базы знаний, работать с актуальными документами и заметно снижать количество галлюцинаций. В третьей части серии Базовый минимум разбирается как устроен RAG и как реализовать его минимальную рабочую версию на практике.

https://habr.com/ru/articles/1002152/

#RAG #RetrievalAugmented_Generation #языковые_модели #векторная_база_данных #эмбеддинги #чанкование #семантический_поиск #векторный_индекс #ChromaDB #Hugging_Face

#rag #retrievalaugmented_generation #языковые_модели #векторная_база_данных #эмбеддинги #чанкование

Habr @[email protected] · 2026-01-29 · 16:42 UTC

На чём будут учиться нейросети в 2026

На чём будут учиться нейросети дальше в 2026-2027 , если публичные Q&A-площадки (вроде StackExchange/Stack Overflow "высыхают". Небольшая исследовательская заметка какие источники данных будут доминировать в 2026–2027, и почему “интернет как датасет” заканчивается в привычном виде.

https://habr.com/ru/articles/990738/

#Stack_Overflow #FineWeb #Hugging_Face #AI #RAG #rag_pipeline

#rag_pipeline #rag #ai #hugging_face #fineweb #stack_overflow

Habr @[email protected] · 2026-01-29 · 16:42 UTC

На чём будут учиться нейросети в 2026

На чём будут учиться нейросети дальше в 2026-2027 , если публичные Q&A-площадки (вроде StackExchange/Stack Overflow "высыхают". Небольшая исследовательская заметка какие источники данных будут доминировать в 2026–2027, и почему “интернет как датасет” заканчивается в привычном виде.

https://habr.com/ru/articles/990738/

#Stack_Overflow #FineWeb #Hugging_Face #AI #RAG #rag_pipeline

#rag_pipeline #rag #ai #hugging_face #fineweb #stack_overflow

Habr @[email protected] · 2026-01-29 · 16:42 UTC

На чём будут учиться нейросети в 2026

На чём будут учиться нейросети дальше в 2026-2027 , если публичные Q&A-площадки (вроде StackExchange/Stack Overflow "высыхают". Небольшая исследовательская заметка какие источники данных будут доминировать в 2026–2027, и почему “интернет как датасет” заканчивается в привычном виде.

https://habr.com/ru/articles/990738/

#Stack_Overflow #FineWeb #Hugging_Face #AI #RAG #rag_pipeline

#rag_pipeline #rag #ai #hugging_face #fineweb #stack_overflow

Habr @[email protected] · 2026-01-29 · 16:42 UTC

На чём будут учиться нейросети в 2026

На чём будут учиться нейросети дальше в 2026-2027 , если публичные Q&A-площадки (вроде StackExchange/Stack Overflow "высыхают". Небольшая исследовательская заметка какие источники данных будут доминировать в 2026–2027, и почему “интернет как датасет” заканчивается в привычном виде.

https://habr.com/ru/articles/990738/

#Stack_Overflow #FineWeb #Hugging_Face #AI #RAG #rag_pipeline

#stack_overflow #fineweb #hugging_face #ai #rag #rag_pipeline

Habr @[email protected] · 2025-12-07 · 09:42 UTC

Hugging Face Skills: AI агенты теперь сами обучают LLM

Hugging Face релизнули Skills — Agent Context Protocol (ACP), через который упаковываются определения разных задач для ИИ агентов. По сути — это папки, в которых собраны инструкции, скрипты и ресурсы для использования ИИ агентом под конкретный кейс. Один из перых скиллов — дообучение опенсорсных LLM. Разбираемся подробнее.

https://habr.com/ru/articles/974148/

#искусственный_интеллект #hugging_face #gemini_cli #openai_codex #claude_code #llmагенты #llm #agent_skills #Agent_Context_Protocol #Сезон_ИИ_в_разработке

#искусственный_интеллект #hugging_face #gemini_cli #openai_codex #claude_code #llmагенты

Habr @[email protected] · 2025-12-07 · 09:42 UTC

Hugging Face Skills: AI агенты теперь сами обучают LLM

Hugging Face релизнули Skills — Agent Context Protocol (ACP), через который упаковываются определения разных задач для ИИ агентов. По сути — это папки, в которых собраны инструкции, скрипты и ресурсы для использования ИИ агентом под конкретный кейс. Один из перых скиллов — дообучение опенсорсных LLM. Разбираемся подробнее.

https://habr.com/ru/articles/974148/

#искусственный_интеллект #hugging_face #gemini_cli #openai_codex #claude_code #llmагенты #llm #agent_skills #Agent_Context_Protocol #Сезон_ИИ_в_разработке

#искусственный_интеллект #hugging_face #gemini_cli #openai_codex #claude_code #llmагенты

Habr @[email protected] · 2025-12-07 · 09:42 UTC

Hugging Face Skills: AI агенты теперь сами обучают LLM

Hugging Face релизнули Skills — Agent Context Protocol (ACP), через который упаковываются определения разных задач для ИИ агентов. По сути — это папки, в которых собраны инструкции, скрипты и ресурсы для использования ИИ агентом под конкретный кейс. Один из перых скиллов — дообучение опенсорсных LLM. Разбираемся подробнее.

https://habr.com/ru/articles/974148/

#искусственный_интеллект #hugging_face #gemini_cli #openai_codex #claude_code #llmагенты #llm #agent_skills #Agent_Context_Protocol #Сезон_ИИ_в_разработке

#искусственный_интеллект #hugging_face #gemini_cli #openai_codex #claude_code #llmагенты

Habr @[email protected] · 2025-12-07 · 09:42 UTC

Hugging Face Skills: AI агенты теперь сами обучают LLM

Hugging Face релизнули Skills — Agent Context Protocol (ACP), через который упаковываются определения разных задач для ИИ агентов. По сути — это папки, в которых собраны инструкции, скрипты и ресурсы для использования ИИ агентом под конкретный кейс. Один из перых скиллов — дообучение опенсорсных LLM. Разбираемся подробнее.

https://habr.com/ru/articles/974148/

#искусственный_интеллект #hugging_face #gemini_cli #openai_codex #claude_code #llmагенты #llm #agent_skills #Agent_Context_Protocol #Сезон_ИИ_в_разработке

#сезон_ии_в_разработке #agent_context_protocol #agent_skills #llm #llmагенты #claude_code

Habr @[email protected] · 2025-12-06 · 07:12 UTC

[Перевод] Как Claude научился файн-тюнить опенсорсные LLM

Claude Code теперь умеет сам файнтюнить LLM на облачных GPU — от валидации датасета до пуша модели на Hub. Показываю, как это работает.

https://habr.com/ru/articles/973898/

#Claude_Code #finetuning #Hugging_Face #LLM #AIагенты #машинное_обучение #LoRA #SFT #DPO #opensource

#claude_code #finetuning #hugging_face #llm #aiагенты #машинное_обучение

Habr @[email protected] · 2025-11-24 · 11:32 UTC

Гречневая нейронка. Попытка закрыть национальный гештальт

Детекция мусора в гречке с помощью нейросети YOLO8n + попытки в real-time детекцию (Docker + FastApi, Gradio, TensorFlow Lite) + предложение добавить такую фичу в приложения продуктовых магазинов. За результатами приглашаю в статью.

https://habr.com/ru/articles/969676/

#компьютерное_зрение #mvp #yolo #продактменеджмент #еда #hugging_face

Habr @[email protected] · 2025-11-24 · 11:32 UTC

Гречневая нейронка. Попытка закрыть национальный гештальт

Детекция мусора в гречке с помощью нейросети YOLO8n + попытки в real-time детекцию (Docker + FastApi, Gradio, TensorFlow Lite) + предложение добавить такую фичу в приложения продуктовых магазинов. За результатами приглашаю в статью.

https://habr.com/ru/articles/969676/

#компьютерное_зрение #mvp #yolo #продактменеджмент #еда #hugging_face

Habr @[email protected] · 2025-11-24 · 11:32 UTC

Гречневая нейронка. Попытка закрыть национальный гештальт

Детекция мусора в гречке с помощью нейросети YOLO8n + попытки в real-time детекцию (Docker + FastApi, Gradio, TensorFlow Lite) + предложение добавить такую фичу в приложения продуктовых магазинов. За результатами приглашаю в статью.

https://habr.com/ru/articles/969676/

#компьютерное_зрение #mvp #yolo #продактменеджмент #еда #hugging_face