#sft — Public Fediverse posts on home.social

Habr @[email protected] · 2026-05-27 · 19:22 UTC

Три попытки обогнать в бенче базовую Gemma 4 дообучением — и все три мимо

Две недели мы пытались обогнать собственную базу. Файнтюном. Потом ещё раз файнтюном на переделанном корпусе. Потом — RAG. Все три раунда база выиграла. Это статья про отрицательный результат. Я считаю, он полезнее победы — потому что воспроизводимый и объясняет, какой инструмент под какую задачу. Дальше — цифры, стек и три разбора «почему не взлетело».

https://habr.com/ru/articles/1040322/

#llm #gemma4 #dora #lora #sft #llmjudge

#llmjudge #sft #lora #dora #gemma4 #llm

Habr @[email protected] · 2026-05-27 · 19:22 UTC

Три попытки обогнать в бенче базовую Gemma 4 дообучением — и все три мимо

Две недели мы пытались обогнать собственную базу. Файнтюном. Потом ещё раз файнтюном на переделанном корпусе. Потом — RAG. Все три раунда база выиграла. Это статья про отрицательный результат. Я считаю, он полезнее победы — потому что воспроизводимый и объясняет, какой инструмент под какую задачу. Дальше — цифры, стек и три разбора «почему не взлетело».

https://habr.com/ru/articles/1040322/

#llm #gemma4 #dora #lora #sft #llmjudge

#llmjudge #sft #lora #dora #gemma4 #llm

Habr @[email protected] · 2026-05-27 · 19:22 UTC

Три попытки обогнать в бенче базовую Gemma 4 дообучением — и все три мимо

Две недели мы пытались обогнать собственную базу. Файнтюном. Потом ещё раз файнтюном на переделанном корпусе. Потом — RAG. Все три раунда база выиграла. Это статья про отрицательный результат. Я считаю, он полезнее победы — потому что воспроизводимый и объясняет, какой инструмент под какую задачу. Дальше — цифры, стек и три разбора «почему не взлетело».

https://habr.com/ru/articles/1040322/

#llm #gemma4 #dora #lora #sft #llmjudge

#llmjudge #sft #lora #dora #gemma4 #llm

Habr @[email protected] · 2026-05-27 · 19:22 UTC

Три попытки обогнать в бенче базовую Gemma 4 дообучением — и все три мимо

Две недели мы пытались обогнать собственную базу. Файнтюном. Потом ещё раз файнтюном на переделанном корпусе. Потом — RAG. Все три раунда база выиграла. Это статья про отрицательный результат. Я считаю, он полезнее победы — потому что воспроизводимый и объясняет, какой инструмент под какую задачу. Дальше — цифры, стек и три разбора «почему не взлетело».

https://habr.com/ru/articles/1040322/

#llm #gemma4 #dora #lora #sft #llmjudge

Habr @[email protected] · 2026-05-18 · 12:32 UTC

Прогнал семь LLM через свой русский спортивный бенчмарк. Базовой моделью всё равно оставляю Gemma 4 31B

Прогнали семь LLM через свой русский спортивный бенчмарк. Топовые модели closed-source выигрывают 1.5-1.7 балла. Базовой моделью всё равно остаётся Gemma 4 31B — рассказываю почему.

https://habr.com/ru/articles/1036448/

#llm #бенчмарк #gemma #qwen #openrouter #русский_язык #dora #sft #спорт #llmjudge

#llmjudge #спорт #sft #dora #русский_язык #openrouter

Habr @[email protected] · 2026-05-18 · 12:32 UTC

Прогнал семь LLM через свой русский спортивный бенчмарк. Базовой моделью всё равно оставляю Gemma 4 31B

Прогнали семь LLM через свой русский спортивный бенчмарк. Топовые модели closed-source выигрывают 1.5-1.7 балла. Базовой моделью всё равно остаётся Gemma 4 31B — рассказываю почему.

https://habr.com/ru/articles/1036448/

#llm #бенчмарк #gemma #qwen #openrouter #русский_язык #dora #sft #спорт #llmjudge

#openrouter #qwen #gemma #бенчмарк #llm #llmjudge

Habr @[email protected] · 2026-05-18 · 12:32 UTC

Прогнал семь LLM через свой русский спортивный бенчмарк. Базовой моделью всё равно оставляю Gemma 4 31B

Прогнали семь LLM через свой русский спортивный бенчмарк. Топовые модели closed-source выигрывают 1.5-1.7 балла. Базовой моделью всё равно остаётся Gemma 4 31B — рассказываю почему.

https://habr.com/ru/articles/1036448/

#llm #бенчмарк #gemma #qwen #openrouter #русский_язык #dora #sft #спорт #llmjudge

#llmjudge #спорт #sft #dora #русский_язык #openrouter

Habr @[email protected] · 2026-05-18 · 12:32 UTC

Прогнал семь LLM через свой русский спортивный бенчмарк. Базовой моделью всё равно оставляю Gemma 4 31B

Прогнали семь LLM через свой русский спортивный бенчмарк. Топовые модели closed-source выигрывают 1.5-1.7 балла. Базовой моделью всё равно остаётся Gemma 4 31B — рассказываю почему.

https://habr.com/ru/articles/1036448/

#llm #бенчмарк #gemma #qwen #openrouter #русский_язык #dora #sft #спорт #llmjudge

#llm #бенчмарк #gemma #qwen #openrouter #русский_язык

Habr @[email protected] · 2026-05-13 · 08:52 UTC

Флоу комфорта: как искусственный интеллект в колонках Сбер научился создавать сценарии умного дома

Салют, Хабр! Я Иван, руковожу направлением голосового управления умным домом в SberDevices. Недавно мы обучили ГигаЧат в интеллектуальных колонках Сбер помогать в создании сценариев автоматизации голосом. Эта задача была неизбежной: общение на естественном языке — закономерный этап развития умных устройств. И непростой: реализовать управление умным домом на естественном языке сложнее, чем «болталку». Во-первых, у каждого юзера в умном доме свой набор комнат и устройств, их функций, названий. Во-вторых, умному дому нельзя ошибаться . Сегодня расскажу, где в пайплайне обработки запроса общение с бэкендом, почему выбрали обучение на уровне контекста вместо supervised fine-tuning и что такое сценарная машина.

https://habr.com/ru/companies/sberdevices/articles/1034306/

#Умный_дом_Сбер #колонки_Сбер #ИИ #SFT #промпт #обучение_ИИ

#обучение_ии #промпт #sft #ии #колонки_сбер #умный_дом_сбер

🅱🅸🅶🅾🆁🆁🅴.🅾🆁🅶 @[email protected] · 2026-03-23 · 08:01 UTC

Beautiful weather for takeoff from Skellefteå airport (Sweden) “ESNS 230750Z 22011KT 180V260 CAVOK 06/M03 Q0997” : See what it means on https://www.bigorre.org/aero/meteo/esns/en #skellefteaairport #airport #skelleftea #sweden #esns #sft #metar #aviation #aviationweather #avgeek vl

#skellefteaairport #airport #skelleftea #sweden #esns #sft

🅱🅸🅶🅾🆁🆁🅴.🅾🆁🅶 @[email protected] · 2026-03-23 · 08:01 UTC

Beautiful weather for takeoff from Skellefteå airport (Sweden) “ESNS 230750Z 22011KT 180V260 CAVOK 06/M03 Q0997” : See what it means on https://www.bigorre.org/aero/meteo/esns/en #skellefteaairport #airport #skelleftea #sweden #esns #sft #metar #aviation #aviationweather #avgeek vl

#skellefteaairport #airport #skelleftea #sweden #esns #sft

🅱🅸🅶🅾🆁🆁🅴.🅾🆁🅶 @[email protected] · 2026-03-23 · 08:01 UTC

Beautiful weather for takeoff from Skellefteå airport (Sweden) “ESNS 230750Z 22011KT 180V260 CAVOK 06/M03 Q0997” : See what it means on https://www.bigorre.org/aero/meteo/esns/en #skellefteaairport #airport #skelleftea #sweden #esns #sft #metar #aviation #aviationweather #avgeek vl

#skellefteaairport #airport #skelleftea #sweden #esns #sft

🅱🅸🅶🅾🆁🆁🅴.🅾🆁🅶 @[email protected] · 2026-03-23 · 08:01 UTC

Beautiful weather for takeoff from Skellefteå airport (Sweden) “ESNS 230750Z 22011KT 180V260 CAVOK 06/M03 Q0997” : See what it means on https://www.bigorre.org/aero/meteo/esns/en #skellefteaairport #airport #skelleftea #sweden #esns #sft #metar #aviation #aviationweather #avgeek vl

#avgeek #aviationweather #aviation #metar #sft #esns

🅱🅸🅶🅾🆁🆁🅴.🅾🆁🅶 @[email protected] · 2026-03-23 · 08:01 UTC

Beautiful weather for takeoff from Skellefteå airport (Sweden) “ESNS 230750Z 22011KT 180V260 CAVOK 06/M03 Q0997” : See what it means on https://www.bigorre.org/aero/meteo/esns/en #skellefteaairport #airport #skelleftea #sweden #esns #sft #metar #aviation #aviationweather #avgeek vl

#skellefteaairport #airport #skelleftea #sweden #esns #sft

Brandon H :csharp: :verified: @[email protected] · 2026-02-11 · 23:12 UTC

via #AIFoundry : Beyond the Prompt – Why and How to Fine-tune Your Own Models

https://ift.tt/DpcF2h4
#finetuning #microsoftfoundry #azureai #enterpriseai #llm #languagemodels #foundationmodels #promptengineering #rag #retrievalaugmentedgeneration #sft #supervisedfinetuning #r…

#aifoundry #finetuning #microsoftfoundry #azureai #enterpriseai #llm

Brandon H :csharp: :verified: @[email protected] · 2026-02-11 · 23:12 UTC

via #AIFoundry : Beyond the Prompt – Why and How to Fine-tune Your Own Models

https://ift.tt/DpcF2h4
#finetuning #microsoftfoundry #azureai #enterpriseai #llm #languagemodels #foundationmodels #promptengineering #rag #retrievalaugmentedgeneration #sft #supervisedfinetuning #r…

#aifoundry #finetuning #microsoftfoundry #azureai #enterpriseai #llm

Brandon H :csharp: :verified: @bc3tech · 2026-02-11 · 23:12 UTC

via #AIFoundry : Beyond the Prompt – Why and How to Fine-tune Your Own Models

https://ift.tt/DpcF2h4
#finetuning #microsoftfoundry #azureai #enterpriseai #llm #languagemodels #foundationmodels #promptengineering #rag #retrievalaugmentedgeneration #sft #supervisedfinetuning #r…

#aifoundry #finetuning #microsoftfoundry #azureai #enterpriseai #llm

Brandon H :csharp: :verified: @[email protected] · 2026-02-11 · 23:12 UTC

via #AIFoundry : Beyond the Prompt – Why and How to Fine-tune Your Own Models

https://ift.tt/DpcF2h4
#finetuning #microsoftfoundry #azureai #enterpriseai #llm #languagemodels #foundationmodels #promptengineering #rag #retrievalaugmentedgeneration #sft #supervisedfinetuning #r…

#r #supervisedfinetuning #sft #retrievalaugmentedgeneration #rag #promptengineering

Brandon H :csharp: :verified: @[email protected] · 2026-02-11 · 23:12 UTC

via #AIFoundry : Beyond the Prompt – Why and How to Fine-tune Your Own Models

https://ift.tt/DpcF2h4
#finetuning #microsoftfoundry #azureai #enterpriseai #llm #languagemodels #foundationmodels #promptengineering #rag #retrievalaugmentedgeneration #sft #supervisedfinetuning #r…

#aifoundry #finetuning #microsoftfoundry #azureai #enterpriseai #llm

España @[email protected] · 2026-02-10 · 01:49 UTC

https://www.europesays.com/es/388738/ La Oficina de Ciudadanía Corporativa de Samsung anuncia el nombramiento de 10 embajadores globales de Solve for Tomorrow #Ciencia #CienciaYTecnología #CienciaYtecnología #COI #ES #España #MilanoCortina2026 #Science #ScienceAndTechnology #ScienceAndTechnology #SFT #SolveForTomorrow #Spain #Technology #Tecnología

#tecnologia #technology #spain #solvefortomorrow #sft #scienceandtechnology

🅱🅸🅶🅾🆁🆁🅴.🅾🆁🅶 @[email protected] · 2026-01-30 · 07:56 UTC

Beautiful weather for takeoff from Skellefteå airport (Sweden) “ESNS 300720Z 26003KT CAVOK M23/M26 Q1027” : See what it means on https://www.bigorre.org/aero/meteo/esns/en #skellefteaairport #airport #skelleftea #sweden #esns #sft #metar #aviation #aviationweather #avgeek vl

#skellefteaairport #airport #skelleftea #sweden #esns #sft

🅱🅸🅶🅾🆁🆁🅴.🅾🆁🅶 @[email protected] · 2026-01-30 · 07:56 UTC

Beautiful weather for takeoff from Skellefteå airport (Sweden) “ESNS 300720Z 26003KT CAVOK M23/M26 Q1027” : See what it means on https://www.bigorre.org/aero/meteo/esns/en #skellefteaairport #airport #skelleftea #sweden #esns #sft #metar #aviation #aviationweather #avgeek vl

#skellefteaairport #airport #skelleftea #sweden #esns #sft

🅱🅸🅶🅾🆁🆁🅴.🅾🆁🅶 @[email protected] · 2026-01-30 · 07:56 UTC

Beautiful weather for takeoff from Skellefteå airport (Sweden) “ESNS 300720Z 26003KT CAVOK M23/M26 Q1027” : See what it means on https://www.bigorre.org/aero/meteo/esns/en #skellefteaairport #airport #skelleftea #sweden #esns #sft #metar #aviation #aviationweather #avgeek vl

#skellefteaairport #airport #skelleftea #sweden #esns #sft

🅱🅸🅶🅾🆁🆁🅴.🅾🆁🅶 @[email protected] · 2026-01-30 · 07:56 UTC

Beautiful weather for takeoff from Skellefteå airport (Sweden) “ESNS 300720Z 26003KT CAVOK M23/M26 Q1027” : See what it means on https://www.bigorre.org/aero/meteo/esns/en #skellefteaairport #airport #skelleftea #sweden #esns #sft #metar #aviation #aviationweather #avgeek vl

#avgeek #aviationweather #aviation #metar #sft #esns

🅱🅸🅶🅾🆁🆁🅴.🅾🆁🅶 @[email protected] · 2026-01-30 · 07:56 UTC

Beautiful weather for takeoff from Skellefteå airport (Sweden) “ESNS 300720Z 26003KT CAVOK M23/M26 Q1027” : See what it means on https://www.bigorre.org/aero/meteo/esns/en #skellefteaairport #airport #skelleftea #sweden #esns #sft #metar #aviation #aviationweather #avgeek vl

#skellefteaairport #airport #skelleftea #sweden #esns #sft

Peter SIMON @[email protected] · 2026-01-13 · 23:02 UTC

⚠️ #ExpertsJudiciaires :
La #SFT œuvre depuis 2024 à l'inscription dans la loi de #ConditionsDePaiement de 30 jours, conformément à la directive 2011/7/UE.

👉 l’instauration d'un délai max de 180 jours normalisera les délais excessifs et fragilisera des professionnels indispensables à la #justice.
📣 La #SFT appelle à sensibiliser les #députés avant le vote. #DélaisDePaiement @justice_gouv
https://www.sft.fr/fr/news/delais-de-paiement-des-experts-judiciaires-la-sft-alerte-sur-la-proposition-de-loi-n-263-316

#expertsjudiciaires #sft #conditionsdepaiement #justice #deputes #delaisdepaiement

Habr @[email protected] · 2025-12-06 · 07:12 UTC

[Перевод] Как Claude научился файн-тюнить опенсорсные LLM

Claude Code теперь умеет сам файнтюнить LLM на облачных GPU — от валидации датасета до пуша модели на Hub. Показываю, как это работает.

https://habr.com/ru/articles/973898/

#Claude_Code #finetuning #Hugging_Face #LLM #AIагенты #машинное_обучение #LoRA #SFT #DPO #opensource

#claude_code #finetuning #hugging_face #llm #aiагенты #машинное_обучение

Habr @[email protected] · 2025-12-03 · 07:52 UTC

SFT vs RL: Сравнение методов настройки LLM для задач программирования и игровых сред

В современной разработке AI-агентов возникает необходимость адаптации больших языковых моделей (LLM) для решения специфических задач, требующих не просто генерации текста, а выполнения последовательных действий с рассуждениями. В этой статье мы рассмотрим и сравним два основных подхода к настройке моделей: Supervised Fine-Tuning (SFT) и Reinforcement Learning (RL), используя библиотеку TRL (Transformer Reinforcement Learning) от Hugging Face.

https://habr.com/ru/articles/972722/

#sft #rl #настройка #программирование #игры #llm

#llm #игры #программирование #настройка #rl #sft

Habr @[email protected] · 2025-12-03 · 07:52 UTC

SFT vs RL: Сравнение методов настройки LLM для задач программирования и игровых сред

В современной разработке AI-агентов возникает необходимость адаптации больших языковых моделей (LLM) для решения специфических задач, требующих не просто генерации текста, а выполнения последовательных действий с рассуждениями. В этой статье мы рассмотрим и сравним два основных подхода к настройке моделей: Supervised Fine-Tuning (SFT) и Reinforcement Learning (RL), используя библиотеку TRL (Transformer Reinforcement Learning) от Hugging Face.

https://habr.com/ru/articles/972722/

#sft #rl #настройка #программирование #игры #llm

#llm #игры #программирование #настройка #rl #sft

Habr @[email protected] · 2025-12-03 · 07:52 UTC

SFT vs RL: Сравнение методов настройки LLM для задач программирования и игровых сред

В современной разработке AI-агентов возникает необходимость адаптации больших языковых моделей (LLM) для решения специфических задач, требующих не просто генерации текста, а выполнения последовательных действий с рассуждениями. В этой статье мы рассмотрим и сравним два основных подхода к настройке моделей: Supervised Fine-Tuning (SFT) и Reinforcement Learning (RL), используя библиотеку TRL (Transformer Reinforcement Learning) от Hugging Face.

https://habr.com/ru/articles/972722/

#sft #rl #настройка #программирование #игры #llm

#llm #игры #программирование #настройка #rl #sft

Habr @[email protected] · 2025-12-03 · 07:52 UTC

SFT vs RL: Сравнение методов настройки LLM для задач программирования и игровых сред

В современной разработке AI-агентов возникает необходимость адаптации больших языковых моделей (LLM) для решения специфических задач, требующих не просто генерации текста, а выполнения последовательных действий с рассуждениями. В этой статье мы рассмотрим и сравним два основных подхода к настройке моделей: Supervised Fine-Tuning (SFT) и Reinforcement Learning (RL), используя библиотеку TRL (Transformer Reinforcement Learning) от Hugging Face.

https://habr.com/ru/articles/972722/

#sft #rl #настройка #программирование #игры #llm

Paul Wermer, CC BY-NC-SA 4.0 @[email protected] · 2025-09-06 · 21:35 UTC

@chris I was wondering which #SFT you were talking about. An unfortunately rich offering in politics these days

#sft

Habr @[email protected] · 2025-06-05 · 10:22 UTC

Kandinsky 4.1 Image – новый генератор изображений от Сбера

В декабре прошлого года на конференции AI Journey наша команда представила диффузионную генеративную модель Kandinsky 4.0 Video. Теперь мы рады представить новую версию нашей модели генерации изображений Kandinsky 4.1 Image!

https://habr.com/ru/companies/sberbank/articles/915760/

#генерация_изображений #kandinsky_4 #sberai #generative_models #texttoimage #computer_vision #diffusion #sft #artificial_intelligence #machine_learning

#machine_learning #artificial_intelligence #sft #diffusion #computer_vision #texttoimage

Habr @[email protected] · 2025-06-05 · 10:22 UTC

Kandinsky 4.1 Image – новый генератор изображений от Сбера

В декабре прошлого года на конференции AI Journey наша команда представила диффузионную генеративную модель Kandinsky 4.0 Video. Теперь мы рады представить новую версию нашей модели генерации изображений Kandinsky 4.1 Image!

https://habr.com/ru/companies/sberbank/articles/915760/

#генерация_изображений #kandinsky_4 #sberai #generative_models #texttoimage #computer_vision #diffusion #sft #artificial_intelligence #machine_learning

#machine_learning #artificial_intelligence #sft #diffusion #computer_vision #texttoimage

Habr @[email protected] · 2025-06-05 · 10:22 UTC

Kandinsky 4.1 Image – новый генератор изображений от Сбера

В декабре прошлого года на конференции AI Journey наша команда представила диффузионную генеративную модель Kandinsky 4.0 Video. Теперь мы рады представить новую версию нашей модели генерации изображений Kandinsky 4.1 Image!

https://habr.com/ru/companies/sberbank/articles/915760/

#генерация_изображений #kandinsky_4 #sberai #generative_models #texttoimage #computer_vision #diffusion #sft #artificial_intelligence #machine_learning

#machine_learning #artificial_intelligence #sft #diffusion #computer_vision #texttoimage

Habr @[email protected] · 2025-06-05 · 10:22 UTC

Kandinsky 4.1 Image – новый генератор изображений от Сбера

В декабре прошлого года на конференции AI Journey наша команда представила диффузионную генеративную модель Kandinsky 4.0 Video. Теперь мы рады представить новую версию нашей модели генерации изображений Kandinsky 4.1 Image!

https://habr.com/ru/companies/sberbank/articles/915760/

#генерация_изображений #kandinsky_4 #sberai #generative_models #texttoimage #computer_vision #diffusion #sft #artificial_intelligence #machine_learning

#генерация_изображений #kandinsky_4 #sberai #generative_models #texttoimage #computer_vision

Habr @[email protected] · 2024-08-12 · 13:52 UTC

[Перевод] Как дообучать LLM с помощью Supervised Fine-Tuning

Обычно большие языковые модели (large language model, LLM) обучают в несколько этапов, включающих предварительное обучение и множество этапов fine-tuning (см. ниже). Предварительное обучение — это дорогостоящий процесс (например, требующий многих сотен тысяч долларов на вычислительные ресурсы), однако fine-tuning модели LLM (или контекстное обучение) по сравнению с этим гораздо дешевле (например, сотни долларов или даже меньше). Учитывая широкую доступность и бесплатность (даже для коммерческого использования) предварительно обученных LLM (например, MPT , Falcon или LLAMA-2 ), мы можем создавать большой спектр мощных приложений благодаря fine-tuning моделей под нужные задачи. Этапы обучения LLM На текущем этапе исследований ИИ одним из самых широко применяемых видов fine-tuning моделей LLM стал supervised fine-tuning (SFT). При этой методике курируемый датасет высококачественных выходных данных LLM применяется для непосредственного fine-tuning модели. SFT прост и дёшев в использовании, это полезный инструмент выравнивания языковых моделей, ставший популярным даже за пределами исследовательского сообщества опенсорсных LLM. В этой статье мы вкратце расскажем о принципах SFT, рассмотрим исследования по этой теме и приведём примеры того, как практикующие специалисты могут с лёгкостью пользоваться SFT, написав всего несколько строк кода на Python.

https://habr.com/ru/articles/830396/

#Машинное_обучение #data_labeling #data_annotation #dataset #разметка_данных #SFT #Finetuning #LLM

#llm #finetuning #sft #разметка_данных #dataset #data_annotation

Habr @[email protected] · 2024-08-09 · 22:42 UTC

[Перевод] Fine-tuning больших языковых моделей в 2024 году

Не секрет, что большие языковые модели (LLM) эволюционируют с безумной скоростью и привлекают внимание всей отрасли генеративного ИИ. Корпорации не просто заинтригованы, они одержимы LLM, и в частности, потенциалом fine-tuning LLM. В исследования и разработку LLM сейчас вкладываются миллиарды долларов. Лидеры отрасли и энтузиасты технологий всё сильнее стремятся углубить своё понимание LLM и их fine-tuning. Эта сфера natural language processing (NLP) постоянно расширяется, поэтому критически важно иметь актуальную информацию. Польза, которую LLM могут принести вашему бизнесу, зависит от ваших знаний и понимания этой технологии. Цикл жизни большой языковой модели состоит из множества важных этапов, и сегодня мы рассмотрим один из самых любопытных и активно развивающихся частей этого цикла — процесс fine-tuning моделей LLM. Это трудозатратная, тяжёлая, но перспективная задача, используемая во многих процессах обучения языковых моделей.

https://habr.com/ru/articles/830414/

#Машинное_обучение #data_labeling #data_annotation #dataset #разметка_данных #SFT #Finetuning #LLM

#llm #finetuning #sft #разметка_данных #dataset #data_annotation

Habr @[email protected] · 2024-07-24 · 09:02 UTC

[Перевод] Что такое supervised fine-tuning?

Supervised fine-tuning (SFT) — это методика, применяемая для адаптации предварительно обученных Large Language Model (LLM) под конкретную задачу при помощи размеченных данных. В процессе SFT предварительно обученные LLM подвергаются fine-tuning на основе размеченного датасета при помощи методик обучения с учителем. Веса модели выравниваются на основании градиентов, полученных из функции потерь конкретной задачи, измеряющей разность между прогнозами LLM и эталонной разметкой. Этот процесс позволяет модели обучаться паттернам и нюансам конкретной задачи, адаптируя её параметры в соответствии с распределением конкретных данных и требований задачи. SFT, обычно выполняемый после предварительного обучения модели, применяется для того, чтобы научить модель следовать переданным пользователем инструкциям. Он более вычислительно затратен, чем fine-tuning без учителя, но и имеет больше шансов достичь повышенной точности. Объём необходимого дообучения зависит от сложности задачи и размера датасета. В случае простого переноса стиля с использованием моделей OpenAI наподобие GPT-3.5 или GPT-4 для получения превосходных результатов обычно достаточно 30-50 высококачественных примеров. Чтобы преобразовать базовую Large Language Model (LLM) в выполняющую инструкции LLM (например, превратить Mistral в Mistral Instruct), обычно требуется обучение на десятках тысяч примеров. Дообучение Zephyr 7b выполнялось на 16 GPU Nvidia A100 в течение примерно четырёх часов. Это можно считать примером отправной точки для модели с 7 миллиардами параметров.

https://habr.com/ru/articles/829318/

#Машинное_обучение #LLM #finetuning #Трансферное_обучение #LoRA #QLoRA #SFT #Supervised_finetuning #датасет #размета_данных #dataset #данные #data #разметка

#разметка #data #данные #dataset #размета_данных #датасет

Habr @[email protected] · 2024-07-24 · 09:02 UTC

[Перевод] Что такое supervised fine-tuning?

Supervised fine-tuning (SFT) — это методика, применяемая для адаптации предварительно обученных Large Language Model (LLM) под конкретную задачу при помощи размеченных данных. В процессе SFT предварительно обученные LLM подвергаются fine-tuning на основе размеченного датасета при помощи методик обучения с учителем. Веса модели выравниваются на основании градиентов, полученных из функции потерь конкретной задачи, измеряющей разность между прогнозами LLM и эталонной разметкой. Этот процесс позволяет модели обучаться паттернам и нюансам конкретной задачи, адаптируя её параметры в соответствии с распределением конкретных данных и требований задачи. SFT, обычно выполняемый после предварительного обучения модели, применяется для того, чтобы научить модель следовать переданным пользователем инструкциям. Он более вычислительно затратен, чем fine-tuning без учителя, но и имеет больше шансов достичь повышенной точности. Объём необходимого дообучения зависит от сложности задачи и размера датасета. В случае простого переноса стиля с использованием моделей OpenAI наподобие GPT-3.5 или GPT-4 для получения превосходных результатов обычно достаточно 30-50 высококачественных примеров. Чтобы преобразовать базовую Large Language Model (LLM) в выполняющую инструкции LLM (например, превратить Mistral в Mistral Instruct), обычно требуется обучение на десятках тысяч примеров. Дообучение Zephyr 7b выполнялось на 16 GPU Nvidia A100 в течение примерно четырёх часов. Это можно считать примером отправной точки для модели с 7 миллиардами параметров.

https://habr.com/ru/articles/829318/

#Машинное_обучение #LLM #finetuning #Трансферное_обучение #LoRA #QLoRA #SFT #Supervised_finetuning #датасет #размета_данных #dataset #данные #data #разметка

#разметка #data #данные #dataset #размета_данных #датасет

Habr @[email protected] · 2024-07-24 · 09:02 UTC

[Перевод] Что такое supervised fine-tuning?

Supervised fine-tuning (SFT) — это методика, применяемая для адаптации предварительно обученных Large Language Model (LLM) под конкретную задачу при помощи размеченных данных. В процессе SFT предварительно обученные LLM подвергаются fine-tuning на основе размеченного датасета при помощи методик обучения с учителем. Веса модели выравниваются на основании градиентов, полученных из функции потерь конкретной задачи, измеряющей разность между прогнозами LLM и эталонной разметкой. Этот процесс позволяет модели обучаться паттернам и нюансам конкретной задачи, адаптируя её параметры в соответствии с распределением конкретных данных и требований задачи. SFT, обычно выполняемый после предварительного обучения модели, применяется для того, чтобы научить модель следовать переданным пользователем инструкциям. Он более вычислительно затратен, чем fine-tuning без учителя, но и имеет больше шансов достичь повышенной точности. Объём необходимого дообучения зависит от сложности задачи и размера датасета. В случае простого переноса стиля с использованием моделей OpenAI наподобие GPT-3.5 или GPT-4 для получения превосходных результатов обычно достаточно 30-50 высококачественных примеров. Чтобы преобразовать базовую Large Language Model (LLM) в выполняющую инструкции LLM (например, превратить Mistral в Mistral Instruct), обычно требуется обучение на десятках тысяч примеров. Дообучение Zephyr 7b выполнялось на 16 GPU Nvidia A100 в течение примерно четырёх часов. Это можно считать примером отправной точки для модели с 7 миллиардами параметров.

https://habr.com/ru/articles/829318/

#Машинное_обучение #LLM #finetuning #Трансферное_обучение #LoRA #QLoRA #SFT #Supervised_finetuning #датасет #размета_данных #dataset #данные #data #разметка

#машинное_обучение #llm #finetuning #трансферное_обучение #lora #qlora

Habr @[email protected] · 2024-07-23 · 09:02 UTC

[Перевод] Как с помощью supervised fine-tuning кастомизировать LLM

В быстро развивающейся сфере Natural Language Processing (NLP) fine-tuning стал мощным и эффективным инструментом адаптации предварительно обученных больших языковых моделей (Large Language Model, LLM) под конкретные задачи. Предварительно обученные LLM (например, семейство GPT) продемонстрировали существенный прогресс в понимании и генерации языка. Однако эти предварительно обученные модели обычно учатся на огромных объёмах текстовых данных при помощи обучения без учителя и могут быть не оптимизированы под узкую задачу. Fine-tuning позволяет закрыть этот пробел, воспользовавшись преимуществами общего понимания языка, полученными во время предварительного обучения, и адаптировав их к целевой задаче при помощи обучения с учителем. Благодаря fine-tuning предварительно обученной модели на специфичном для задачи датасете разработчики NLP могут достигать впечатляющих результатов с гораздо меньшим объёмом данных обучения и вычислительных ресурсов, чем при обучении модели с нуля. В частности, для LLM fine-tuning крайне важен, так как повторное обучение на всём объёме данных вычислительно слишком затратно. Сравнение предварительного обучения LLM и fine-tuning Успех fine-tuning привёл ко множеству передовых результатов в широком спектре задач NLP и сделал его стандартной практикой в разработке высокоточных языковых моделей. Исследователи и практики продолжают исследовать варианты и оптимизации методик fine-tuning, чтобы ещё больше расширить возможности NLP. В этой статье мы глубже изучим процесс fine-tuning LLM на основе инструкций при помощи библиотеки transformers двумя разными способами: просто с библиотекой transformers и с модулем trl .

https://habr.com/ru/articles/829324/

#Машинное_обучение #LLM #Finetuning #SFT #Supervised_finetuning #NLP #Large_Language_Model #датасет #размета_данных #dataset #данные #data #разметка

#разметка #data #данные #dataset #размета_данных #датасет

Habr @[email protected] · 2024-07-23 · 09:02 UTC

[Перевод] Как с помощью supervised fine-tuning кастомизировать LLM

В быстро развивающейся сфере Natural Language Processing (NLP) fine-tuning стал мощным и эффективным инструментом адаптации предварительно обученных больших языковых моделей (Large Language Model, LLM) под конкретные задачи. Предварительно обученные LLM (например, семейство GPT) продемонстрировали существенный прогресс в понимании и генерации языка. Однако эти предварительно обученные модели обычно учатся на огромных объёмах текстовых данных при помощи обучения без учителя и могут быть не оптимизированы под узкую задачу. Fine-tuning позволяет закрыть этот пробел, воспользовавшись преимуществами общего понимания языка, полученными во время предварительного обучения, и адаптировав их к целевой задаче при помощи обучения с учителем. Благодаря fine-tuning предварительно обученной модели на специфичном для задачи датасете разработчики NLP могут достигать впечатляющих результатов с гораздо меньшим объёмом данных обучения и вычислительных ресурсов, чем при обучении модели с нуля. В частности, для LLM fine-tuning крайне важен, так как повторное обучение на всём объёме данных вычислительно слишком затратно. Сравнение предварительного обучения LLM и fine-tuning Успех fine-tuning привёл ко множеству передовых результатов в широком спектре задач NLP и сделал его стандартной практикой в разработке высокоточных языковых моделей. Исследователи и практики продолжают исследовать варианты и оптимизации методик fine-tuning, чтобы ещё больше расширить возможности NLP. В этой статье мы глубже изучим процесс fine-tuning LLM на основе инструкций при помощи библиотеки transformers двумя разными способами: просто с библиотекой transformers и с модулем trl .

https://habr.com/ru/articles/829324/

#Машинное_обучение #LLM #Finetuning #SFT #Supervised_finetuning #NLP #Large_Language_Model #датасет #размета_данных #dataset #данные #data #разметка

#разметка #data #данные #dataset #размета_данных #датасет

Habr @[email protected] · 2024-07-23 · 09:02 UTC

[Перевод] Как с помощью supervised fine-tuning кастомизировать LLM

В быстро развивающейся сфере Natural Language Processing (NLP) fine-tuning стал мощным и эффективным инструментом адаптации предварительно обученных больших языковых моделей (Large Language Model, LLM) под конкретные задачи. Предварительно обученные LLM (например, семейство GPT) продемонстрировали существенный прогресс в понимании и генерации языка. Однако эти предварительно обученные модели обычно учатся на огромных объёмах текстовых данных при помощи обучения без учителя и могут быть не оптимизированы под узкую задачу. Fine-tuning позволяет закрыть этот пробел, воспользовавшись преимуществами общего понимания языка, полученными во время предварительного обучения, и адаптировав их к целевой задаче при помощи обучения с учителем. Благодаря fine-tuning предварительно обученной модели на специфичном для задачи датасете разработчики NLP могут достигать впечатляющих результатов с гораздо меньшим объёмом данных обучения и вычислительных ресурсов, чем при обучении модели с нуля. В частности, для LLM fine-tuning крайне важен, так как повторное обучение на всём объёме данных вычислительно слишком затратно. Сравнение предварительного обучения LLM и fine-tuning Успех fine-tuning привёл ко множеству передовых результатов в широком спектре задач NLP и сделал его стандартной практикой в разработке высокоточных языковых моделей. Исследователи и практики продолжают исследовать варианты и оптимизации методик fine-tuning, чтобы ещё больше расширить возможности NLP. В этой статье мы глубже изучим процесс fine-tuning LLM на основе инструкций при помощи библиотеки transformers двумя разными способами: просто с библиотекой transformers и с модулем trl .

https://habr.com/ru/articles/829324/

#Машинное_обучение #LLM #Finetuning #SFT #Supervised_finetuning #NLP #Large_Language_Model #датасет #размета_данных #dataset #данные #data #разметка

#машинное_обучение #llm #finetuning #sft #supervised_finetuning #nlp

Habr @[email protected] · 2024-07-22 · 07:52 UTC

[Перевод] Supervised Fine-Tuning: как настроить LLM под конкретную задачу?

Пожалуй, для адаптации больших языковых моделей (large language model, LLM) под чётко очерченные задачи обработки естественного языка (natural language processing, NLP) нет технологии лучше, чем SFT (supervised fine-tuning). Для дообучения модели её необходимо предварительно обучить, а это означает, что она уже многому научилась из широкого спектра текстов. Но можно ли после одного лишь предварительного обучения использовать модель в различных типах задач? Да, но ей всё равно будет не хватать совершенствования при помощи SFT, чтобы она действительно могла выполнять требуемые действия и стала опытной в определённой сфере знаний.

https://habr.com/ru/articles/829936/

#Машинное_обучение #supervised_finetuning #SFT #LLM #NLP #RAG #Instruction_finetuning #датасет #размета_данных #dataset #данные #data #разметка

#разметка #data #данные #dataset #размета_данных #датасет

Habr @[email protected] · 2024-07-22 · 07:52 UTC

[Перевод] Supervised Fine-Tuning: как настроить LLM под конкретную задачу?

Пожалуй, для адаптации больших языковых моделей (large language model, LLM) под чётко очерченные задачи обработки естественного языка (natural language processing, NLP) нет технологии лучше, чем SFT (supervised fine-tuning). Для дообучения модели её необходимо предварительно обучить, а это означает, что она уже многому научилась из широкого спектра текстов. Но можно ли после одного лишь предварительного обучения использовать модель в различных типах задач? Да, но ей всё равно будет не хватать совершенствования при помощи SFT, чтобы она действительно могла выполнять требуемые действия и стала опытной в определённой сфере знаний.

https://habr.com/ru/articles/829936/

#Машинное_обучение #supervised_finetuning #SFT #LLM #NLP #RAG #Instruction_finetuning #датасет #размета_данных #dataset #данные #data #разметка

#разметка #data #данные #dataset #размета_данных #датасет

Habr @[email protected] · 2024-07-22 · 07:52 UTC

[Перевод] Supervised Fine-Tuning: как настроить LLM под конкретную задачу?

Пожалуй, для адаптации больших языковых моделей (large language model, LLM) под чётко очерченные задачи обработки естественного языка (natural language processing, NLP) нет технологии лучше, чем SFT (supervised fine-tuning). Для дообучения модели её необходимо предварительно обучить, а это означает, что она уже многому научилась из широкого спектра текстов. Но можно ли после одного лишь предварительного обучения использовать модель в различных типах задач? Да, но ей всё равно будет не хватать совершенствования при помощи SFT, чтобы она действительно могла выполнять требуемые действия и стала опытной в определённой сфере знаний.

https://habr.com/ru/articles/829936/

#Машинное_обучение #supervised_finetuning #SFT #LLM #NLP #RAG #Instruction_finetuning #датасет #размета_данных #dataset #данные #data #разметка