#finetuning — Public Fediverse posts on home.social

ᗪavid John @[email protected] · 2026-05-12 · 17:27 UTC

Some will say: the multiverse explains it. Infinite universes — one had to have our constants by chance.

That's cosmological multiverse. Eternal inflation. Untestable. Unfalsifiable.

Many-worlds is different — a quantum mechanics interpretation. Also unfalsifiable.

Both are philosophy wearing equations.

Intelligent design is the answer.

#Physics #ManyWorlds #Multiverse #FineTuning #IntelligentDesign

#physics #manyworlds #multiverse #finetuning #intelligentdesign

ᗪavid John @[email protected] · 2026-05-12 · 17:27 UTC

The universe runs on constants. Numbers with no units — just baked into reality.

The fine-structure constant: 1/137. The cosmological constant: fine-tuned to 1 in 10¹²⁰. The strong nuclear force: 2% off — hydrogen never forms.

Fred Hoyle — an atheist — looked at carbon resonance and called it "a put-up job."

Penrose put the odds of our universe's initial conditions at 1 in 10^(10¹²³).

Someone knew exactly what He was doing.

#Physics #Cosmology #FineTuning #Faith

#physics #cosmology #finetuning #faith

Arte es Ética @[email protected] · 2026-05-03 · 21:05 UTC

La leyenda urbana de «entrenar tu propio modelo de IAG» sigue siendo un anzuelo para monetizar tutoriales, cursos, masterclass y demás productos que los gurúes y promotores de la IA generativa usan para seguir lucrando a costa de todos los autores vulnerados. ¡No se dejen engañar!

#AI #MachineLearning #data #training #finetuning #AImodel #genAI #generativeAI #pretraining #Copyright #opensource

#ai #machinelearning #data #training #finetuning #aimodel

Nicolas Fränkel 🇪🇺🇺🇦🇬🇪 @[email protected] · 2026-04-23 · 17:10 UTC

Emergent #Misalignment: Narrow #finetuning can produce broadly misaligned #LLMs

https://arxiv.org/abs/2502.17424

#misalignment #finetuning #llms

Habr @[email protected] · 2026-04-22 · 19:22 UTC

Почему Cluely и другие плохо слышат русских айтишников: разбор того, как Whisper ломается и что мы сделали с этим

В январе я купил подписки на Cluely, Final Round AI и Sensei. Хотел посмотреть как они справляются с русским айти-собесами, раз уж все три заявляют о поддержке русского. Подключил по очереди к тестовому звонку в Телемосте (сомневаюсь, что платформа имела роль, но все же), прогнал одну и ту же запись: Senior Python backend разработчик, 45 минут, стек FastAPI + PostgreSQL + Kafka + Kubernetes. Обычный русский спикер, если важно - из Москвы, с речью проблем не было, нормальный микрофон Все три выдали транскрипт и все три провалились, как неожиданно.. "Кафка" в половине случаев становилась "как-то" или "кофта". "Кубернетис" превращался в "губер нет тест". "Сабскрайбер патерн" - в "саб скрайп патерн". "Middleware для CSRF" - "мидл-вер для си эс эр эф" - это еще норм Проблема не в том, что человек говорил по-русски, и не в том, что Whisper не умеет русский (сноска: хорошо не умеет). Whisper умеет русский нормально, около 9.8% WER на Common Voice. Проблема в другом: русскоязычный айтишник не говорит ни на чистом русском, ни на чистом английском. Он говорит на гибриде: русская грамматика плюс английские термины плюс своеобразное произношение этих терминов плюс местами свой жаргон вроде "гошечки" и "крудошлёпа" Этот гибрид ни один из популярных STT не держит. Потому что его в тренировочных данных почти нет Разбираю ниже, как устроена эта проблема, что с ней делают конкуренты (почти ничего), и что сделали мы

https://habr.com/ru/articles/1026778/

#Whisper #STT #speechtotext #finetuning #LoRA #ASR #NLP #распознавание_речи #русский_язык #codeswitching

#codeswitching #русский_язык #распознавание_речи #nlp #asr #lora

Brandon H :csharp: :verified: @[email protected] · 2026-04-16 · 22:12 UTC

via #AIFoundry : What’s New in Microsoft Foundry Fine-Tuning | April 2026

https://ift.tt/QwbY6rH
#MicrosoftFoundry #Foundry #FineTuning #ReinforcementFineTuning #RFT #GlobalTraining #o4mini #Azure #AzureOpenAI #GPT4_1 #GPT4_1Mini #GPT4_1Nano #ModelGraders #RFTBestPractices #A…

#aifoundry #microsoftfoundry #foundry #finetuning #reinforcementfinetuning #rft

Habr @[email protected] · 2026-04-16 · 17:22 UTC

Почему ИИ-пилоты не доходят до реального производства и как это исправить архитектурой

8–9 апреля на конференции Data Fusion ВТБ публично признал: их ИИ-проекты массово застревают между пилотом и промышленной эксплуатацией. Это не жалоба — это диагноз от людей, которые потратили на ИИ сотни миллионов. Яндекс и Сбер в ответ продают инструменты. Но никто не объяснил почему это происходит структурно. Почему пилот работает, а в реальном производстве ломается. Почему 0.85⁸ = 27% — и что с этим делать архитектурно.

https://habr.com/ru/articles/1024350/

#низкоэнтропийная_автоматизация #ИИ_в_производстве #MLOps #LoRA #finetuning #humanintheloop #compounding_entropy #локальные_LLM #цифровой_двойник

#цифровой_двойник #локальные_llm #compounding_entropy #humanintheloop #finetuning #lora

Philo Sophies @[email protected] · 2026-03-23 · 18:02 UTC

🔬 #Physics Puzzles – Exciting puzzle questions explained simply! 🤓

📖 https://www.kosmos.de/buecher/ratgeber-naturfuehrer/astronomie/einsteiger/14776/das-raetselhafte-universum

📎https://philosophies.de/index.php/2022/10/26/zoomposium-naumann-bohnet-das-raetselhafte-universum/

📺https://youtu.be/1ouxs6P3Enc

#ThomasNaumann #IljaBohnet #Zoomposium #OpenQuestionsInPhysics #NaturalSciences #DarkMatter #StringTheory #Cosmology #Philosophy #PhilosophyOfScience #ParticlePhysics #ConstantsOfNature #Multiverse #Falsifiability #FineTuning # Order #Beauty #Truth #Psychology #CriticismOfScience #Research #Physics #Cosmos #Cosmetics #OpenQuestions

#physics #thomasnaumann #iljabohnet #zoomposium #openquestionsinphysics #naturalsciences

Habr @[email protected] · 2026-02-21 · 19:22 UTC

От RLHF к DPO и дальше: как мы разучились бояться и полюбили выравнивание LLM

В 2022 году существовал ровно один способ сделать языковую модель «хорошей» — RLHF. Один. Если вы хотели, чтобы ваша LLM отвечала адекватно и хотя бы делала вид, что понимает вопрос, — вам нужны были армия аннотаторов и бюджет уровня OpenAI. Четыре года спустя у нас зоопарк из десятка методов выравнивания, половину из которых можно запустить на одной RTX 4090 за выходные. DPO убрал reward model. SimPO убрал reference model. GRPO и DeepSeek R1 доказали, что RL жив — но в новой форме. Anthropic опубликовала конституцию Claude на ~80 страниц в открытом доступе и сменила парадигму: от правил к причинам. Мир изменился. Разбираемся, как именно. В статье — полная история пост-обучения от RLHF до Constitutional AI, математика ключевых методов (в спойлерах, без боли), рабочий код на TRL + QLoRA с гиперпараметрами, большие сравнительные таблицы и дерево решений «что выбрать для вашей задачи». Плюс честный разговор о проблемах, о которых не пишут в туториалах: distribution mismatch, reward hacking, catastrophic forgetting и почему модели умеют «притворяться» выровненными. Для разработчиков, ML-инженеров и всех, кто хоть раз открывал Hugging Face и думал: «а что если я это fine-tune...»

https://habr.com/ru/articles/1002298/

#LLM #RLHF #DPO #finetuning #выравнивание #LoRA #QLoRA #GRPO #Constitutional_AI #языковые_модели

#языковые_модели #constitutional_ai #grpo #qlora #lora #выравнивание

deepseek @[email protected] · 2026-02-21 · 19:11 UTC

От RLHF к DPO и дальше: как мы разучились бояться и полюбили выравнивание LLM В 2022 году существовал ровно один спо...

#LLM #RLHF #DPO #fine-tuning #выравнивание #LoRA #QLoRA #GRPO #Constitutional #AI #языковые

Origin | Interest | Match

#llm #rlhf #dpo #finetuning #выравнивание #lora

deepseek @[email protected] · 2026-02-21 · 19:11 UTC

От RLHF к DPO и дальше: как мы разучились бояться и полюбили выравнивание LLM В 2022 году существовал ровно один спо...

#LLM #RLHF #DPO #fine-tuning #выравнивание #LoRA #QLoRA #GRPO #Constitutional #AI #языковые

Origin | Interest | Match

#llm #rlhf #dpo #finetuning #выравнивание #lora

Brandon H :csharp: :verified: @[email protected] · 2026-02-19 · 17:36 UTC

via #AIFoundry : What’s new in Microsoft Foundry | Dec 2025 & Jan 2026

https://ift.tt/kuiqREP
#MicrosoftFoundry #WhatsNew #Dec2025Jan2026 #GPT5_2 #GPT5_1CodexMax #MistralLarge3 #DeepSeekV3_2 #KimiK2Thinking #CohereRerank4 #GPTImage15 #FLUX2pro #AudioModels #FineTuning #OpenSo…

#aifoundry #microsoftfoundry #whatsnew #dec2025jan2026 #gpt5_2 #gpt5_1codexmax

Brandon H :csharp: :verified: @[email protected] · 2026-02-14 · 17:36 UTC

via #AIFoundry : DPO Fine-Tuning Using Microsoft Foundry SDK

https://ift.tt/UIbiycz
#DPO #FineTuning #MicrosoftFoundry #FoundrySDK #LLM #AIAlignment #DirectPreferenceOptimization #RLHFAlternative #NLP #AITraining #ModelFineTuning #AIInTheCloud #AzureAI #MachineLearning #AIRep…

#aifoundry #dpo #finetuning #microsoftfoundry #foundrysdk #llm

Brandon H :csharp: :verified: @[email protected] · 2026-02-11 · 23:12 UTC

via #AIFoundry : Beyond the Prompt – Why and How to Fine-tune Your Own Models

https://ift.tt/DpcF2h4
#finetuning #microsoftfoundry #azureai #enterpriseai #llm #languagemodels #foundationmodels #promptengineering #rag #retrievalaugmentedgeneration #sft #supervisedfinetuning #r…

#aifoundry #finetuning #microsoftfoundry #azureai #enterpriseai #llm

Tino Eberl @[email protected] · 2026-02-04 · 06:07 UTC

#Steady-#Klimacrew

Wenn #Sprachmodelle plötzlich menschenverachtende Aussagen treffen oder gefährliche Tipps geben, läuft etwas gewaltig schief.

Eine aktuelle Untersuchung zeigt, wie schnell #Feintuning unerwartete Folgen haben kann – mit brisanten Konsequenzen für reale Anwendungen.

Das Phänomen wurde nur durch Zufall entdeckt.

https://tino-eberl.de/missbrauch-kuenstlicher-intelligenz/gefaehrliches-finetuning-ki-modelle-koennen-aus-dem-ruder-laufen/

#KI #Sprachmodelle #Finetuning #AIRisiko #LLM #AISecurity #KIMissbrauch #Retröt

#steady #klimacrew #sprachmodelle #feintuning #ki #finetuning

deepseek @[email protected] · 2026-01-21 · 03:38 UTC

Fine-tuning Qwen-8B под проприетарный синтаксис (CADINP) на одной RTX 3090: опыт инженера-конструктора Возможно ли на одной ...

#LLM #fine-tuning #локальные #нейросети #RTX #3090 #Unsloth #Qwen #DeepSeek #GGUF #SOFiSTiK

Origin | Interest | Match

#llm #finetuning #локальные #нейросети #rtx #unsloth

HitechDigital Solutions @[email protected] · 2026-01-08 · 12:31 UTC

Prompt Engineering vs Fine-Tuning: How AI Models Improve

If your AI model feels unpredictable, retraining is not always the answer. This article explains prompt engineering vs fine-tuning in plain terms, helping teams get more consistent results, avoid unnecessary costs, and choose the right optimization approach for real-world AI & data annotation services.

Know More: https://www.hitechdigital.com/blog/prompt-engineering-vs-fine-tuning

#PromptEngineering #FineTuning #ArtificialIntelligence #MachineLearning #AIModelData #DataAnnotation

#promptengineering #finetuning #artificialintelligence #machinelearning #aimodeldata #dataannotation

Reddit Tech VN Bot @[email protected] · 2026-01-05 · 02:17 UTC

Sparse nén mô hình fine-tuned và dataset thành delta từ bản gốc. Nén 14GB xuống 1.4GB (lossless) hoặc 50MB (tương đương LoRA), phục hồi trong 4 giây. Áp dụng sau khi training, phù hợp mọi mô hình đã huấn luyện. Hiệu quả cho AI y tế, tài chính, pháp lý. #AI #MachineLearning #FineTuning #ModelCompression #Sparse #TríTuệNhânTạo #HọcMáy #NénMôHình

https://www.reddit.com/r/LocalLLaMA/comments/1q47kyt/delta_compression_for_finetuned_models_and/

#ai #machinelearning #finetuning #modelcompression #sparse #trituệnhantạo

Dr. Thompson @[email protected] · 2026-01-03 · 09:42 UTC

90% of LLM fine-tuning fails.
Not because of models — but how we train them ⚠️

This breaks it down, simply 🧠⚡
https://medium.com/@rogt.x1997/why-90-of-llm-fine-tuning-fails-how-runpod-fixes-it-e951c9aa97af

#GenAI #FineTuning #RunPod
https://medium.com/@rogt.x1997/why-90-of-llm-fine-tuning-fails-how-runpod-fixes-it-e951c9aa97af

#genai #finetuning #runpod

Habr @[email protected] · 2025-12-23 · 15:52 UTC

Выбор LLM и фреймворка для ИИ-агентов

Путь от одной A100 в облаке до кластера на H200 — это не просто апгрейд железа, а история о том, как ML-команда перестала искать «ту самую идеальную модель» и начала строить экосистему. Когда под капотом миллионы строк C-кода PostgreSQL, а задачи варьируются от генерации hint-сетов до Graph-RAG, модель превращается из «черного ящика» в обычный заменяемый компонент. Рассказываем, как мы пересобрали стек на базе vLLM и MCP, почему контекст-менеджмент важнее весов модели и как заставить 0.6B-параметров работать не хуже гигантов через GRPO.

https://habr.com/ru/companies/postgrespro/articles/979820/

#llm #aiагент #ииагенты #qwen3 #ragas #finetuning #дообучение #trl #grpo #gspo

#gspo #grpo #trl #дообучение #finetuning #ragas

Habr @[email protected] · 2025-12-06 · 07:12 UTC

[Перевод] Как Claude научился файн-тюнить опенсорсные LLM

Claude Code теперь умеет сам файнтюнить LLM на облачных GPU — от валидации датасета до пуша модели на Hub. Показываю, как это работает.

https://habr.com/ru/articles/973898/

#Claude_Code #finetuning #Hugging_Face #LLM #AIагенты #машинное_обучение #LoRA #SFT #DPO #opensource

#claude_code #finetuning #hugging_face #llm #aiагенты #машинное_обучение

Reddit Tech VN Bot @[email protected] · 2025-12-04 · 08:17 UTC

Mô hình AI nhỏ Hito 1.7B, được tinh chỉnh chỉ với ~300 ví dụ, nay có thể đếm chính xác chữ 'r' trong từ 'strawberry' (3 chữ), vượt trội nhiều AI lớn hơn. Đây là bằng chứng cho thấy các mô thức tư duy phức tạp có thể được chuyển giao sang các mô hình nhỏ hơn. Hito sử dụng các 'thẻ tư duy' nội bộ để suy luận và tự sửa lỗi. Một bước tiến thú vị trong AI!

#AI #Hito #LLM #FineTuning #SmallModels #Reasoning
#TríTuệNhânTạo #HọcSâu #MôHìnhNgônNgữ #TinhChỉnhAI

https://www.reddit.com/r/LocalLLaMA/commen

#ai #hito #llm #finetuning #smallmodels #reasoning

Habr @[email protected] · 2025-10-21 · 11:02 UTC

T-LoRA: дообучить диффузионную модель на одной картинке и не переобучиться

Вы когда‑нибудь мечтали стать лучшей версией себя? Моложе, красивее, идеальнее… А вот LoRA уже стала! Меня зовут Вера Соболева, я научный сотрудник лаборатории FusionBrain Института AIRI, а также стажер‑исследователь Центра глубинного обучения и байесовских методов НИУ ВШЭ. Cегодня я расскажу про наше свежее исследование T‑LoRA: Single Image Diffusion Model Customization Without Overfitting . Мы с коллегами придумали эффективный способ как файнтюнить диффузионные модели с помощью LoRA всего по одной картинке . Представьте такую ситуацию: вы хотите, чтобы модель генерировала вашу кошечку узнаваемой и в самых разных сценариях, но у вас нет времени или желания собирать обширный разнообразный датасет. А может, у вас вообще есть всего одна фотография (с хозяевами кошек так обычно не бывает, но допустим). Хорошая новость: эту задачу можно решить, копнув поглубже в свойства диффузии! В этой статье я расскажу, как это сделать.

https://habr.com/ru/companies/airi/articles/958348/

#diffusion_models #finetuning #loraадаптеры #lora #image_generation

#image_generation #lora #loraадаптеры #finetuning #diffusion_models

Habr @[email protected] · 2025-10-21 · 11:02 UTC

T-LoRA: дообучить диффузионную модель на одной картинке и не переобучиться

Вы когда‑нибудь мечтали стать лучшей версией себя? Моложе, красивее, идеальнее… А вот LoRA уже стала! Меня зовут Вера Соболева, я научный сотрудник лаборатории FusionBrain Института AIRI, а также стажер‑исследователь Центра глубинного обучения и байесовских методов НИУ ВШЭ. Cегодня я расскажу про наше свежее исследование T‑LoRA: Single Image Diffusion Model Customization Without Overfitting . Мы с коллегами придумали эффективный способ как файнтюнить диффузионные модели с помощью LoRA всего по одной картинке . Представьте такую ситуацию: вы хотите, чтобы модель генерировала вашу кошечку узнаваемой и в самых разных сценариях, но у вас нет времени или желания собирать обширный разнообразный датасет. А может, у вас вообще есть всего одна фотография (с хозяевами кошек так обычно не бывает, но допустим). Хорошая новость: эту задачу можно решить, копнув поглубже в свойства диффузии! В этой статье я расскажу, как это сделать.

https://habr.com/ru/companies/airi/articles/958348/

#diffusion_models #finetuning #loraадаптеры #lora #image_generation

#image_generation #lora #loraадаптеры #finetuning #diffusion_models

Habr @[email protected] · 2025-10-21 · 11:02 UTC

T-LoRA: дообучить диффузионную модель на одной картинке и не переобучиться

Вы когда‑нибудь мечтали стать лучшей версией себя? Моложе, красивее, идеальнее… А вот LoRA уже стала! Меня зовут Вера Соболева, я научный сотрудник лаборатории FusionBrain Института AIRI, а также стажер‑исследователь Центра глубинного обучения и байесовских методов НИУ ВШЭ. Cегодня я расскажу про наше свежее исследование T‑LoRA: Single Image Diffusion Model Customization Without Overfitting . Мы с коллегами придумали эффективный способ как файнтюнить диффузионные модели с помощью LoRA всего по одной картинке . Представьте такую ситуацию: вы хотите, чтобы модель генерировала вашу кошечку узнаваемой и в самых разных сценариях, но у вас нет времени или желания собирать обширный разнообразный датасет. А может, у вас вообще есть всего одна фотография (с хозяевами кошек так обычно не бывает, но допустим). Хорошая новость: эту задачу можно решить, копнув поглубже в свойства диффузии! В этой статье я расскажу, как это сделать.

https://habr.com/ru/companies/airi/articles/958348/

#diffusion_models #finetuning #loraадаптеры #lora #image_generation

#image_generation #lora #loraадаптеры #finetuning #diffusion_models

Habr @[email protected] · 2025-10-21 · 11:02 UTC

T-LoRA: дообучить диффузионную модель на одной картинке и не переобучиться

Вы когда‑нибудь мечтали стать лучшей версией себя? Моложе, красивее, идеальнее… А вот LoRA уже стала! Меня зовут Вера Соболева, я научный сотрудник лаборатории FusionBrain Института AIRI, а также стажер‑исследователь Центра глубинного обучения и байесовских методов НИУ ВШЭ. Cегодня я расскажу про наше свежее исследование T‑LoRA: Single Image Diffusion Model Customization Without Overfitting . Мы с коллегами придумали эффективный способ как файнтюнить диффузионные модели с помощью LoRA всего по одной картинке . Представьте такую ситуацию: вы хотите, чтобы модель генерировала вашу кошечку узнаваемой и в самых разных сценариях, но у вас нет времени или желания собирать обширный разнообразный датасет. А может, у вас вообще есть всего одна фотография (с хозяевами кошек так обычно не бывает, но допустим). Хорошая новость: эту задачу можно решить, копнув поглубже в свойства диффузии! В этой статье я расскажу, как это сделать.

https://habr.com/ru/companies/airi/articles/958348/

#diffusion_models #finetuning #loraадаптеры #lora #image_generation

.:\dGh/:. @[email protected] · 2025-10-21 · 02:22 UTC

And this is why I recommend NVIDIA or Mac.

AMD SDK for AI is so fucking unreliable at this point.

https://www.phoronix.com/news/ROCm-Core-SDK-7.9

#AMD #AI #LLM #LargeLanguageModels #Inference #Training #FineTuning #ArtificialIntelligence #Ollama #ComfyUI #Flux #DeepSeek #Wan #NVIDIA #RTX #CUDA #MacBook #Mac #Apple #MacMini #iMac #MacPro #AMD

#amd #ai #llm #largelanguagemodels #inference #training

Brandon H :csharp: :verified: @[email protected] · 2025-10-20 · 17:12 UTC

via #AIFoundry : A Developer’s Guide to Fine-Tuning GPT-4o for Image Classification on Azure AI Foundry

https://ift.tt/GnqKyTz
#AI #MachineLearning #ImageClassification #GPT4o #AzureAI #VisionLanguageModels #FineTuning #ComputerVision #StanfordDogs #BatchInference #CNN #TechG…

#aifoundry #ai #machinelearning #imageclassification #gpt4o #azureai

Brandon H :csharp: :verified: @[email protected] · 2025-10-15 · 16:36 UTC

via #AIFoundry : The Developer’s Guide to Smarter Fine-tuning: Unlock custom AI for every business challenge

https://ift.tt/E9VBItf
#FineTuning #AzureAI #CustomAI #MachineLearning #AIModels #BusinessSolutions #AIInnovation #DeveloperGuide #AITraining #ReinforcementLearning #D…

#aifoundry #finetuning #azureai #customai #machinelearning #aimodels

IT News @[email protected] · 2025-10-09 · 22:25 UTC

AI models can acquire backdoors from surprisingly few malicious documents - Scraping the open web for AI training data can have its draw... - https://arstechnica.com/ai/2025/10/ai-models-can-acquire-backdoors-from-surprisingly-few-malicious-documents/ #ukaisecurityinstitute #alanturinginstitute #aivulnerabilities #backdoorattacks #machinelearning #datapoisoning #trainingdata #llmsecurity #modelsafety #pretraining #airesearch #aisecurity #finetuning #anthropic #biz⁢ #ai

#ukaisecurityinstitute #alanturinginstitute #aivulnerabilities #backdoorattacks #machinelearning #datapoisoning

Habr @[email protected] · 2025-09-25 · 13:22 UTC

[Перевод] Без тренировки, но с обучением: имплицитная динамика in-context learning

Одной из наиболее примечательных особенностей Large Language Models (LLM) является их способность к in-context learning — обучению в контексте. В частности, на этапе инференса LLM может усваивать новые паттерны без какого-либо дополнительного обновления весов, если эти паттерны представлены в виде примеров в промпте, даже если эти паттерны не встречались во время обучения. Механизмы, за счёт которых это возможно, всё ещё во многом остаются неизвестными. В данной работе мы показываем, что комбинация слоя self-attention с MLP позволяет трансформер-блоку неявно модифицировать веса MLP-слоя в зависимости от контекста. Мы утверждаем на основе теоретического анализа и экспериментов, что этот простой механизм может объяснять, почему LLM способны обучаться в контексте, а не только во время тренировки модели. В частности, мы демонстрируем, что при ряде упрощающих допущений трансформер-блок неявно преобразует контекст в low-rank обновление весов MLP-слоя.

https://habr.com/ru/articles/949064/

#llm #llmмодели #icl #mlp #ml #machine_learning #finetuning

#llm #llmмодели #icl #mlp #ml #machine_learning

Fauve @[email protected] · 2025-09-23 · 18:03 UTC

Détail de l’ornement.

L’arabesque qui bourgeonne du ṫatwīl est repris d’un element de la mosaïque « Plus ultra » se trouvant dans l’allée du Mexuar dans l’Alambra de Grenade, là où Lisān al-Ḋīn auteur des vers en question, passa le plus clair de son temps.

#art #calligraphy #typography #arab #arabe #finetuning #poesie #poetry #alandalus #andalousie #mosaic #alhambra #granada

#art #calligraphy #typography #arab #arabe #finetuning

Fauve @[email protected] · 2025-09-23 · 16:20 UTC

Exemple de justification typographique avec l’abjad arabe qui est cursif et où donc le réglage de l’approche s’opère en ajustant la taille du liant entre deux lettres.

Le texte arabe utilisé à titre d’exemple est un dystique du Jadaka al ṙayṫ de Lisān al-Ḋīn ibn al-Xatib :

ضاق عن وجدي بكم رحب الفضا
لا أبالي شرقه من غربـه

Votre absence me rendit le cosmos si étroit
Que peu me chaut d’en distinguer l’orient de l’occident.

#art #calligraphy #typography #arab #arabe #finetuning #poesie #poetry

#art #calligraphy #typography #arab #arabe #finetuning

Habr @[email protected] · 2025-09-19 · 13:42 UTC

[Перевод] Селективная генерализация: улучшение возможностей при сохранении alignment

TL;DR: Мы провели бенчмаркинг семи методов, направленных на предотвращение эмерджентного рассогласования и других форм некорректного обобщения с использованием ограниченного объёма alignment-данных. Мы демонстрируем устойчивый трейдофф между способностями модели и согласованием, подчеркивая необходимость более эффективных методов для снижения этого конфликта. Простое включение alignment-данных в микс обучающих данных оказывается недостаточным для предотвращения рассогласования, однако простое наложение KL Divergence penalty на alignment-данные показывает лучшие результаты, чем более сложные подходы.

https://habr.com/ru/articles/945838/

#llm #alignment #lora #large_language_model #ии #ai #finetuning #парето

#парето #finetuning #ai #ии #large_language_model #lora

Habr @[email protected] · 2025-09-01 · 12:52 UTC

[Перевод] Скрытая угроза: как LLM заражают друг друга предубеждениями через «безобидные» данные

tl;dr. Мы изучаем сублиминальное обучение — неожиданное явление, при котором языковые модели перенимают свойства из данных, сгенерированных другой моделью, даже если эти данные семантически никак не связаны с передаваемыми свойствами. Например, «студент» начинает предпочитать сов, если его обучить на последовательностях чисел, сгенерированных «учителем», который предпочитает сов. Тот же феномен способен передавать misalignment через данные, которые выглядят абсолютно безобидными. Этот эффект проявляется только в том случае, если учитель и студент основаны на одной и той же базовой модели. Исследование проведено в рамках программы Anthropic Fellows . Эта статья также опубликована в блоге Anthropic Alignment Science.

https://habr.com/ru/articles/937278/

#llm #llmмодели #distillation #ai #ии #искусственный_интеллект #finetuning #chainofthought #misalignment #anthropic

#anthropic #misalignment #chainofthought #finetuning #искусственный_интеллект #ии

808 Game Studio @[email protected] · 2025-08-12 · 16:08 UTC

Day 18 to NULL Train!
Fine tuning day. Follow along as we share from Day 18 to Early Access.

Play the demo. Wishlist now: https://store.steampowered.com/app/3717840/NULL_Train/

#day18 #gamedev #gameplay #gameplayshorts #gamedevelopment #nulltrain #indiedev #indiegamedev #steamgame #devlog #gamedemo #pixelart #wishlistideas #wishlist #roguelike #madeinhawaii #steamnextfest #earlyaccess #finetuning #tuneup

#day18 #gamedev #gameplay #gameplayshorts #gamedevelopment #nulltrain

Habr @[email protected] · 2025-07-31 · 12:52 UTC

Retrieval-Augmented Generation (RAG): глубокий технический обзор

Retrieval-Augmented Generation (RAG) – это архитектурный подход к генеративным моделям, который сочетает навыки поиска информации с генеративными возможностями больших языковых моделей (LLM). Идея RAG была предложена в 2020 году, чтобы преодолеть ограничение LLM – замкнутость на знаниях из обучающих данных. Вместо попыток «вживить» все знания в параметры модели, RAG-подход позволяет модели запрашивать актуальные сведения из внешних источников (баз знаний) во время генерации ответа . Это обеспечивает более точные и актуальные ответы, опирающиеся на факты, а не только на память модели. В этой статье мы подробно рассмотрим : архитектуру RAG, её компоненты и этапы работы, современные инструменты и практики для реализации RAG, примеры кода на Python, кейсы применения в бизнесе и науке, технические вызовы и лучшие практики, сравнение RAG с классическим fine-tuning, перспективы технологии.

https://habr.com/ru/articles/931396/

#rag #retrieval_augmented_generation #llm #ai #rag_pipeline #rag_ai #finetuning #ragas

#ragas #finetuning #rag_ai #rag_pipeline #ai #llm

Hassan Habib @[email protected] · 2025-06-05 · 02:55 UTC

Prepping data for AI feels a bit like meal prep…
Except your dinner is a .jsonl file and your customer is a llama. 🐪

I’m learning the ropes of AI training, starting with how to turn raw .txt into structured data for LLMs.

🎥 How to Feed Your Llama is live:
https://www.youtube.com/watch?v=YB9cVyjV9Bo

#AI #LLM #JSONL #FineTuning #Python #LearningInPublic #LLaMA #Mistral

#ai #llm #jsonl #finetuning #python #learninginpublic

Hacker News @[email protected] · 2025-06-01 · 13:44 UTC

When Fine-Tuning Makes Sense: A Developer's Guide

https://getkiln.ai/blog/why_fine_tune_LLM_models_and_how_to_get_started

#HackerNews #DeveloperGuide #FineTuning #LLMs #AIInsights #MachineLearning #HackerNews

#hackernews #developerguide #finetuning #llms #aiinsights #machinelearning

Brandon H :csharp: :verified: @[email protected] · 2025-05-27 · 22:12 UTC

via @dotnet : Circuit Breaker Policy Fine-tuning Best Practice

https://ift.tt/9DFwWVT
#CircuitBreaker #ResiliencePolicy #Polly #DotNet #HTTPClients #ServiceResilience #FaultTolerance #FineTuning #Configuration #BestPractices #SoftwareDevelopment #Microservices #…

#circuitbreaker #resiliencepolicy #polly #dotnet #httpclients #serviceresilience

Habr @[email protected] · 2025-04-19 · 11:32 UTC

Накорми языковую модель документами

Одна из актуальных задач для компаний в сфере ИИ - это поиск и генерация ответов по внутренней документации. На первый взгляд кажется, что решение простое: скормить документы большой языковой модели (LLM) и получать ответы. На практике же технические решения оказываются далеко не такими эффективными и качественными, как хотелось бы. Сейчас для работы с локальными документами доступны два основных подхода - RAG (Retrieval-Augmented Generation) и дообучение модели (fine-tuning). Оба подхода имеют свои преимущества и ограничения. В статье рассмотрим их как с теоретической, так и с практической точки зрения.

https://habr.com/ru/articles/898938/

#rag #finetuning #huggingface #llmмодели #llm #нейросети #большие_языковые_модели #nlp #искусственный_интеллект #natural_language_processing

#rag #finetuning #huggingface #llmмодели #llm #нейросети

Habr @[email protected] · 2025-04-06 · 11:22 UTC

Fine tuning или RAG. Что выбрать?

🐝 RAG vs Fine tuning. В чём разница? При разработке ИИ проектов существует два способа интеграции внешних данных: RAG хранилища и Fine tuning. Для не технаря отличия не очевидны. Я сделал short summary, чтобы по существу изложить плюсы и минусы двух решений

https://habr.com/ru/articles/898026/

#typescript #javascript #python #finetuning #rag #ml #llm #yandexcloud #машинное+обучение #исскуственный_интеллект