#image_generation — Public Fediverse posts on home.social

Habr @[email protected] · 2025-10-21 · 11:02 UTC

T-LoRA: дообучить диффузионную модель на одной картинке и не переобучиться

Вы когда‑нибудь мечтали стать лучшей версией себя? Моложе, красивее, идеальнее… А вот LoRA уже стала! Меня зовут Вера Соболева, я научный сотрудник лаборатории FusionBrain Института AIRI, а также стажер‑исследователь Центра глубинного обучения и байесовских методов НИУ ВШЭ. Cегодня я расскажу про наше свежее исследование T‑LoRA: Single Image Diffusion Model Customization Without Overfitting . Мы с коллегами придумали эффективный способ как файнтюнить диффузионные модели с помощью LoRA всего по одной картинке . Представьте такую ситуацию: вы хотите, чтобы модель генерировала вашу кошечку узнаваемой и в самых разных сценариях, но у вас нет времени или желания собирать обширный разнообразный датасет. А может, у вас вообще есть всего одна фотография (с хозяевами кошек так обычно не бывает, но допустим). Хорошая новость: эту задачу можно решить, копнув поглубже в свойства диффузии! В этой статье я расскажу, как это сделать.

https://habr.com/ru/companies/airi/articles/958348/

#diffusion_models #finetuning #loraадаптеры #lora #image_generation

#image_generation #lora #loraадаптеры #finetuning #diffusion_models

Habr @[email protected] · 2025-10-21 · 11:02 UTC

T-LoRA: дообучить диффузионную модель на одной картинке и не переобучиться

Вы когда‑нибудь мечтали стать лучшей версией себя? Моложе, красивее, идеальнее… А вот LoRA уже стала! Меня зовут Вера Соболева, я научный сотрудник лаборатории FusionBrain Института AIRI, а также стажер‑исследователь Центра глубинного обучения и байесовских методов НИУ ВШЭ. Cегодня я расскажу про наше свежее исследование T‑LoRA: Single Image Diffusion Model Customization Without Overfitting . Мы с коллегами придумали эффективный способ как файнтюнить диффузионные модели с помощью LoRA всего по одной картинке . Представьте такую ситуацию: вы хотите, чтобы модель генерировала вашу кошечку узнаваемой и в самых разных сценариях, но у вас нет времени или желания собирать обширный разнообразный датасет. А может, у вас вообще есть всего одна фотография (с хозяевами кошек так обычно не бывает, но допустим). Хорошая новость: эту задачу можно решить, копнув поглубже в свойства диффузии! В этой статье я расскажу, как это сделать.

https://habr.com/ru/companies/airi/articles/958348/

#diffusion_models #finetuning #loraадаптеры #lora #image_generation

#image_generation #lora #loraадаптеры #finetuning #diffusion_models

Habr @[email protected] · 2025-10-21 · 11:02 UTC

T-LoRA: дообучить диффузионную модель на одной картинке и не переобучиться

Вы когда‑нибудь мечтали стать лучшей версией себя? Моложе, красивее, идеальнее… А вот LoRA уже стала! Меня зовут Вера Соболева, я научный сотрудник лаборатории FusionBrain Института AIRI, а также стажер‑исследователь Центра глубинного обучения и байесовских методов НИУ ВШЭ. Cегодня я расскажу про наше свежее исследование T‑LoRA: Single Image Diffusion Model Customization Without Overfitting . Мы с коллегами придумали эффективный способ как файнтюнить диффузионные модели с помощью LoRA всего по одной картинке . Представьте такую ситуацию: вы хотите, чтобы модель генерировала вашу кошечку узнаваемой и в самых разных сценариях, но у вас нет времени или желания собирать обширный разнообразный датасет. А может, у вас вообще есть всего одна фотография (с хозяевами кошек так обычно не бывает, но допустим). Хорошая новость: эту задачу можно решить, копнув поглубже в свойства диффузии! В этой статье я расскажу, как это сделать.

https://habr.com/ru/companies/airi/articles/958348/

#diffusion_models #finetuning #loraадаптеры #lora #image_generation

#image_generation #lora #loraадаптеры #finetuning #diffusion_models

Habr @[email protected] · 2025-10-21 · 11:02 UTC

T-LoRA: дообучить диффузионную модель на одной картинке и не переобучиться

Вы когда‑нибудь мечтали стать лучшей версией себя? Моложе, красивее, идеальнее… А вот LoRA уже стала! Меня зовут Вера Соболева, я научный сотрудник лаборатории FusionBrain Института AIRI, а также стажер‑исследователь Центра глубинного обучения и байесовских методов НИУ ВШЭ. Cегодня я расскажу про наше свежее исследование T‑LoRA: Single Image Diffusion Model Customization Without Overfitting . Мы с коллегами придумали эффективный способ как файнтюнить диффузионные модели с помощью LoRA всего по одной картинке . Представьте такую ситуацию: вы хотите, чтобы модель генерировала вашу кошечку узнаваемой и в самых разных сценариях, но у вас нет времени или желания собирать обширный разнообразный датасет. А может, у вас вообще есть всего одна фотография (с хозяевами кошек так обычно не бывает, но допустим). Хорошая новость: эту задачу можно решить, копнув поглубже в свойства диффузии! В этой статье я расскажу, как это сделать.

https://habr.com/ru/companies/airi/articles/958348/

#diffusion_models #finetuning #loraадаптеры #lora #image_generation

Habr @[email protected] · 2025-10-13 · 04:22 UTC

Часть-1. Почему ИИ рисует каракули вместо текста: анатомия проблемы и дорожная карта решений

Привет, чемпионы! Давайте начистоту. Вы уже перепробовали все: и промпты в кавычках, и уговоры на английском, и даже шептали запросы своему GPU. Результат? Очередная вывеска с текстом, напоминающим древние руны, переведенные через пять языков. Знакомо? Это наша общая, фундаментальная боль, и сегодня мы не будем ее заливать кофеином и надеждой. Мы возьмем ее, положим на операционный стол и проведем полную анатомическую диссекцию.

https://habr.com/ru/companies/datafeel/articles/952664/

#ml #ai #design #texttoimage #image_generation #text_generation #fix_text_on_image #contentmaker #contentmarketing #midjourney

#midjourney #contentmarketing #contentmaker #fix_text_on_image #text_generation #image_generation

Habr @[email protected] · 2025-10-13 · 04:22 UTC

Часть-1. Почему ИИ рисует каракули вместо текста: анатомия проблемы и дорожная карта решений

Привет, чемпионы! Давайте начистоту. Вы уже перепробовали все: и промпты в кавычках, и уговоры на английском, и даже шептали запросы своему GPU. Результат? Очередная вывеска с текстом, напоминающим древние руны, переведенные через пять языков. Знакомо? Это наша общая, фундаментальная боль, и сегодня мы не будем ее заливать кофеином и надеждой. Мы возьмем ее, положим на операционный стол и проведем полную анатомическую диссекцию.

https://habr.com/ru/companies/datafeel/articles/952664/

#ml #ai #design #texttoimage #image_generation #text_generation #fix_text_on_image #contentmaker #contentmarketing #midjourney

#midjourney #contentmarketing #contentmaker #fix_text_on_image #text_generation #image_generation

Habr @[email protected] · 2025-10-13 · 04:22 UTC

Часть-1. Почему ИИ рисует каракули вместо текста: анатомия проблемы и дорожная карта решений

Привет, чемпионы! Давайте начистоту. Вы уже перепробовали все: и промпты в кавычках, и уговоры на английском, и даже шептали запросы своему GPU. Результат? Очередная вывеска с текстом, напоминающим древние руны, переведенные через пять языков. Знакомо? Это наша общая, фундаментальная боль, и сегодня мы не будем ее заливать кофеином и надеждой. Мы возьмем ее, положим на операционный стол и проведем полную анатомическую диссекцию.

https://habr.com/ru/companies/datafeel/articles/952664/

#ml #ai #design #texttoimage #image_generation #text_generation #fix_text_on_image #contentmaker #contentmarketing #midjourney

#midjourney #contentmarketing #contentmaker #fix_text_on_image #text_generation #image_generation

Habr @[email protected] · 2025-10-13 · 04:22 UTC

Часть-1. Почему ИИ рисует каракули вместо текста: анатомия проблемы и дорожная карта решений

Привет, чемпионы! Давайте начистоту. Вы уже перепробовали все: и промпты в кавычках, и уговоры на английском, и даже шептали запросы своему GPU. Результат? Очередная вывеска с текстом, напоминающим древние руны, переведенные через пять языков. Знакомо? Это наша общая, фундаментальная боль, и сегодня мы не будем ее заливать кофеином и надеждой. Мы возьмем ее, положим на операционный стол и проведем полную анатомическую диссекцию.

https://habr.com/ru/companies/datafeel/articles/952664/

#ml #ai #design #texttoimage #image_generation #text_generation #fix_text_on_image #contentmaker #contentmarketing #midjourney

#ml #ai #design #texttoimage #image_generation #text_generation

Habr @[email protected] · 2025-10-08 · 13:52 UTC

Seedream v4 — платный конкурент Nano Banana. Зачем он тогда нужен? И как использовать бесплатно + Гайды

Да, Seedream v4 от ByteDance - доступен только платно . Тогда зачем он нужен, если есть Nano Banana? Разбираемся!

https://habr.com/ru/articles/954638/

#seedream4 #nano_banana #нейрофотошоп #AIфоторедактор #генерация_изображений #inpainting #Сравнение_Seedream_v4_и_Nano_Banana #image_generation #outpainting #иифотошоп

#иифотошоп #outpainting #image_generation #сравнение_seedream_v4_и_nano_banana #inpainting #генерация_изображений

Habr @[email protected] · 2025-06-20 · 14:22 UTC

20+ кейсов с изображениями в ChatGPT. Или экономим 100,000₽+ на дизайнерах

С момента, как OpenAI выпустила свой новый генератор картинок, прошло уже почти 3 месяца. Хайп уже давно прошел, а у меня дошли руки до статьи на Хабре Эта статья про полезные юзкейсы генерации картинок, с которыми каждый из вас может сталкиваться. Постарался найти такие юзкейсы, которые у графических дизайнеров будут стоить десятки тысяч рублей 💫 Внутри много примеров, прям много Узнать, как экономить 💰 на дизайнерах

https://habr.com/ru/articles/920274/

#llm #chatgpt #designer #ai #image_generation

#image_generation #ai #designer #chatgpt #llm

Øyvind Bugge Solheim @[email protected] · 2025-04-03 · 07:51 UTC

CW: LLM AI

Do you want to see something strange? Try to edit an image with chatgpt. You get a recreation of your image where everything is the same and completely different at the same time. It's like chatgpt gets prompted with a very specific prompt of your image. I made a short blog post about this very strange LLM upside-down version of the world.

https://oyvindsolheim.com/posts/25_04_02_uncanny/

#chatgpt
#llm #image_generation #AI

#chatgpt #llm #image_generation #ai

Habr @[email protected] · 2025-03-11 · 15:02 UTC

[Перевод] Spring AI научился видеть! Показываю, как заставить GPT находить бананы на картинках

Новый перевод от команды Spring АйО расскажет вам о работе с мультимодальностью при работе со Spring AI и о различных вариантах работы с графическими изображениями с использованием искусственного интеллекта.

https://habr.com/ru/companies/spring_aio/articles/889974/

#spring_ai #multimodality #images #image_generation #image_recognition

#image_recognition #image_generation #images #multimodality #spring_ai