#stable_diffusion — Public Fediverse posts
Live and recent posts from across the Fediverse tagged #stable_diffusion, aggregated by home.social.
-
Ожидание: сделать ИИ-примерочную обоев за 2 дня. Реальность: пришлось добучать свою модель на SD
В условиях жесткой конкуренции на рынке отделочных материалов любому магазину жизненно необходимо хоть какое-то осязаемое преимущество. Стандартными каталогами и скидками уже никого не удивить. Так у нас родилась идея: сделать онлайн-примерочную обоев. Кажется, звучит как киллер-фича — дать клиенту возможность до покупки увидеть, как конкретный паттерн будет смотреться в его реальном интерьере. На тот момент на рынке вовсю хайповали генеративные модели (такие как «Nano Banana»). На первый взгляд казалось, что проблема решается в два клика. План был надежен, как швейцарские часы: получить API-ключ, отправить по эндпоинту фотографию интерьера и текстуру обоев, сопроводить это правильным промптом (с указанием учитывать перспективу, освещение и масштаб) и забирать готовый результат. Но на практике оказалось, что задача не просто нетривиальная. Она вскрыла целый пласт проблем, о которых создатели популярных генеративок предпочитают умалчивать.
https://habr.com/ru/articles/1039804/
#computer_vision #stable_diffusion #нейросети #finetuning #ecommerce #визуализация_интерьеров #chatgpt
-
Концепция Байесовского мозга, или Почему этот заголовок в моменте — ваша галлюцинация
Помните то самое платье? В 2015 году интернет раскололся пополам: одни клялись, что оно бело-золотое, другие — мол, сине-черное. Люди ругались в комментах, крутили яркость на мониторе, а самые умные врубали пипетку в Paint. Само платье, кстати, оказалось сине-черным, но дело вообще не в этом. Проблема в том, что двое условных человека смотрели на одни и те же пиксели и видели разные цвета. Не интерпретировали по-разному, не спорили о вкусах — буквально видели разное. И оба лагеря не ошибались: сетчатка у всех отрабатывала штатно, а дальтонизм тут вообще ни при чем (поскольку речь не об оттенках одного цвета). Последние лет двадцать нейронаука потихоньку сходится на одной неуютной идее: вы никогда не видели реальность напрямую . Ни платье, ни эту статью, ни собственные руки. Все, что вы воспринимаете прямо сейчас, догадка вашего мозга о том, что, вероятно, находится снаружи. Образованная догадка, обычно очень точная, но все же догадка. Эта концепция называется байесовским мозгом , и я хочу о ней рассказать. Потому что, во-первых, она красиво объясняет кучу странных вещей: от оптических иллюзий до галлюцинаций и эффекта плацебо. А во-вторых, ровно по такому же принципу работает половина современного машинного обучения. Stable Diffusion, которая дорисовывает картинку из шума, Языковые модели, которые предсказывают следующее слово. Автоэнкодеры, world models, диффузионки — все это, если снять маркетинговую обертку, машины, которые делают то же самое, что и ваш мозг прямо сейчас. Гадают. Так что начнем с мозга, а закончим нейросетями, и по дороге, надеюсь, вы начнете чуть меньше доверять собственным глазам.
https://habr.com/ru/companies/ru_mts/articles/1029856/
#байесовский_мозг #предиктивное_кодирование #нейронаука #машинное_обучение #генеративные_модели #Stable_Diffusion #LLM #Карл_Фристон #Анил_Сет #Джеффри_Хинтон
-
SD Studio: свой Midjourney на своей видеокарте с LLM-помощником
Сперва — откуда взялась идея? Мы с женой делаем текстовую игру по её фэнтези-вселенной. Что-то вроде совместного хобби: ей интересно писать, мне нравится программировать. Но суть не в этом. Рисовать никто из нас не умеет, а картинки в тексте нужны. Сейчас это не проблема — нейросетей куча, особенно для генерации изображений. Но есть минусы: на платных сервисах можно хорошо так разориться, особенно для пет-проекта. Есть решение — Stable Diffusion, генерировать на своей видеокарте. Первые шаги с Stable Diffusion Для работы с локальным SD есть несколько инструментов. Взял первый и, наверное, самый популярный — Automatic1111. Сгенерировал — получил полную фигню. Начал читать, что пишут. Оказывается, уже создано огромное количество предобученных моделей и LoRA для добавления тех функций, что модель не умеет. Результат стал сильно лучше. Дальше — промпты, то есть текстовое описание того, что мы должны получить на итоговом изображении. Там тоже есть свои рекомендации. Модель не читает мысли пользователя, ей нужно более точно и в понятном ей виде предоставить описание. Дополнительно разбираемся с настройками генерации — samplers, steps и т.д. Всё осуществимо, но получаем другую проблему: для генерации одной картинки мы очень долго подбираем все эти значения и тексты. Первая автоматизация Чтобы упростить процесс, я сделал следующее. Для наполнения контента в игре есть админка — обычный CRUD на Symfony. Дополнительно в отдельной папке лежат файлы со всем лором книги/игры. В итоге я создал два провайдера. Первый — для общения с локальной LLM, которая по нужному запросу берёт необходимый контент из папки с лором и составляет корректный промпт для SD. Второй — для SD, где заданы предварительные настройки: используемая модель, LoRA и вместе с промптом всё это отправляется в SD, и мы получаем итоговую картинку. Несколько попыток, потому что с первого раза вряд ли получим нужное. Получаем более-менее адекватный результат и идём в Photoshop — убрать лишнее, сжать и т.п.
https://habr.com/ru/articles/1030628/
#stable_diffusion #llm #десктопное_приложение #генерация_изображений #open_source #golang #wails #ollama
-
Stable Diffusion XL: так ли сложно использовать локальную модель?
Когда звучит фраза «нарисовать картинку нейросетью», под этим обычно подразумевается отправка запроса в какой-нибудь условно-бесплатный сервис вроде Nano Banana или ChatGPT. Еще можно заплатить за подписку на Midjourney и смириться с тем, что твои промпты видит вся дискорд-галерея. Есть, конечно, и еще один путь — поднять открытую модель вроде Stable Diffusion на собственном компьютере, однако для большинства пользователей он всё ещё ощущается как «очень сложно» или «очень дорого». Книга, о которой мы хотим сегодня рассказать, решает как минимум первую проблему. И как же именно?
https://habr.com/ru/companies/bhv_publishing/articles/1014232/
#ИИ #AI #ml #artificial_intelligence #stablediffusion #stable_diffusion #stable_diffusion_нейросеть #нейронные_сети #нейросети #генерация_изображений
-
Stable Diffusion XL: так ли сложно использовать локальную модель?
Когда звучит фраза «нарисовать картинку нейросетью», под этим обычно подразумевается отправка запроса в какой-нибудь условно-бесплатный сервис вроде Nano Banana или ChatGPT. Еще можно заплатить за подписку на Midjourney и смириться с тем, что твои промпты видит вся дискорд-галерея. Есть, конечно, и еще один путь — поднять открытую модель вроде Stable Diffusion на собственном компьютере, однако для большинства пользователей он всё ещё ощущается как «очень сложно» или «очень дорого». Книга, о которой мы хотим сегодня рассказать, решает как минимум первую проблему. И как же именно?
https://habr.com/ru/companies/bhv_publishing/articles/1014232/
#ИИ #AI #ml #artificial_intelligence #stablediffusion #stable_diffusion #stable_diffusion_нейросеть #нейронные_сети #нейросети #генерация_изображений
-
Stable Diffusion XL: так ли сложно использовать локальную модель?
Когда звучит фраза «нарисовать картинку нейросетью», под этим обычно подразумевается отправка запроса в какой-нибудь условно-бесплатный сервис вроде Nano Banana или ChatGPT. Еще можно заплатить за подписку на Midjourney и смириться с тем, что твои промпты видит вся дискорд-галерея. Есть, конечно, и еще один путь — поднять открытую модель вроде Stable Diffusion на собственном компьютере, однако для большинства пользователей он всё ещё ощущается как «очень сложно» или «очень дорого». Книга, о которой мы хотим сегодня рассказать, решает как минимум первую проблему. И как же именно?
https://habr.com/ru/companies/bhv_publishing/articles/1014232/
#ИИ #AI #ml #artificial_intelligence #stablediffusion #stable_diffusion #stable_diffusion_нейросеть #нейронные_сети #нейросети #генерация_изображений
-
Stable Diffusion XL: так ли сложно использовать локальную модель?
Когда звучит фраза «нарисовать картинку нейросетью», под этим обычно подразумевается отправка запроса в какой-нибудь условно-бесплатный сервис вроде Nano Banana или ChatGPT. Еще можно заплатить за подписку на Midjourney и смириться с тем, что твои промпты видит вся дискорд-галерея. Есть, конечно, и еще один путь — поднять открытую модель вроде Stable Diffusion на собственном компьютере, однако для большинства пользователей он всё ещё ощущается как «очень сложно» или «очень дорого». Книга, о которой мы хотим сегодня рассказать, решает как минимум первую проблему. И как же именно?
https://habr.com/ru/companies/bhv_publishing/articles/1014232/
#ИИ #AI #ml #artificial_intelligence #stablediffusion #stable_diffusion #stable_diffusion_нейросеть #нейронные_сети #нейросети #генерация_изображений
-
От Stable Diffusion до тонкой настройки LLM: разбираем новую книгу-практикум
Генеративный ИИ перестал быть магией и стал инструментом. Но чтобы им уверенно пользоваться, нужно понимать, как работают трансформеры и диффузионные модели, и уметь их адаптировать. В этом поможет
https://habr.com/ru/companies/bhv_publishing/articles/1005404/
#БХВ #BHV #генеративный_ИИ #трансформеры #искусственный_интеллект #llm #диффузионные_модели #stable_diffusion #машинное_обучение #нейросети
-
От Stable Diffusion до тонкой настройки LLM: разбираем новую книгу-практикум
Генеративный ИИ перестал быть магией и стал инструментом. Но чтобы им уверенно пользоваться, нужно понимать, как работают трансформеры и диффузионные модели, и уметь их адаптировать. В этом поможет
https://habr.com/ru/companies/bhv_publishing/articles/1005404/
#БХВ #BHV #генеративный_ИИ #трансформеры #искусственный_интеллект #llm #диффузионные_модели #stable_diffusion #машинное_обучение #нейросети
-
От Stable Diffusion до тонкой настройки LLM: разбираем новую книгу-практикум
Генеративный ИИ перестал быть магией и стал инструментом. Но чтобы им уверенно пользоваться, нужно понимать, как работают трансформеры и диффузионные модели, и уметь их адаптировать. В этом поможет
https://habr.com/ru/companies/bhv_publishing/articles/1005404/
#БХВ #BHV #генеративный_ИИ #трансформеры #искусственный_интеллект #llm #диффузионные_модели #stable_diffusion #машинное_обучение #нейросети
-
От Stable Diffusion до тонкой настройки LLM: разбираем новую книгу-практикум
Генеративный ИИ перестал быть магией и стал инструментом. Но чтобы им уверенно пользоваться, нужно понимать, как работают трансформеры и диффузионные модели, и уметь их адаптировать. В этом поможет
https://habr.com/ru/companies/bhv_publishing/articles/1005404/
#БХВ #BHV #генеративный_ИИ #трансформеры #искусственный_интеллект #llm #диффузионные_модели #stable_diffusion #машинное_обучение #нейросети
-
Как я подружился с ComfyUI: от непонятных настроек к контролируемой генерации
Привет, Хабр! Я Кирилл, занимаюсь дизайном и цифровой иллюстрацией, часто работаю с генеративной графикой. За последнее время успел перепробовать кучу разных платформ — от бесплатных Web UI до платных сервисов вроде Midjourney. Но, как это обычно бывает, идеальный инструмент так и не нашелся. Одни оказываются слишком дорогими — пока дойдешь до десятой итерации картинки, уже выжжешь весь лимит токенов. Другие же страдают от неудобного интерфейса и абсолютно непредсказуемого результата. И вот недавно я решил создать серию артов в разных стилях, чтобы положить в портфолио. Примерно понимал, что хочу видеть, и не хотелось тратить время на миллион попыток, чтобы получить нужный результат. Именно поэтому пришлось искать новый инструмент, с которым не нужно долго разбираться и при этом можно полностью контролировать процесс генерации. Решил рассказать, как я пришел к ComfyUI, и написать небольшую инструкцию по его запуску. Заранее прошу прощения, если вы уже видели эту публикацию в ленте — перезалил потому что по невнимательности ткнул английский в языке публикации, заодно приложил более свежие арты.
https://habr.com/ru/companies/cloud_ru/articles/985610/
#дизайн #генеративное_искусство #генеративный_арт #генеративный_дизайн #comfyui #stable_diffusion #нодовый_интерфейс
-
Как я подружился с ComfyUI: от непонятных настроек к контролируемой генерации
Привет, Хабр! Я Кирилл, занимаюсь дизайном и цифровой иллюстрацией, часто работаю с генеративной графикой. За последнее время успел перепробовать кучу разных платформ — от бесплатных Web UI до платных сервисов вроде Midjourney. Но, как это обычно бывает, идеальный инструмент так и не нашелся. Одни оказываются слишком дорогими — пока дойдешь до десятой итерации картинки, уже выжжешь весь лимит токенов. Другие же страдают от неудобного интерфейса и абсолютно непредсказуемого результата. И вот недавно я решил создать серию артов в разных стилях, чтобы положить в портфолио. Примерно понимал, что хочу видеть, и не хотелось тратить время на миллион попыток, чтобы получить нужный результат. Именно поэтому пришлось искать новый инструмент, с которым не нужно долго разбираться и при этом можно полностью контролировать процесс генерации. Решил рассказать, как я пришел к ComfyUI, и написать небольшую инструкцию по его запуску. Заранее прошу прощения, если вы уже видели эту публикацию в ленте — перезалил потому что по невнимательности ткнул английский в языке публикации, заодно приложил более свежие арты.
https://habr.com/ru/companies/cloud_ru/articles/985610/
#дизайн #генеративное_искусство #генеративный_арт #генеративный_дизайн #comfyui #stable_diffusion #нодовый_интерфейс
-
Как я подружился с ComfyUI: от непонятных настроек к контролируемой генерации
Привет, Хабр! Я Кирилл, занимаюсь дизайном и цифровой иллюстрацией, часто работаю с генеративной графикой. За последнее время успел перепробовать кучу разных платформ — от бесплатных Web UI до платных сервисов вроде Midjourney. Но, как это обычно бывает, идеальный инструмент так и не нашелся. Одни оказываются слишком дорогими — пока дойдешь до десятой итерации картинки, уже выжжешь весь лимит токенов. Другие же страдают от неудобного интерфейса и абсолютно непредсказуемого результата. И вот недавно я решил создать серию артов в разных стилях, чтобы положить в портфолио. Примерно понимал, что хочу видеть, и не хотелось тратить время на миллион попыток, чтобы получить нужный результат. Именно поэтому пришлось искать новый инструмент, с которым не нужно долго разбираться и при этом можно полностью контролировать процесс генерации. Решил рассказать, как я пришел к ComfyUI, и написать небольшую инструкцию по его запуску. Заранее прошу прощения, если вы уже видели эту публикацию в ленте — перезалил потому что по невнимательности ткнул английский в языке публикации, заодно приложил более свежие арты.
https://habr.com/ru/companies/cloud_ru/articles/985610/
#дизайн #генеративное_искусство #генеративный_арт #генеративный_дизайн #comfyui #stable_diffusion #нодовый_интерфейс
-
Как я подружился с ComfyUI: от непонятных настроек к контролируемой генерации
Привет, Хабр! Я Кирилл, занимаюсь дизайном и цифровой иллюстрацией, часто работаю с генеративной графикой. За последнее время успел перепробовать кучу разных платформ — от бесплатных Web UI до платных сервисов вроде Midjourney. Но, как это обычно бывает, идеальный инструмент так и не нашелся. Одни оказываются слишком дорогими — пока дойдешь до десятой итерации картинки, уже выжжешь весь лимит токенов. Другие же страдают от неудобного интерфейса и абсолютно непредсказуемого результата. И вот недавно я решил создать серию артов в разных стилях, чтобы положить в портфолио. Примерно понимал, что хочу видеть, и не хотелось тратить время на миллион попыток, чтобы получить нужный результат. Именно поэтому пришлось искать новый инструмент, с которым не нужно долго разбираться и при этом можно полностью контролировать процесс генерации. Решил рассказать, как я пришел к ComfyUI, и написать небольшую инструкцию по его запуску. Заранее прошу прощения, если вы уже видели эту публикацию в ленте — перезалил потому что по невнимательности ткнул английский в языке публикации, заодно приложил более свежие арты.
https://habr.com/ru/companies/cloud_ru/articles/985610/
#дизайн #генеративное_искусство #генеративный_арт #генеративный_дизайн #comfyui #stable_diffusion #нодовый_интерфейс
-
Kandinsky 5.0 vs Stable Diffusion: практический тест на 6 сценариях для иллюстраций и ассетов
В разработке мне регулярно нужны картинки “вокруг кода”: обложки к техпостам/README, иллюстрации в документацию, а иногда — быстрые ассеты/референсы для пет-проектов. В рамках сезона решил протестировать Kandinsky 5.0 на типовых сценах и сравнить ощущения с привычным пайплайном на Stable Diffusion: где быстрее получить годный результат без плясок с промптом, а где лучше иметь “запасной аэродром”. Под “разработческими задачами” здесь я имею в виду не генерацию кода, а задачи вокруг продукта: обложки к постам/README, иллюстрации к документации и быстрые прототипы визуалов/ассетов для пет-проектов. Смотреть сравнение
https://habr.com/ru/articles/978586/
#Сезон_ИИ_в_разработке #Kandinsky_50 #Stable_Diffusion #генерация_изображений #diffusion #нейросети
-
https://generativeai.pub/the-math-art-of-artist-0thernes-not-the-typical-96e009060bc1
"No Artist Tolerates Reality"
#aiart #ai_art #diffusion #denoising #latent_space #llm #dalle3 #firefly #grok #midjourney #krea #stable_diffusion #art #ai #artificial_intelligence #nft #prompting #prompts #chaos #improv #pinterest #instagram #DeviantArt #x #beeple
-
https://generativeai.pub/the-math-art-of-artist-0thernes-not-the-typical-96e009060bc1
"No Artist Tolerates Reality"
#aiart #ai_art #diffusion #denoising #latent_space #llm #dalle3 #firefly #grok #midjourney #krea #stable_diffusion #art #ai #artificial_intelligence #nft #prompting #prompts #chaos #improv #pinterest #instagram #DeviantArt #x #beeple
-
Как научиться писать хорошие промпты для генерации изображений
В эпоху, когда нейросети способны за считанные секунды превращать слова в яркие, детализированные изображения, умение «разговаривать» с ними становится новым видом творчества. Но, как и в любом диалоге, результат зависит от того, насколько точно и образно вы формулируете свои мысли — составляете промпты. Именно от промпта зависит, будет ли картинка выглядеть как шедевр, достойный арт-галереи, или как случайный эскиз, далекий от вашей задумки. Многие новички начинают с простых описаний вроде «лес в тумане» или «кот на подоконнике» и удивляются, почему результат не совпадает с их ожиданиями. Секрет в том, что генератору нужно дать не только объект, но и атмосферу, стиль, контекст — все, что поможет ему «увидеть» вашу идею так же ясно, как видите ее вы. В этой статье мы разберем, как создавать промпты, которые работают на вас: от понимания логики работы генератора до приемов, позволяющих добиться нужного стиля и настроения. Вы узнаете, как из короткой фразы сделать полноценное художественное задание, и получите инструменты, которые помогут вам превратить любую идею в визуальную историю.
https://habr.com/ru/companies/ggsel/articles/946032/
#генерация_изображений #midjourney #dalle #stable_diffusion #промпты
-
Stable Diffusionで「性的に露骨なコンテンツの生成」が禁止に、Stability AIが利用規約を改定/対象は非営利目的/研究目的/商用目的での利用
https://forest.watch.impress.co.jp/docs/news/2030542.html#forest_watch_impress #Stable_Diffusion #Stability_AI #genai #画像生成 #業界動向
-
Stable Diffusionで「性的に露骨なコンテンツの生成」が禁止に、Stability AIが利用規約を改定/対象は非営利目的/研究目的/商用目的での利用
https://forest.watch.impress.co.jp/docs/news/2030542.html#forest_watch_impress #Stable_Diffusion #Stability_AI #genai #画像生成 #業界動向
-
Топ нейросетей для создания и редактирования фото
С развитием нейросетей обработка и редактирование изображений перешли на новый уровень — больше не требуется проводить большое количество часов за работой в таких программах, как Adobe Photoshop , потому что нейросеть может справиться практически с любым запросом всего за пару минут — будь то ретуширование , удаление фона или шумов с фотографий и многое другое. В данной статье мы рассмотрим наиболее популярные и эффективные нейросети, которые помогут вам создавать и редактировать фото быстро и качественно — без лишних усилий и временных затрат.
https://habr.com/ru/companies/bothub/articles/927000/
#ии #нейросети #midjourney #flux #stable_diffusion #gpt #создание_изображений #редактирование_изображений
-
Seagull (with ears!) short animation just for fun.
Character drawn with little help from #stable_diffusion
#madewithspine #krita -
Seagull (with ears!) short animation just for fun.
Character drawn with little help from #stable_diffusion
#madewithspine #krita -
Seagull (with ears!) short animation just for fun.
Character drawn with little help from #stable_diffusion
#madewithspine #krita -
Seagull (with ears!) short animation just for fun.
Character drawn with little help from #stable_diffusion
#madewithspine #krita -
Невероятный искусственный интеллект Easy Diffusion 3.0
"Разум — самое важное явление во Вселенной; он способен выходить за границы физических законов и трансформировать мир. Человеческий разум позволил нам преодолеть ограничения нашей биологической природы и изменить самих себя." — Рэй Курцвейл. «Эволюция разума». Удивительный мир искусственного интеллекта может нам открыться в полной мере лишь тогда, когда мы с вами cможем увидеть положительные результаты его работы, особенно созданные при нашем непосредственном участии. Эти результаты должны быть понятны и объяснимы каждому человеку, а также они должны быть этичны, непредвзяты и не нарушать закон. На сегодняшний день искусственный интеллект может делать многое, например: написать текст нового стихотворения или даже целого рассказа, воспроизвести его различными голосами знаменитых актеров или музыкантов, проанализировать большое количество числовых данных и составить прогноз на будущее, играть с нами или сразу с тысячью людей в компьютерные игры. Пожалуй, самое впечатляющее, на мой взгляд, то, что может делать искусственный интеллект сегодня – это создавать уникальные и невероятные изображения. Эти изображения могут быть воплощением трехмерного мира фантастического будущего в компьютерной игре или быть виртуальной симуляцией окружающего нас мира. Изображения могут быть трехмерными или двумерными, а также могут быть выполнены в различных стилях живописи знаменитых художников разных периодов времени. Но самое интересное то, что на этих изображениях могут появиться существа или предметы, не существующие в нашем мире.
https://habr.com/ru/articles/916980/
#stable #stable_diffusion #stablediffusion #stable_diffusion_нейросеть #stable_diffuison #stable_diffusion_3 #искусство #искусственный_интеллект #искуственный_интеллект #искусственные_нейронные_сети
-
Невероятный искусственный интеллект Easy Diffusion 3.0
"Разум — самое важное явление во Вселенной; он способен выходить за границы физических законов и трансформировать мир. Человеческий разум позволил нам преодолеть ограничения нашей биологической природы и изменить самих себя." — Рэй Курцвейл. «Эволюция разума». Удивительный мир искусственного интеллекта может нам открыться в полной мере лишь тогда, когда мы с вами cможем увидеть положительные результаты его работы, особенно созданные при нашем непосредственном участии. Эти результаты должны быть понятны и объяснимы каждому человеку, а также они должны быть этичны, непредвзяты и не нарушать закон. На сегодняшний день искусственный интеллект может делать многое, например: написать текст нового стихотворения или даже целого рассказа, воспроизвести его различными голосами знаменитых актеров или музыкантов, проанализировать большое количество числовых данных и составить прогноз на будущее, играть с нами или сразу с тысячью людей в компьютерные игры. Пожалуй, самое впечатляющее, на мой взгляд, то, что может делать искусственный интеллект сегодня – это создавать уникальные и невероятные изображения. Эти изображения могут быть воплощением трехмерного мира фантастического будущего в компьютерной игре или быть виртуальной симуляцией окружающего нас мира. Изображения могут быть трехмерными или двумерными, а также могут быть выполнены в различных стилях живописи знаменитых художников разных периодов времени. Но самое интересное то, что на этих изображениях могут появиться существа или предметы, не существующие в нашем мире.
https://habr.com/ru/articles/916980/
#stable #stable_diffusion #stablediffusion #stable_diffusion_нейросеть #stable_diffuison #stable_diffusion_3 #искусство #искусственный_интеллект #искуственный_интеллект #искусственные_нейронные_сети
-
Невероятный искусственный интеллект Easy Diffusion 3.0
"Разум — самое важное явление во Вселенной; он способен выходить за границы физических законов и трансформировать мир. Человеческий разум позволил нам преодолеть ограничения нашей биологической природы и изменить самих себя." — Рэй Курцвейл. «Эволюция разума». Удивительный мир искусственного интеллекта может нам открыться в полной мере лишь тогда, когда мы с вами cможем увидеть положительные результаты его работы, особенно созданные при нашем непосредственном участии. Эти результаты должны быть понятны и объяснимы каждому человеку, а также они должны быть этичны, непредвзяты и не нарушать закон. На сегодняшний день искусственный интеллект может делать многое, например: написать текст нового стихотворения или даже целого рассказа, воспроизвести его различными голосами знаменитых актеров или музыкантов, проанализировать большое количество числовых данных и составить прогноз на будущее, играть с нами или сразу с тысячью людей в компьютерные игры. Пожалуй, самое впечатляющее, на мой взгляд, то, что может делать искусственный интеллект сегодня – это создавать уникальные и невероятные изображения. Эти изображения могут быть воплощением трехмерного мира фантастического будущего в компьютерной игре или быть виртуальной симуляцией окружающего нас мира. Изображения могут быть трехмерными или двумерными, а также могут быть выполнены в различных стилях живописи знаменитых художников разных периодов времени. Но самое интересное то, что на этих изображениях могут появиться существа или предметы, не существующие в нашем мире.
https://habr.com/ru/articles/916980/
#stable #stable_diffusion #stablediffusion #stable_diffusion_нейросеть #stable_diffuison #stable_diffusion_3 #искусство #искусственный_интеллект #искуственный_интеллект #искусственные_нейронные_сети
-
Невероятный искусственный интеллект Easy Diffusion 3.0
"Разум — самое важное явление во Вселенной; он способен выходить за границы физических законов и трансформировать мир. Человеческий разум позволил нам преодолеть ограничения нашей биологической природы и изменить самих себя." — Рэй Курцвейл. «Эволюция разума». Удивительный мир искусственного интеллекта может нам открыться в полной мере лишь тогда, когда мы с вами cможем увидеть положительные результаты его работы, особенно созданные при нашем непосредственном участии. Эти результаты должны быть понятны и объяснимы каждому человеку, а также они должны быть этичны, непредвзяты и не нарушать закон. На сегодняшний день искусственный интеллект может делать многое, например: написать текст нового стихотворения или даже целого рассказа, воспроизвести его различными голосами знаменитых актеров или музыкантов, проанализировать большое количество числовых данных и составить прогноз на будущее, играть с нами или сразу с тысячью людей в компьютерные игры. Пожалуй, самое впечатляющее, на мой взгляд, то, что может делать искусственный интеллект сегодня – это создавать уникальные и невероятные изображения. Эти изображения могут быть воплощением трехмерного мира фантастического будущего в компьютерной игре или быть виртуальной симуляцией окружающего нас мира. Изображения могут быть трехмерными или двумерными, а также могут быть выполнены в различных стилях живописи знаменитых художников разных периодов времени. Но самое интересное то, что на этих изображениях могут появиться существа или предметы, не существующие в нашем мире.
https://habr.com/ru/articles/916980/
#stable #stable_diffusion #stablediffusion #stable_diffusion_нейросеть #stable_diffuison #stable_diffusion_3 #искусство #искусственный_интеллект #искуственный_интеллект #искусственные_нейронные_сети
-
Генерация видео: Обзор интересных подходов | Text-2-video | Part 1
План следующий: Методы адаптации T2I в T2V : AnimateDiff, Text2Video Zero Обзор классических подходов : Stable Video Diffusion, CogVideo Новые модельки 2025 : Wan2.1, HunyuanVideo, FramePack Это первая часть из списка статей, тут будет только про T2I в T2V
https://habr.com/ru/articles/910326/
#computer_vision #нейросети #ml #video_generation #собеседования #собеседования_задачи #ai #stable_diffusion #comfyui #animatediff
-
Генерация видео: Обзор интересных подходов | Text-2-video | Part 1
План следующий: Методы адаптации T2I в T2V : AnimateDiff, Text2Video Zero Обзор классических подходов : Stable Video Diffusion, CogVideo Новые модельки 2025 : Wan2.1, HunyuanVideo, FramePack Это первая часть из списка статей, тут будет только про T2I в T2V
https://habr.com/ru/articles/910326/
#computer_vision #нейросети #ml #video_generation #собеседования #собеседования_задачи #ai #stable_diffusion #comfyui #animatediff
-
Генерация видео: Обзор интересных подходов | Text-2-video | Part 1
План следующий: Методы адаптации T2I в T2V : AnimateDiff, Text2Video Zero Обзор классических подходов : Stable Video Diffusion, CogVideo Новые модельки 2025 : Wan2.1, HunyuanVideo, FramePack Это первая часть из списка статей, тут будет только про T2I в T2V
https://habr.com/ru/articles/910326/
#computer_vision #нейросети #ml #video_generation #собеседования #собеседования_задачи #ai #stable_diffusion #comfyui #animatediff
-
Генерация видео: Обзор интересных подходов | Text-2-video | Part 1
План следующий: Методы адаптации T2I в T2V : AnimateDiff, Text2Video Zero Обзор классических подходов : Stable Video Diffusion, CogVideo Новые модельки 2025 : Wan2.1, HunyuanVideo, FramePack Это первая часть из списка статей, тут будет только про T2I в T2V
https://habr.com/ru/articles/910326/
#computer_vision #нейросети #ml #video_generation #собеседования #собеседования_задачи #ai #stable_diffusion #comfyui #animatediff
-
Stable Diffusion WebUI Forge: Шаг 10. Текстовая инверсия
Текстовая инверсия (Textual Inversion) – это метод, который позволяет добавлять новые объекты или стили к имеющейся у нас модели. Файлы текстовой инверсии с объектами обычно имеют небольшой размер с расширением .pt или .safetensors. По сути, эти файлы являются дополнительными модулями для Stable Diffusion WebUI Forge и используемой нами модели FLUX.1 (например, flux1-dev-bnb-nf4-v2.safetensors), которые отображаются на закладке Txt2img / Textual Inversion.
https://habr.com/ru/articles/910268/
#stablediffusion #stable_diffusion #stable #stable_diffusion_нейросеть #stable_diffusion_3 #stable_diffusion_35 #stable_diffuison #flux #искусственный_интеллект #искусственные_нейронные_сети
-
Stable Diffusion WebUI Forge: Шаг 10. Текстовая инверсия
Текстовая инверсия (Textual Inversion) – это метод, который позволяет добавлять новые объекты или стили к имеющейся у нас модели. Файлы текстовой инверсии с объектами обычно имеют небольшой размер с расширением .pt или .safetensors. По сути, эти файлы являются дополнительными модулями для Stable Diffusion WebUI Forge и используемой нами модели FLUX.1 (например, flux1-dev-bnb-nf4-v2.safetensors), которые отображаются на закладке Txt2img / Textual Inversion.
https://habr.com/ru/articles/910268/
#stablediffusion #stable_diffusion #stable #stable_diffusion_нейросеть #stable_diffusion_3 #stable_diffusion_35 #stable_diffuison #flux #искусственный_интеллект #искусственные_нейронные_сети
-
Stable Diffusion WebUI Forge: Шаг 10. Текстовая инверсия
Текстовая инверсия (Textual Inversion) – это метод, который позволяет добавлять новые объекты или стили к имеющейся у нас модели. Файлы текстовой инверсии с объектами обычно имеют небольшой размер с расширением .pt или .safetensors. По сути, эти файлы являются дополнительными модулями для Stable Diffusion WebUI Forge и используемой нами модели FLUX.1 (например, flux1-dev-bnb-nf4-v2.safetensors), которые отображаются на закладке Txt2img / Textual Inversion.
https://habr.com/ru/articles/910268/
#stablediffusion #stable_diffusion #stable #stable_diffusion_нейросеть #stable_diffusion_3 #stable_diffusion_35 #stable_diffuison #flux #искусственный_интеллект #искусственные_нейронные_сети
-
Stable Diffusion WebUI Forge: Шаг 10. Текстовая инверсия
Текстовая инверсия (Textual Inversion) – это метод, который позволяет добавлять новые объекты или стили к имеющейся у нас модели. Файлы текстовой инверсии с объектами обычно имеют небольшой размер с расширением .pt или .safetensors. По сути, эти файлы являются дополнительными модулями для Stable Diffusion WebUI Forge и используемой нами модели FLUX.1 (например, flux1-dev-bnb-nf4-v2.safetensors), которые отображаются на закладке Txt2img / Textual Inversion.
https://habr.com/ru/articles/910268/
#stablediffusion #stable_diffusion #stable #stable_diffusion_нейросеть #stable_diffusion_3 #stable_diffusion_35 #stable_diffuison #flux #искусственный_интеллект #искусственные_нейронные_сети
-
Stable Diffusion WebUI Forge: Шаг 9. Модель LoRA
LoRA (Low-Rank Adaptation) – это вспомогательная модель, основное назначение которой заключается в ускорении обработки запросов (prompt) от пользователя и вычислений при генерации тех или иных специальных объектов на изображении. Другими словами, когда мы с вами используем модель FLUХ.1, а нам надо детально прорисовать на нашем изображении руки или фигуру человека, мы используем дополнительно вспомогательную модель LoRA, которая выполняет только одну определенную ей задачу. Также различные модели LoRA используют для усиления стилизации изображений. Например, если нам надо нарисовать персонажа в стиле одного из известных мультфильмов, то существует большое количество соответствующих специальных моделей LoRA. Особенность моделей LoRA заключается в том, что они в несколько раз меньше по объему, чем основные модели, которые мы используем, и поэтому они работают значительно быстрее основных при выполнении специализированных задач.
https://habr.com/ru/articles/908200/
#stablediffusion #stable_diffusion #stable #stable_diffusion_нейросеть #stable_diffusion_3 #stable_diffuison #stable_diffusion_35 #flux #исскуство #исскуственный_интеллект
-
Stable Diffusion WebUI Forge: Шаг 9. Модель LoRA
LoRA (Low-Rank Adaptation) – это вспомогательная модель, основное назначение которой заключается в ускорении обработки запросов (prompt) от пользователя и вычислений при генерации тех или иных специальных объектов на изображении. Другими словами, когда мы с вами используем модель FLUХ.1, а нам надо детально прорисовать на нашем изображении руки или фигуру человека, мы используем дополнительно вспомогательную модель LoRA, которая выполняет только одну определенную ей задачу. Также различные модели LoRA используют для усиления стилизации изображений. Например, если нам надо нарисовать персонажа в стиле одного из известных мультфильмов, то существует большое количество соответствующих специальных моделей LoRA. Особенность моделей LoRA заключается в том, что они в несколько раз меньше по объему, чем основные модели, которые мы используем, и поэтому они работают значительно быстрее основных при выполнении специализированных задач.
https://habr.com/ru/articles/908200/
#stablediffusion #stable_diffusion #stable #stable_diffusion_нейросеть #stable_diffusion_3 #stable_diffuison #stable_diffusion_35 #flux #исскуство #исскуственный_интеллект
-
Stable Diffusion WebUI Forge: Шаг 9. Модель LoRA
LoRA (Low-Rank Adaptation) – это вспомогательная модель, основное назначение которой заключается в ускорении обработки запросов (prompt) от пользователя и вычислений при генерации тех или иных специальных объектов на изображении. Другими словами, когда мы с вами используем модель FLUХ.1, а нам надо детально прорисовать на нашем изображении руки или фигуру человека, мы используем дополнительно вспомогательную модель LoRA, которая выполняет только одну определенную ей задачу. Также различные модели LoRA используют для усиления стилизации изображений. Например, если нам надо нарисовать персонажа в стиле одного из известных мультфильмов, то существует большое количество соответствующих специальных моделей LoRA. Особенность моделей LoRA заключается в том, что они в несколько раз меньше по объему, чем основные модели, которые мы используем, и поэтому они работают значительно быстрее основных при выполнении специализированных задач.
https://habr.com/ru/articles/908200/
#stablediffusion #stable_diffusion #stable #stable_diffusion_нейросеть #stable_diffusion_3 #stable_diffuison #stable_diffusion_35 #flux #исскуство #исскуственный_интеллект
-
Stable Diffusion WebUI Forge: Шаг 9. Модель LoRA
LoRA (Low-Rank Adaptation) – это вспомогательная модель, основное назначение которой заключается в ускорении обработки запросов (prompt) от пользователя и вычислений при генерации тех или иных специальных объектов на изображении. Другими словами, когда мы с вами используем модель FLUХ.1, а нам надо детально прорисовать на нашем изображении руки или фигуру человека, мы используем дополнительно вспомогательную модель LoRA, которая выполняет только одну определенную ей задачу. Также различные модели LoRA используют для усиления стилизации изображений. Например, если нам надо нарисовать персонажа в стиле одного из известных мультфильмов, то существует большое количество соответствующих специальных моделей LoRA. Особенность моделей LoRA заключается в том, что они в несколько раз меньше по объему, чем основные модели, которые мы используем, и поэтому они работают значительно быстрее основных при выполнении специализированных задач.
https://habr.com/ru/articles/908200/
#stablediffusion #stable_diffusion #stable #stable_diffusion_нейросеть #stable_diffusion_3 #stable_diffuison #stable_diffusion_35 #flux #исскуство #исскуственный_интеллект
-
Stable Diffusion WebUI Forge: Шаг 8. Txt2img. Скрытые возможности Hires.fix
Как мы с вами усвоили из прошлого урока, основная задача функции Hires.fix – не увеличение разрешения изображения, а улучшение качества мелких деталей финального изображения без изменения композиции. Важно отметить, Hires.fix работает более эффективно, если с улучшением деталей вы одновременно увеличиваете разрешение изображения. Но у Hires.fix есть и некоторые скрытые возможности, которые могут помочь изменить какую-то важную деталь нашего исходного изображения . Давайте узнаем, как нам это сделать. Для этого: · Переходим на закладку «Settings». · Находим слева в списке раздел «UI alternatives». · Выбираем две опции: «Hires fix: show hires checkpoint and sampler selection (requires Reload UI)» и «Hires fix: show hires prompt and negative prompt (requires Reload UI)». · Применяем настройки. · Перезагружаем интерфейс.
https://habr.com/ru/articles/906512/
#stablediffusion #stable_diffusion #stable_diffusion_нейросеть #stable_diffusion_3 #stable #flux #искусственный_интеллект #искусство #искусственные_нейронные_сети #искуственный_интеллект
-
Stable Diffusion WebUI Forge: Шаг 8. Txt2img. Скрытые возможности Hires.fix
Как мы с вами усвоили из прошлого урока, основная задача функции Hires.fix – не увеличение разрешения изображения, а улучшение качества мелких деталей финального изображения без изменения композиции. Важно отметить, Hires.fix работает более эффективно, если с улучшением деталей вы одновременно увеличиваете разрешение изображения. Но у Hires.fix есть и некоторые скрытые возможности, которые могут помочь изменить какую-то важную деталь нашего исходного изображения . Давайте узнаем, как нам это сделать. Для этого: · Переходим на закладку «Settings». · Находим слева в списке раздел «UI alternatives». · Выбираем две опции: «Hires fix: show hires checkpoint and sampler selection (requires Reload UI)» и «Hires fix: show hires prompt and negative prompt (requires Reload UI)». · Применяем настройки. · Перезагружаем интерфейс.
https://habr.com/ru/articles/906512/
#stablediffusion #stable_diffusion #stable_diffusion_нейросеть #stable_diffusion_3 #stable #flux #искусственный_интеллект #искусство #искусственные_нейронные_сети #искуственный_интеллект
-
Stable Diffusion WebUI Forge: Шаг 8. Txt2img. Скрытые возможности Hires.fix
Как мы с вами усвоили из прошлого урока, основная задача функции Hires.fix – не увеличение разрешения изображения, а улучшение качества мелких деталей финального изображения без изменения композиции. Важно отметить, Hires.fix работает более эффективно, если с улучшением деталей вы одновременно увеличиваете разрешение изображения. Но у Hires.fix есть и некоторые скрытые возможности, которые могут помочь изменить какую-то важную деталь нашего исходного изображения . Давайте узнаем, как нам это сделать. Для этого: · Переходим на закладку «Settings». · Находим слева в списке раздел «UI alternatives». · Выбираем две опции: «Hires fix: show hires checkpoint and sampler selection (requires Reload UI)» и «Hires fix: show hires prompt and negative prompt (requires Reload UI)». · Применяем настройки. · Перезагружаем интерфейс.
https://habr.com/ru/articles/906512/
#stablediffusion #stable_diffusion #stable_diffusion_нейросеть #stable_diffusion_3 #stable #flux #искусственный_интеллект #искусство #искусственные_нейронные_сети #искуственный_интеллект
-
Stable Diffusion WebUI Forge: Шаг 8. Txt2img. Скрытые возможности Hires.fix
Как мы с вами усвоили из прошлого урока, основная задача функции Hires.fix – не увеличение разрешения изображения, а улучшение качества мелких деталей финального изображения без изменения композиции. Важно отметить, Hires.fix работает более эффективно, если с улучшением деталей вы одновременно увеличиваете разрешение изображения. Но у Hires.fix есть и некоторые скрытые возможности, которые могут помочь изменить какую-то важную деталь нашего исходного изображения . Давайте узнаем, как нам это сделать. Для этого: · Переходим на закладку «Settings». · Находим слева в списке раздел «UI alternatives». · Выбираем две опции: «Hires fix: show hires checkpoint and sampler selection (requires Reload UI)» и «Hires fix: show hires prompt and negative prompt (requires Reload UI)». · Применяем настройки. · Перезагружаем интерфейс.
https://habr.com/ru/articles/906512/
#stablediffusion #stable_diffusion #stable_diffusion_нейросеть #stable_diffusion_3 #stable #flux #искусственный_интеллект #искусство #искусственные_нейронные_сети #искуственный_интеллект
-
Stable Diffusion WebUI Forge: Шаг 7. Txt2img. Настройка параметров генерации изображения
На предыдущем уроке мы с вами создали, сохранили и улучшили наше первое изображение из запроса « smiling cyberpunk cat in purple bowler hat with blue cyber eye sitting in cafe drinking coffee, photorealistic, perfect composition, cinematic shot, intricate details, hyper detail, cool color palette, muted colors, very detailed, sharp focus ». При этом мы с вами не рассматривали функциональное назначение и не использовали другие параметры генерации изображения, которые находятся слева на закладке Txt2img/Generation пользовательского интерфейса, как показано на рисунке ниже:
https://habr.com/ru/articles/904292/
#stablediffusion #stable_diffusion #stable #stable_diffusion_нейросеть #stable_diffusion_3 #flux #искусственный_интеллект #искусство #искусственный_интеллект_в_играх
-
Stable Diffusion WebUI Forge: Шаг 7. Txt2img. Настройка параметров генерации изображения
На предыдущем уроке мы с вами создали, сохранили и улучшили наше первое изображение из запроса « smiling cyberpunk cat in purple bowler hat with blue cyber eye sitting in cafe drinking coffee, photorealistic, perfect composition, cinematic shot, intricate details, hyper detail, cool color palette, muted colors, very detailed, sharp focus ». При этом мы с вами не рассматривали функциональное назначение и не использовали другие параметры генерации изображения, которые находятся слева на закладке Txt2img/Generation пользовательского интерфейса, как показано на рисунке ниже:
https://habr.com/ru/articles/904292/
#stablediffusion #stable_diffusion #stable #stable_diffusion_нейросеть #stable_diffusion_3 #flux #искусственный_интеллект #искусство #искусственный_интеллект_в_играх
-
Stable Diffusion WebUI Forge: Шаг 7. Txt2img. Настройка параметров генерации изображения
На предыдущем уроке мы с вами создали, сохранили и улучшили наше первое изображение из запроса « smiling cyberpunk cat in purple bowler hat with blue cyber eye sitting in cafe drinking coffee, photorealistic, perfect composition, cinematic shot, intricate details, hyper detail, cool color palette, muted colors, very detailed, sharp focus ». При этом мы с вами не рассматривали функциональное назначение и не использовали другие параметры генерации изображения, которые находятся слева на закладке Txt2img/Generation пользовательского интерфейса, как показано на рисунке ниже:
https://habr.com/ru/articles/904292/
#stablediffusion #stable_diffusion #stable #stable_diffusion_нейросеть #stable_diffusion_3 #flux #искусственный_интеллект #искусство #искусственный_интеллект_в_играх
-
Stable Diffusion WebUI Forge: Шаг 7. Txt2img. Настройка параметров генерации изображения
На предыдущем уроке мы с вами создали, сохранили и улучшили наше первое изображение из запроса « smiling cyberpunk cat in purple bowler hat with blue cyber eye sitting in cafe drinking coffee, photorealistic, perfect composition, cinematic shot, intricate details, hyper detail, cool color palette, muted colors, very detailed, sharp focus ». При этом мы с вами не рассматривали функциональное назначение и не использовали другие параметры генерации изображения, которые находятся слева на закладке Txt2img/Generation пользовательского интерфейса, как показано на рисунке ниже:
https://habr.com/ru/articles/904292/
#stablediffusion #stable_diffusion #stable #stable_diffusion_нейросеть #stable_diffusion_3 #flux #искусственный_интеллект #искусство #искусственный_интеллект_в_играх