#вирартек — Public Fediverse posts
Live and recent posts from across the Fediverse tagged #вирартек, aggregated by home.social.
-
Suno 5.5: почти ваш голос и мелодия
Вопрос генерации со своим голосом занимал меня с v3.5. Другая интересная тема — аранжировка. Если не в обычном виде (на входе стиль и аккорды, на выходе “минус”), то способом обновления, “раскраски” черновика (mp3 из GM MIDI, Audio Upload, режим Cover). За пару лет я сделал много тестов, результаты представлял на Хабре, своём сайте, в Телеграм-канале. Последнее обновление Suno — повод снова вернуться к этим вопросам. Свой голос Как только версия 5.5 стала доступна, приступил к тестам опции “Your Voice” 1) , опираясь на опыт с Suno v3.5 и RVC. Собрал 11 DS (голосовых наборов) на своём материале. Задача — проверить, как реагирует система на разный исходный материал, стили и параметры генерации. 1) Ссылка на процедуру “Your Voice” (PDF на русском) из раздела Help на сайте Suno . Уже не раз касался понятий тембр и манера с психоакустической точки зрения. Нынче повод вернуться к теме: можно говорить похоже или нет, но чтобы контролировать, надо понимать механику. Для синтеза вокала Suno (или другому ИИ) нужно обеспечить 3 компонента: Тембр , или «окраска» звука, зависит от “геометрии” голосового аппарата: трахея, гортань, связки, резонаторы.(Певцы, артисты могут в определённой степени его менять. У родственников голоса часто похожи — физиология). Интонация — изменения высоты (мелодия) + нюансы: вибрато, опевания, “подъезды” (Pitch curve). Артикуляция — работа языка, нёба, челюсти, губ, обеспечивающая произнесение/ пропевание слов. Именно разделение на 3 компонента придаёт гибкость системе: берём модель тембра, добавляем интонирование в нужной манере и соответствующую языку артикуляцию. Хотите на хинди? Пожалуйста!
https://habr.com/ru/articles/1022596/
#генерация_музыки #синтез_речи #аранжировка_музыки #вирартек #suno_ai
-
Почему музыка ИИ человеческая и новая без нового?
Революция свершилась: для большинства музыка, созданная ИИ, уже неотличима от "живой". ИИ-артисты подписывают контракты, NARAS (организаторы "Грэмми") не против использования ИИ, а лидеры рынка — Suno/Udio — играют по правилам больших дядей. Наверное, можно закончить споры, но нет: одни настаивают на "отсутствии души", другие — на ложном векторе развития музыкального ИИ. Мне кажется, есть способ прояснить ситуацию, обратившись к самой природе музыки.
https://habr.com/ru/articles/992040/
#генерация_музыки #синтез_речи #аранжировка_музыки #вирартек #suno_ai
-
Suno, Cover: «На свободу с чистой...»
Как обычно, не претендую на полноту освещения вопроса, но надеюсь, что информация будет полезной. Кажется, критическую точку внедрения музыкального ИИ в жизнь мы уже прошли: за пару дней, похоже, создается музыки больше, чем 10 лет назад за год. Ведущие музыкальные ИИ-сервисы уверенно обрастают функционалом DAW, а DAW включают все больше инструментов ИИ. Музыканты уже не всегда отличают генерации от живого (впрочем, и до ИИ в музыке с каждым днем живого становилось все меньше). Профессионалы, хоть и с упреками, приняли и применяют разделение (Split) и работу со стемами. Аранжировщики не гнушаются заимствовать идеи у ИИ. Вслед за детекторами ИИ появились сервисы "гуманизации" и "отмывки прав". Даже наши знаменитости, как и западные артисты, если на словах в большинстве еще и остаются приверженцами "настоящего", то в жизни ищут способы использования ИИ — бизнес! В области финансов и права три группы крупных игроков: обладатели прав, стриминговые сервисы (и др. продажники) и представители генеративного ИИ. Все ИИ-сервисы используют известную музыку для обучения: одни по лицензии, другие — без спроса. Да, это главная претензия (зацепка), но причина, как всегда, в том, что кто-то теряет доходы. Какая разница, на чем учился ИИ? Тут лукавство изначально : мелодию ведь ИИ не повторяет! Вот как было и есть с людьми: "А" заявляет, что "Б" украл у него мелодию. Суд, знатные эксперты (композитор, музыковед, звукорежиссер), материальные доказательства (партитуры, диски, флешки в конвертах с почтовыми печатями, свидетельства регистрации, проекты DAW с ПК и т.п.), проверяют сходство мелодий у "А" и "Б", смотрят на даты — кто раньше сочинил — отсюда решение.
https://habr.com/ru/articles/948128/
#генерация_музыки #синтез_речи #аранжировка_музыки #вирартек #suno_ai
-
Suno: "… если бы я так мог, ..."
Mark Shiloh , Влад - наш бывший соотечественник, более 20 лет живущий в Новой Зеландии (Окленд ), профессиональный музыкант, мульти-инструменталист с большим практическим опытом, ныне преподаватель и директор музыкальной школы... Более 30 лет назад мы вместе работали в Новосибирской консерватории. Когда в моей команде разрабатывали программу морфинга параметров синтеза для Yamaha DX7, Влад приобрел редкий и крутой SY99. Этот одаренный и энергичный парень поражал меня тем, что до мельчайших деталей штудировал толстенную инструкцию SY99 и задавал такие вопросы, которых я никогда больше не слышал ни от одного музыканта. Я бы сказал, что он, благодаря своему пытливому характеру, к профессии музыканта добавил квалификацию sound-инженера... Сейчас мы в контакте и я, как и другим знакомым, периодически посылаю ему примеры, которые сгенерил в Suno... Две песни Влада "зацепили". У меня, честно говоря, отношение к генерациям более спокойное, особенно, когда их 50 в неделю и больше... Вот, пишет: "Сколько стоят эти твои песни?" ( Странная девушка v2.1 и Бледно-розовый оттенок v2.1 ). Я ему: "У меня нет на них прав, т.к. аккаунт Free" ... Потом, раз в неделю он писал/говорил о каких-то фишках во 2-й: "Посмотри, как здесь пропето ..., а вот здесь гитара" и т.п. Ну, на самом деле, мне не до этих нюансов - слишком много текущей работы... и я предложил ему записать наш разговор - получится что-то вроде интервью 1,2 , наверное, кому-то будет интересно. Он сказал "окей" и мы созвонились 14 октября 2024 г.
-
Suno, как аранжировщик etc
Доброго времени всем пользователям Suno и тем, кто интересуется технологиями ИИ в музыке. Как и ранее не претендую на полноту освещения вопроса, но надеюсь, что информация будет полезной Под аранжировкой обычно понимают создание инструментального трека (минусовки, backing track) на основе мелодии или мелодии + гармонии, с определенным стилем, темпом, формой/структурой. Suno генерирует песни (и инструментал) целиком с задаваемыми (относительно) стилем и формой. Показалось интересным протестировать систему на возможность создания нужной аранжировки. Особенно после своих экспериментов с Audio Input (см. статью ), когда эта функция Suno стала очевидной. Да и читатели обращались с подобным вопросом. Так я затеял серию экспериментов, результаты которых представил в пяти тестах. (Все звуковые примеры и детали у меня на сайте ). За последние пару месяцев я сделал более 80 DS (dataset, исходников), как с вокалом, так и инструментальных. Причем, чаще это была не просто отрезка фрагмента до 60 сек. из готового трека, а его препарация или сборка фрагмента c нужным содержанием (вокал, аккорды, Hi-Hat Loop и т.п.). Тест #1 / от спетой мелодии, текста... ("По-Гру-Гла-Но ...") *. Отталкиваясь от удачного опыта с генерацией аранжировок в разных стилях на а капеллу Воробей я решил провести более детальный эксперимент: на входе спетая мелодия + текст (Lyrics) и задание Style. Классно же спеть свою мелодию, скормить Suno и получить готовую песню в нужном стиле... Написал простую мелодию, сочинил шуточный текст, включающий Bridge, Verse и Chorus и пропел все это на простую гармонию. Сначала в темпе 90 bpm - тогда пришлось сделать 2 разных DS: Bridge+Verse и Bridge+Chorus, иначе нельзя было уложиться в ограничение в 60 сек. Затем - в темпе 102 bpm: Bridge+Chorus, здесь Bridge уже не пропевался.
https://habr.com/ru/articles/850156/
#генерация_музыки #синтез_речи #аранжировка_музыки #вирартек #suno_ai
-
Suno prompt (стиль) = рыбалка. Альтернатива?
Как всегда, не претендую на полноту и надеюсь, что кому-то поможет. ( Предыдущие мои статьи о Suno 1 , 2 .) Да, важная, непростая и "больная тема". Многие жаловались на непредсказуемость генерации, о сложности получить то, что хочется. Еще в первой статье о Suno я пытался разобраться как работает система, дать определение стиля в музыке, понять как составлять Promt - набор ключевых параметров генерации... Прошло 3,5 мес., 9 июля Suno support поздравил с преодолением порога в 500 генераций ... стала ли мне понятнее система? До ИИ систем все было проще - почти на всех устройствах значения параметров определяли результат. И, естественно, мы ожидали аналогичного или даже большего "понимания" от ИИ сервисов - там же "интеллект". Для преодоления эффекта новизны и принятия этого свойства ИИ алгоритмов, мне кажется, полезно потренироваться в создании картинок по тексту. Вот, пишу, по шагам подбираю prompt (лучше на английском):
-
Suno поёт моим голосом? Ну, … да
Доброго дня/вечера! Статья по использованию в Suno опции Audio Input (в продолжение предыдущей статьи о Suno). Кратко . Вы загружаете короткий (6-60 сек) фрагмент аудио, задаете Стиль, текст (если песня) или нет (если Instrumental), а Suno его "дописывает", доигрывает. С опцией "Get Whole Song", как и ранее, можно объединить исходное и новое в одну композицию. Суть (как я понимаю) в том, что алгоритм пытается распознать закономерности в загруженном фрагменте, я бы даже сказал "музыкальное содержание" не в эмоциональном человеческом понимании - грустно, весело, трагично и т.п., а в формальном смысле - какая ритмическая структура, какая гармоническая последовательность, где мелодические линии, какие штрихи, тембры, какая форма. Хотя это тоже "человеческое", робот, скорее, ищет закономерности в графическом (спектральном) представлении всего этого. В итоге это берется за основу, чтобы продолжить "рисовать". Кажется есть одна близкая аналогия: если вам дадут обрывок картинки и попросят дорисовать, что получится? Чем больший фрагмент вам выдан, тем меньше будет ошибок, "произвола" в дорисовке. Также и Suno. Я пробовал и 6 сек., и 60. В первом случае было мало чего "повторять", а при максимальной длине у системы есть что анализировать - по хорошему, в 1 минуту можно вложить короткий инструментальный проигрыш, куплет и припев - т.е. почти весь значимый материал песни. Важный момент : чужие фрагменты подгружать нельзя (т.е. те, на которые у вас нет прав) - появляется Pop-Up окошко. А как хочется "скормить" 60 сек. что-то вроде "Stairway To Heaven" / Led Zeppelin - и "доиграть" уже со своими словами!