#обработка_звука — Public Fediverse posts
Live and recent posts from across the Fediverse tagged #обработка_звука, aggregated by home.social.
-
Как звучит JPEG? Или что будет, если сжать спектрограмму как фотографию
Бывают дни, когда на работе делать нечего. А бывают дни, когда ты — программист и звукорежиссёр одновременно, и в голову приходит странная мысль: «А что, если взять аудио, превратить его в картинку-спектрограмму, сжать эту картинку как фотографию (JPEG, WebP, AVIF), а потом попробовать восстановить звук обратно? Как оно будет звучать?» Спойлер: иногда — удивительно хорошо. Иногда — как из унитаза. Но всегда — интересно. В этой статье я расскажу, как реализовал весь этот пайплайн, покажу код, проведу батч-тесты разных форматов и уровней качества, и, конечно, дам послушать результаты. Все исходники прилагаются, и вы сможете повторить эксперимент сами.
https://habr.com/ru/articles/1034610/
#python #спектрограмма #обработка_звука #сжатие_изображений #JPEG #WebP #AVIF #GriffinLim #преобразование_Фурье #аудиокодек
-
Как звучит JPEG? Или что будет, если сжать спектрограмму как фотографию
Бывают дни, когда на работе делать нечего. А бывают дни, когда ты — программист и звукорежиссёр одновременно, и в голову приходит странная мысль: «А что, если взять аудио, превратить его в картинку-спектрограмму, сжать эту картинку как фотографию (JPEG, WebP, AVIF), а потом попробовать восстановить звук обратно? Как оно будет звучать?» Спойлер: иногда — удивительно хорошо. Иногда — как из унитаза. Но всегда — интересно. В этой статье я расскажу, как реализовал весь этот пайплайн, покажу код, проведу батч-тесты разных форматов и уровней качества, и, конечно, дам послушать результаты. Все исходники прилагаются, и вы сможете повторить эксперимент сами.
https://habr.com/ru/articles/1034610/
#python #спектрограмма #обработка_звука #сжатие_изображений #JPEG #WebP #AVIF #GriffinLim #преобразование_Фурье #аудиокодек
-
Как звучит JPEG? Или что будет, если сжать спектрограмму как фотографию
Бывают дни, когда на работе делать нечего. А бывают дни, когда ты — программист и звукорежиссёр одновременно, и в голову приходит странная мысль: «А что, если взять аудио, превратить его в картинку-спектрограмму, сжать эту картинку как фотографию (JPEG, WebP, AVIF), а потом попробовать восстановить звук обратно? Как оно будет звучать?» Спойлер: иногда — удивительно хорошо. Иногда — как из унитаза. Но всегда — интересно. В этой статье я расскажу, как реализовал весь этот пайплайн, покажу код, проведу батч-тесты разных форматов и уровней качества, и, конечно, дам послушать результаты. Все исходники прилагаются, и вы сможете повторить эксперимент сами.
https://habr.com/ru/articles/1034610/
#python #спектрограмма #обработка_звука #сжатие_изображений #JPEG #WebP #AVIF #GriffinLim #преобразование_Фурье #аудиокодек
-
Как звучит JPEG? Или что будет, если сжать спектрограмму как фотографию
Бывают дни, когда на работе делать нечего. А бывают дни, когда ты — программист и звукорежиссёр одновременно, и в голову приходит странная мысль: «А что, если взять аудио, превратить его в картинку-спектрограмму, сжать эту картинку как фотографию (JPEG, WebP, AVIF), а потом попробовать восстановить звук обратно? Как оно будет звучать?» Спойлер: иногда — удивительно хорошо. Иногда — как из унитаза. Но всегда — интересно. В этой статье я расскажу, как реализовал весь этот пайплайн, покажу код, проведу батч-тесты разных форматов и уровней качества, и, конечно, дам послушать результаты. Все исходники прилагаются, и вы сможете повторить эксперимент сами.
https://habr.com/ru/articles/1034610/
#python #спектрограмма #обработка_звука #сжатие_изображений #JPEG #WebP #AVIF #GriffinLim #преобразование_Фурье #аудиокодек
-
Визуальный инспектор аудиографов на Web Audio API: мотивация, архитектура и опыт разработки
Всем привет! Меня зовут Александр Григоренко, я фронтенд-разработчик и создатель Web Audio Studio — браузерного инструмента для визуализации и исследования аудиографов на Web Audio API. В этой статье я хочу поделиться историей разработки этого проекта, техническими деталями и особо интересными инженерными вызовами, с которыми я столкнулся в процессе его создания. Кроме того, я выскажу свои мысли о Web Audio API, о том, почему этот стандарт недооценен у веб-разработчиков и что с этим можно сделать (спойлер: во многом ему не хватает хорошего инструментария для разработки и отладки).
https://habr.com/ru/articles/1007526/
#web_audio_api #web_audio #sandbox #ide #отладка_javascript #звук #обработка_звука #dsp #digital_sound_processing #daw
-
Пишем свой voice-to-text на Python: 4 бэкенда и батч-обработка голосовых
От голосовых на 5 минут к тексту за 30 секунд: инструмент для батч-расшифровки голосовых: от локального Whisper до бесплатного Groq API, с автоопределением форматов и CLI
https://habr.com/ru/articles/993650/
#voicemail #обработка_звука #api #разработка_open_source #машинное_обучение
-
Оживляем самодельный Big Muff на советских транзисторах
Привет, Хабр! Знакомый гитарист попросил меня отремонтировать его самоделку — плату эффекта перегруза по мотивам Electro-Harmonix Big Muff Pi , которая однажды перестала работать по неизвестным причинам. Вариантов схемы легендарного Big Muff существует очень много, причём мне повезло: сегодняшний оказался особенно интересным. Также в мои задачи входило установить модуль эффекта в корпус и снабдить его ножным переключателем небуферизованного обхода со светодиодной индикацией. Изучим, отремонтируем и послушаем
https://habr.com/ru/companies/ruvds/articles/883770/
#ruvds_статьи #гитаризм #транзистор #электрогитара #обработка_звука #музыкальные_инструменты #гитарные_эффекты #гитарные_примочки #аналоговая_схемотехника #советские_радиодетали
-
MMAudio: Генерация звука для видео с помощью ИИ
Всем привет! Исследователи из Университета Иллинойса и Sony AI представили интересный проект MMAudio - нейросеть для создания звукового сопровождения к видео. Меня зовут Илья, я основатель онлайн-нейросети для создания изображений ArtGeneration.me , техноблогер и нейро-евангелист, и сегодня я хочу рассказать об этой технологии подробнее и поделиться нашей портативной версией. Главная особенность системы в том, что она может генерировать звуки не только по текстовому описанию, но и на основе изображения или видео.
https://habr.com/ru/articles/872086/
#озвучка_видео #генерация_звука #нейросеть_для_озвучки #видеомонтаж #обработка_звука #звук #нейросеть #портативная_версия
-
Вытеснит ли искусственный интеллект людей из мастеринга?
Процесс мастеринга композиции — это завершающая стадия создания музыки. Труд мастеринг-инженеров оплачивается, отдельная профессия существует уже давно, хотя выполняют они на первый взгляд тривиальный набор задач. Автоматизированный мастеринг существует не первый год, и в последнее время подобные алгоритмы всё чаще пытаются рекламировать как ИИ. Сравнить результаты мастеринга человеком и машиной попытался блогер Бенн Джордан. Музыкант попросил почти полтысячи подписчиков оценить мастер одного и того же трека разными продуктами и людьми. Наивысшие оценки получили работы профессиональных мастеринг-инженеров.
https://habr.com/ru/articles/854764/
#мастеринг #обработка_звука #мастеринг_музыки #история_звукозаписи #Бенн_Джордан #Benn_Jordan #iZotope_Ozone #Invigorate #Matchering_20 #искусственный_интеллект #ИИ
-
Пишем свой voice-to-text на Python: 4 бэкенда и батч-обработка голосовых
От голосовых на 5 минут к тексту за 30 секунд: инструмент для батч-расшифровки голосовых: от локального Whisper до бесплатного Groq API, с автоопределением форматов и CLI
https://habr.com/ru/articles/993650/
#voicemail #обработка_звука #api #разработка_open_source #машинное_обучение
-
Пишем свой voice-to-text на Python: 4 бэкенда и батч-обработка голосовых
От голосовых на 5 минут к тексту за 30 секунд: инструмент для батч-расшифровки голосовых: от локального Whisper до бесплатного Groq API, с автоопределением форматов и CLI
https://habr.com/ru/articles/993650/
#voicemail #обработка_звука #api #разработка_open_source #машинное_обучение
-
Пишем свой voice-to-text на Python: 4 бэкенда и батч-обработка голосовых
От голосовых на 5 минут к тексту за 30 секунд: инструмент для батч-расшифровки голосовых: от локального Whisper до бесплатного Groq API, с автоопределением форматов и CLI
https://habr.com/ru/articles/993650/
#voicemail #обработка_звука #api #разработка_open_source #машинное_обучение