home.social

#обработка_звука — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #обработка_звука, aggregated by home.social.

  1. Как звучит JPEG? Или что будет, если сжать спектрограмму как фотографию

    Бывают дни, когда на работе делать нечего. А бывают дни, когда ты — программист и звукорежиссёр одновременно, и в голову приходит странная мысль: «А что, если взять аудио, превратить его в картинку-спектрограмму, сжать эту картинку как фотографию (JPEG, WebP, AVIF), а потом попробовать восстановить звук обратно? Как оно будет звучать?» Спойлер: иногда — удивительно хорошо. Иногда — как из унитаза. Но всегда — интересно. В этой статье я расскажу, как реализовал весь этот пайплайн, покажу код, проведу батч-тесты разных форматов и уровней качества, и, конечно, дам послушать результаты. Все исходники прилагаются, и вы сможете повторить эксперимент сами.

    habr.com/ru/articles/1034610/

    #python #спектрограмма #обработка_звука #сжатие_изображений #JPEG #WebP #AVIF #GriffinLim #преобразование_Фурье #аудиокодек

  2. Как звучит JPEG? Или что будет, если сжать спектрограмму как фотографию

    Бывают дни, когда на работе делать нечего. А бывают дни, когда ты — программист и звукорежиссёр одновременно, и в голову приходит странная мысль: «А что, если взять аудио, превратить его в картинку-спектрограмму, сжать эту картинку как фотографию (JPEG, WebP, AVIF), а потом попробовать восстановить звук обратно? Как оно будет звучать?» Спойлер: иногда — удивительно хорошо. Иногда — как из унитаза. Но всегда — интересно. В этой статье я расскажу, как реализовал весь этот пайплайн, покажу код, проведу батч-тесты разных форматов и уровней качества, и, конечно, дам послушать результаты. Все исходники прилагаются, и вы сможете повторить эксперимент сами.

    habr.com/ru/articles/1034610/

    #python #спектрограмма #обработка_звука #сжатие_изображений #JPEG #WebP #AVIF #GriffinLim #преобразование_Фурье #аудиокодек

  3. Как звучит JPEG? Или что будет, если сжать спектрограмму как фотографию

    Бывают дни, когда на работе делать нечего. А бывают дни, когда ты — программист и звукорежиссёр одновременно, и в голову приходит странная мысль: «А что, если взять аудио, превратить его в картинку-спектрограмму, сжать эту картинку как фотографию (JPEG, WebP, AVIF), а потом попробовать восстановить звук обратно? Как оно будет звучать?» Спойлер: иногда — удивительно хорошо. Иногда — как из унитаза. Но всегда — интересно. В этой статье я расскажу, как реализовал весь этот пайплайн, покажу код, проведу батч-тесты разных форматов и уровней качества, и, конечно, дам послушать результаты. Все исходники прилагаются, и вы сможете повторить эксперимент сами.

    habr.com/ru/articles/1034610/

    #python #спектрограмма #обработка_звука #сжатие_изображений #JPEG #WebP #AVIF #GriffinLim #преобразование_Фурье #аудиокодек

  4. Как звучит JPEG? Или что будет, если сжать спектрограмму как фотографию

    Бывают дни, когда на работе делать нечего. А бывают дни, когда ты — программист и звукорежиссёр одновременно, и в голову приходит странная мысль: «А что, если взять аудио, превратить его в картинку-спектрограмму, сжать эту картинку как фотографию (JPEG, WebP, AVIF), а потом попробовать восстановить звук обратно? Как оно будет звучать?» Спойлер: иногда — удивительно хорошо. Иногда — как из унитаза. Но всегда — интересно. В этой статье я расскажу, как реализовал весь этот пайплайн, покажу код, проведу батч-тесты разных форматов и уровней качества, и, конечно, дам послушать результаты. Все исходники прилагаются, и вы сможете повторить эксперимент сами.

    habr.com/ru/articles/1034610/

    #python #спектрограмма #обработка_звука #сжатие_изображений #JPEG #WebP #AVIF #GriffinLim #преобразование_Фурье #аудиокодек

  5. Визуальный инспектор аудиографов на Web Audio API: мотивация, архитектура и опыт разработки

    Всем привет! Меня зовут Александр Григоренко, я фронтенд-разработчик и создатель Web Audio Studio — браузерного инструмента для визуализации и исследования аудиографов на Web Audio API. В этой статье я хочу поделиться историей разработки этого проекта, техническими деталями и особо интересными инженерными вызовами, с которыми я столкнулся в процессе его создания. Кроме того, я выскажу свои мысли о Web Audio API, о том, почему этот стандарт недооценен у веб-разработчиков и что с этим можно сделать (спойлер: во многом ему не хватает хорошего инструментария для разработки и отладки).

    habr.com/ru/articles/1007526/

    #web_audio_api #web_audio #sandbox #ide #отладка_javascript #звук #обработка_звука #dsp #digital_sound_processing #daw

  6. Пишем свой voice-to-text на Python: 4 бэкенда и батч-обработка голосовых

    От голосовых на 5 минут к тексту за 30 секунд: инструмент для батч-расшифровки голосовых: от локального Whisper до бесплатного Groq API, с автоопределением форматов и CLI

    habr.com/ru/articles/993650/

    #voicemail #обработка_звука #api #разработка_open_source #машинное_обучение

  7. Оживляем самодельный Big Muff на советских транзисторах

    Привет, Хабр! Знакомый гитарист попросил меня отремонтировать его самоделку — плату эффекта перегруза по мотивам Electro-Harmonix Big Muff Pi , которая однажды перестала работать по неизвестным причинам. Вариантов схемы легендарного Big Muff существует очень много, причём мне повезло: сегодняшний оказался особенно интересным. Также в мои задачи входило установить модуль эффекта в корпус и снабдить его ножным переключателем небуферизованного обхода со светодиодной индикацией. Изучим, отремонтируем и послушаем

    habr.com/ru/companies/ruvds/ar

    #ruvds_статьи #гитаризм #транзистор #электрогитара #обработка_звука #музыкальные_инструменты #гитарные_эффекты #гитарные_примочки #аналоговая_схемотехника #советские_радиодетали

  8. MMAudio: Генерация звука для видео с помощью ИИ

    Всем привет! Исследователи из Университета Иллинойса и Sony AI представили интересный проект MMAudio - нейросеть для создания звукового сопровождения к видео. Меня зовут Илья, я основатель онлайн-нейросети для создания изображений ArtGeneration.me , техноблогер и нейро-евангелист, и сегодня я хочу рассказать об этой технологии подробнее и поделиться нашей портативной версией. Главная особенность системы в том, что она может генерировать звуки не только по текстовому описанию, но и на основе изображения или видео.

    habr.com/ru/articles/872086/

    #озвучка_видео #генерация_звука #нейросеть_для_озвучки #видеомонтаж #обработка_звука #звук #нейросеть #портативная_версия

  9. Вытеснит ли искусственный интеллект людей из мастеринга?

    Процесс мастеринга композиции — это завершающая стадия создания музыки. Труд мастеринг-инженеров оплачивается, отдельная профессия существует уже давно, хотя выполняют они на первый взгляд тривиальный набор задач. Автоматизированный мастеринг существует не первый год, и в последнее время подобные алгоритмы всё чаще пытаются рекламировать как ИИ. Сравнить результаты мастеринга человеком и машиной попытался блогер Бенн Джордан. Музыкант попросил почти полтысячи подписчиков оценить мастер одного и того же трека разными продуктами и людьми. Наивысшие оценки получили работы профессиональных мастеринг-инженеров.

    habr.com/ru/articles/854764/

    #мастеринг #обработка_звука #мастеринг_музыки #история_звукозаписи #Бенн_Джордан #Benn_Jordan #iZotope_Ozone #Invigorate #Matchering_20 #искусственный_интеллект #ИИ

  10. Пишем свой voice-to-text на Python: 4 бэкенда и батч-обработка голосовых

    От голосовых на 5 минут к тексту за 30 секунд: инструмент для батч-расшифровки голосовых: от локального Whisper до бесплатного Groq API, с автоопределением форматов и CLI

    habr.com/ru/articles/993650/

    #voicemail #обработка_звука #api #разработка_open_source #машинное_обучение

  11. Пишем свой voice-to-text на Python: 4 бэкенда и батч-обработка голосовых

    От голосовых на 5 минут к тексту за 30 секунд: инструмент для батч-расшифровки голосовых: от локального Whisper до бесплатного Groq API, с автоопределением форматов и CLI

    habr.com/ru/articles/993650/

    #voicemail #обработка_звука #api #разработка_open_source #машинное_обучение

  12. Пишем свой voice-to-text на Python: 4 бэкенда и батч-обработка голосовых

    От голосовых на 5 минут к тексту за 30 секунд: инструмент для батч-расшифровки голосовых: от локального Whisper до бесплатного Groq API, с автоопределением форматов и CLI

    habr.com/ru/articles/993650/

    #voicemail #обработка_звука #api #разработка_open_source #машинное_обучение