home.social

#сжатие_изображений — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #сжатие_изображений, aggregated by home.social.

  1. Как звучит JPEG? Или что будет, если сжать спектрограмму как фотографию

    Бывают дни, когда на работе делать нечего. А бывают дни, когда ты — программист и звукорежиссёр одновременно, и в голову приходит странная мысль: «А что, если взять аудио, превратить его в картинку-спектрограмму, сжать эту картинку как фотографию (JPEG, WebP, AVIF), а потом попробовать восстановить звук обратно? Как оно будет звучать?» Спойлер: иногда — удивительно хорошо. Иногда — как из унитаза. Но всегда — интересно. В этой статье я расскажу, как реализовал весь этот пайплайн, покажу код, проведу батч-тесты разных форматов и уровней качества, и, конечно, дам послушать результаты. Все исходники прилагаются, и вы сможете повторить эксперимент сами.

    habr.com/ru/articles/1034610/

    #python #спектрограмма #обработка_звука #сжатие_изображений #JPEG #WebP #AVIF #GriffinLim #преобразование_Фурье #аудиокодек

  2. Как звучит JPEG? Или что будет, если сжать спектрограмму как фотографию

    Бывают дни, когда на работе делать нечего. А бывают дни, когда ты — программист и звукорежиссёр одновременно, и в голову приходит странная мысль: «А что, если взять аудио, превратить его в картинку-спектрограмму, сжать эту картинку как фотографию (JPEG, WebP, AVIF), а потом попробовать восстановить звук обратно? Как оно будет звучать?» Спойлер: иногда — удивительно хорошо. Иногда — как из унитаза. Но всегда — интересно. В этой статье я расскажу, как реализовал весь этот пайплайн, покажу код, проведу батч-тесты разных форматов и уровней качества, и, конечно, дам послушать результаты. Все исходники прилагаются, и вы сможете повторить эксперимент сами.

    habr.com/ru/articles/1034610/

    #python #спектрограмма #обработка_звука #сжатие_изображений #JPEG #WebP #AVIF #GriffinLim #преобразование_Фурье #аудиокодек

  3. Как звучит JPEG? Или что будет, если сжать спектрограмму как фотографию

    Бывают дни, когда на работе делать нечего. А бывают дни, когда ты — программист и звукорежиссёр одновременно, и в голову приходит странная мысль: «А что, если взять аудио, превратить его в картинку-спектрограмму, сжать эту картинку как фотографию (JPEG, WebP, AVIF), а потом попробовать восстановить звук обратно? Как оно будет звучать?» Спойлер: иногда — удивительно хорошо. Иногда — как из унитаза. Но всегда — интересно. В этой статье я расскажу, как реализовал весь этот пайплайн, покажу код, проведу батч-тесты разных форматов и уровней качества, и, конечно, дам послушать результаты. Все исходники прилагаются, и вы сможете повторить эксперимент сами.

    habr.com/ru/articles/1034610/

    #python #спектрограмма #обработка_звука #сжатие_изображений #JPEG #WebP #AVIF #GriffinLim #преобразование_Фурье #аудиокодек

  4. Как звучит JPEG? Или что будет, если сжать спектрограмму как фотографию

    Бывают дни, когда на работе делать нечего. А бывают дни, когда ты — программист и звукорежиссёр одновременно, и в голову приходит странная мысль: «А что, если взять аудио, превратить его в картинку-спектрограмму, сжать эту картинку как фотографию (JPEG, WebP, AVIF), а потом попробовать восстановить звук обратно? Как оно будет звучать?» Спойлер: иногда — удивительно хорошо. Иногда — как из унитаза. Но всегда — интересно. В этой статье я расскажу, как реализовал весь этот пайплайн, покажу код, проведу батч-тесты разных форматов и уровней качества, и, конечно, дам послушать результаты. Все исходники прилагаются, и вы сможете повторить эксперимент сами.

    habr.com/ru/articles/1034610/

    #python #спектрограмма #обработка_звука #сжатие_изображений #JPEG #WebP #AVIF #GriffinLim #преобразование_Фурье #аудиокодек

  5. В каждом JPEG зашита модель вашей сетчатки. Буквально

    После того как я написал статью про то, что ваш монитор не умеет показывать бирюзовый и 65% видимых цветов для него просто не существуют, один мой знакомый (далекий правда от технической отрасли) спросил: «Окей, монитор врёт, а что тогда делает JPEG с оставшимися 35%?» И это хороший вопрос. Я полез в спеку, а через полчаса забыл, зачем вообще полез. Потому меня уже интересовало другое: ребята, которые в 1992-м финализировали этот стандарт, по сути заревёрсили человеческое зрение и запихнули его в алгоритм сжатия. И я хочу вам про это рассказать, потому что это самый красивый кусок инженерии, который я видел. В той статье я разбирал, как мало мы на самом деле видим. Здесь — как мало нам на самом деле нужно видеть, чтобы мозг поверил, что видит всё. А потом я решил это проверить руками.

    habr.com/ru/articles/1013668/

    #jpeg #сжатие_изображений #алгоритмы #обработка_изображений #зрение #ycbcr #цветовые_пространства #dct #python #оптимизация

  6. В каждом JPEG зашита модель вашей сетчатки. Буквально

    После того как я написал статью про то, что ваш монитор не умеет показывать бирюзовый и 65% видимых цветов для него просто не существуют, один мой знакомый (далекий правда от технической отрасли) спросил: «Окей, монитор врёт, а что тогда делает JPEG с оставшимися 35%?» И это хороший вопрос. Я полез в спеку, а через полчаса забыл, зачем вообще полез. Потому меня уже интересовало другое: ребята, которые в 1992-м финализировали этот стандарт, по сути заревёрсили человеческое зрение и запихнули его в алгоритм сжатия. И я хочу вам про это рассказать, потому что это самый красивый кусок инженерии, который я видел. В той статье я разбирал, как мало мы на самом деле видим. Здесь — как мало нам на самом деле нужно видеть, чтобы мозг поверил, что видит всё. А потом я решил это проверить руками.

    habr.com/ru/articles/1013668/

    #jpeg #сжатие_изображений #алгоритмы #обработка_изображений #зрение #ycbcr #цветовые_пространства #dct #python #оптимизация

  7. В каждом JPEG зашита модель вашей сетчатки. Буквально

    После того как я написал статью про то, что ваш монитор не умеет показывать бирюзовый и 65% видимых цветов для него просто не существуют, один мой знакомый (далекий правда от технической отрасли) спросил: «Окей, монитор врёт, а что тогда делает JPEG с оставшимися 35%?» И это хороший вопрос. Я полез в спеку, а через полчаса забыл, зачем вообще полез. Потому меня уже интересовало другое: ребята, которые в 1992-м финализировали этот стандарт, по сути заревёрсили человеческое зрение и запихнули его в алгоритм сжатия. И я хочу вам про это рассказать, потому что это самый красивый кусок инженерии, который я видел. В той статье я разбирал, как мало мы на самом деле видим. Здесь — как мало нам на самом деле нужно видеть, чтобы мозг поверил, что видит всё. А потом я решил это проверить руками.

    habr.com/ru/articles/1013668/

    #jpeg #сжатие_изображений #алгоритмы #обработка_изображений #зрение #ycbcr #цветовые_пространства #dct #python #оптимизация

  8. В каждом JPEG зашита модель вашей сетчатки. Буквально

    После того как я написал статью про то, что ваш монитор не умеет показывать бирюзовый и 65% видимых цветов для него просто не существуют, один мой знакомый (далекий правда от технической отрасли) спросил: «Окей, монитор врёт, а что тогда делает JPEG с оставшимися 35%?» И это хороший вопрос. Я полез в спеку, а через полчаса забыл, зачем вообще полез. Потому меня уже интересовало другое: ребята, которые в 1992-м финализировали этот стандарт, по сути заревёрсили человеческое зрение и запихнули его в алгоритм сжатия. И я хочу вам про это рассказать, потому что это самый красивый кусок инженерии, который я видел. В той статье я разбирал, как мало мы на самом деле видим. Здесь — как мало нам на самом деле нужно видеть, чтобы мозг поверил, что видит всё. А потом я решил это проверить руками.

    habr.com/ru/articles/1013668/

    #jpeg #сжатие_изображений #алгоритмы #обработка_изображений #зрение #ycbcr #цветовые_пространства #dct #python #оптимизация

  9. K-VAE токенизатор от Сбера

    В Сбере, в Управлении базовых моделей Kandinsky были разработаны токенизаторы KVAE как для изображений, так и для видео, превосходящие state-of-the-art аналоги как по объективным метрикам (PSNR), так и по качеству генерации. Прямое назначение этих моделей: декодирование и формирование латентного пространства для диффузионных моделей, к которым относится Flux, Wan, StableDiffusion и другие. Качество генераций этих моделей напрямую зависит от выбранного токенизатора. В посте приведены подробности разработанного решения, которое будет полноценно представлено в рамках AIJourney 2025.

    habr.com/ru/companies/sberbank

    #vae #diffusion #генеративные_модели #сжатие_изображений #сжатие_видео

  10. Сжатие графики при помощи алгоритма LZ4

    Привет, Хабр! Меня зовут Александр Крестинин, я разработчик встроенного ПО в компании Whoosh. Мы в embedded-команде не только переливаем биты из одного регистра в другой, но и решаем разные бизнес-задачи. Иногда попадаются головоломки. Однажды мы подумали, что было бы здорово выводить на экраны самокатов анимации и изображения — показывать инструкции, как пользоваться сервисом, как начать и закончить поездку, и чтобы запускать DOOM. Зачем? 1) Сделать комфортнее. Удобно видеть инструкции на большом и ярком экране перед глазами, а не нырять за ними в приложение на смартфоне. 2) Сделать безопаснее. Пользователь меньше отвлекается на телефон, крепче держится за самокат и внимательнее смотрит на всё, что вокруг. 3) Почти у всех привычных устройств уже есть экраны, которые выводят пользователям видео и картинки, а почему бы не сделать то же самое на самокате? Но тут возникает проблема. Микроконтроллер крайне ограничен в памяти и вычислительных ресурсах. Самая простая анимация занимает чрезмерно много места. А если внедрить в отрисовку алгоритмы сжатия, то вычислительная нагрузка увеличится и анимация будет сильно лагать. Расскажу, как мы нашли решение этой задачи. Прошу под кат.

    habr.com/ru/companies/whoosh/a

    #микроконтроллеры #микроконтроллер #whoosh #lz4 #графика #изображения #анимации #сжатие_изображений #сжатие_данных #дисплей

  11. Сжатие графики при помощи алгоритма LZ4

    Привет, Хабр! Меня зовут Александр Крестинин, я разработчик встроенного ПО в компании Whoosh. Мы в embedded-команде не только переливаем биты из одного регистра в другой, но и решаем разные бизнес-задачи. Иногда попадаются головоломки. Однажды мы подумали, что было бы здорово выводить на экраны самокатов анимации и изображения — показывать инструкции, как пользоваться сервисом, как начать и закончить поездку, и чтобы запускать DOOM. Зачем? 1) Сделать комфортнее. Удобно видеть инструкции на большом и ярком экране перед глазами, а не нырять за ними в приложение на смартфоне. 2) Сделать безопаснее. Пользователь меньше отвлекается на телефон, крепче держится за самокат и внимательнее смотрит на всё, что вокруг. 3) Почти у всех привычных устройств уже есть экраны, которые выводят пользователям видео и картинки, а почему бы не сделать то же самое на самокате? Но тут возникает проблема. Микроконтроллер крайне ограничен в памяти и вычислительных ресурсах. Самая простая анимация занимает чрезмерно много места. А если внедрить в отрисовку алгоритмы сжатия, то вычислительная нагрузка увеличится и анимация будет сильно лагать. Расскажу, как мы нашли решение этой задачи. Прошу под кат.

    habr.com/ru/companies/whoosh/a

    #микроконтроллеры #микроконтроллер #whoosh #lz4 #графика #изображения #анимации #сжатие_изображений #сжатие_данных #дисплей

  12. Сжатие графики при помощи алгоритма LZ4

    Привет, Хабр! Меня зовут Александр Крестинин, я разработчик встроенного ПО в компании Whoosh. Мы в embedded-команде не только переливаем биты из одного регистра в другой, но и решаем разные бизнес-задачи. Иногда попадаются головоломки. Однажды мы подумали, что было бы здорово выводить на экраны самокатов анимации и изображения — показывать инструкции, как пользоваться сервисом, как начать и закончить поездку, и чтобы запускать DOOM. Зачем? 1) Сделать комфортнее. Удобно видеть инструкции на большом и ярком экране перед глазами, а не нырять за ними в приложение на смартфоне. 2) Сделать безопаснее. Пользователь меньше отвлекается на телефон, крепче держится за самокат и внимательнее смотрит на всё, что вокруг. 3) Почти у всех привычных устройств уже есть экраны, которые выводят пользователям видео и картинки, а почему бы не сделать то же самое на самокате? Но тут возникает проблема. Микроконтроллер крайне ограничен в памяти и вычислительных ресурсах. Самая простая анимация занимает чрезмерно много места. А если внедрить в отрисовку алгоритмы сжатия, то вычислительная нагрузка увеличится и анимация будет сильно лагать. Расскажу, как мы нашли решение этой задачи. Прошу под кат.

    habr.com/ru/companies/whoosh/a

    #микроконтроллеры #микроконтроллер #whoosh #lz4 #графика #изображения #анимации #сжатие_изображений #сжатие_данных #дисплей

  13. Сжатие графики при помощи алгоритма LZ4

    Привет, Хабр! Меня зовут Александр Крестинин, я разработчик встроенного ПО в компании Whoosh. Мы в embedded-команде не только переливаем биты из одного регистра в другой, но и решаем разные бизнес-задачи. Иногда попадаются головоломки. Однажды мы подумали, что было бы здорово выводить на экраны самокатов анимации и изображения — показывать инструкции, как пользоваться сервисом, как начать и закончить поездку, и чтобы запускать DOOM. Зачем? 1) Сделать комфортнее. Удобно видеть инструкции на большом и ярком экране перед глазами, а не нырять за ними в приложение на смартфоне. 2) Сделать безопаснее. Пользователь меньше отвлекается на телефон, крепче держится за самокат и внимательнее смотрит на всё, что вокруг. 3) Почти у всех привычных устройств уже есть экраны, которые выводят пользователям видео и картинки, а почему бы не сделать то же самое на самокате? Но тут возникает проблема. Микроконтроллер крайне ограничен в памяти и вычислительных ресурсах. Самая простая анимация занимает чрезмерно много места. А если внедрить в отрисовку алгоритмы сжатия, то вычислительная нагрузка увеличится и анимация будет сильно лагать. Расскажу, как мы нашли решение этой задачи. Прошу под кат.

    habr.com/ru/companies/whoosh/a

    #микроконтроллеры #микроконтроллер #whoosh #lz4 #графика #изображения #анимации #сжатие_изображений #сжатие_данных #дисплей

  14. Delta-Rle-Huffman (DRH) Texture Format

    Всем привет! В этой статье я опишу алгоритм работы формата сжатия изображений без потерь. Сжатие использует известные методики, которые и дали ему название. Проект начинался с простых экспериментов, которые вышли из под контроля. Не смотря на то, что формат чаще сжимает лучше чем png, никакого практического применения этот формат не имеет, оставаясь чисто академическим. Внимание! В статье много картинок. Кому интересно, добро пожаловать под кат!

    habr.com/ru/articles/815781/

    #Сжатие_изображений #Хаффман #дельта_кодирование #rle

  15. [Перевод] Разбираем самый маленький PNG в мире

    Самый миниатюрный PNG в мире весит 67 байт и представляет собой один чёрный пиксель. Выше вы видите его в 200-кратном увеличении. Красота, не так ли? Состоит этот файл из четырёх частей: Сигнатура PNG, одинаковая во всех файлах этого формата: 8 байт. Метаданные изображения, включая его размеры: 25 байт. Данные пикселя: 22 байта. Маркер «конец изображения»: 12 байт. Далее я опишу этот файл подробнее и постараюсь объяснить принцип работы формата PNG. В качестве небольшой затравки скажу, что в конце предстоит неожиданный поворот. Хотя, надеюсь, вам и без того интересно побольше узнать о PNG.

    habr.com/ru/companies/ruvds/ar

    #ruvds_перевод #png #сжатие_изображений #обработка_изображений #deflate #структура_png

  16. JPEG XL лучше всех, но Google против

    JPEG XL превосходит все форматы по уровню сжатия и визуальному восприятию (DSSIM), источник Оригинальный формат JPEG разработан в далёком 1992 году и уже устарел. Вопрос в том, кто придёт ему на смену. Идеальной заменой казался JPEG XL , в сравнительных тестах он показывает превосходство над AVIF, WebP и другими форматами. Можно было бы сказать, что будущее за JPEG XL, если бы не один нюанс: в 2022 году корпорация Google почему-то удалила его поддержку из браузера Chrome. И не хочет возвращать обратно.

    habr.com/ru/companies/ruvds/ar

    #JPEG XL #Jpegli #Google #сжатие_изображений #сжатие_без_потерь #FLIF #WebP #PNG #AVIF #Chrome #Chromium #JPEG_XL_Viewer #JXL #libjxl #ruvds_статьи

  17. JPEG XL лучше всех, но Google против

    JPEG XL превосходит все форматы по уровню сжатия и визуальному восприятию (DSSIM), источник Оригинальный формат JPEG разработан в далёком 1992 году и уже устарел. Вопрос в том, кто придёт ему на смену. Идеальной заменой казался JPEG XL , в сравнительных тестах он показывает превосходство над AVIF, WebP и другими форматами. Можно было бы сказать, что будущее за JPEG XL, если бы не один нюанс: в 2022 году корпорация Google почему-то удалила его поддержку из браузера Chrome. И не хочет возвращать обратно.

    habr.com/ru/companies/ruvds/ar

    #JPEG XL #Jpegli #Google #сжатие_изображений #сжатие_без_потерь #FLIF #WebP #PNG #AVIF #Chrome #Chromium #JPEG_XL_Viewer #JXL #libjxl #ruvds_статьи

  18. JPEG XL лучше всех, но Google против

    JPEG XL превосходит все форматы по уровню сжатия и визуальному восприятию (DSSIM), источник Оригинальный формат JPEG разработан в далёком 1992 году и уже устарел. Вопрос в том, кто придёт ему на смену. Идеальной заменой казался JPEG XL , в сравнительных тестах он показывает превосходство над AVIF, WebP и другими форматами. Можно было бы сказать, что будущее за JPEG XL, если бы не один нюанс: в 2022 году корпорация Google почему-то удалила его поддержку из браузера Chrome. И не хочет возвращать обратно.

    habr.com/ru/companies/ruvds/ar

    #JPEG XL #Jpegli #Google #сжатие_изображений #сжатие_без_потерь #FLIF #WebP #PNG #AVIF #Chrome #Chromium #JPEG_XL_Viewer #JXL #libjxl #ruvds_статьи

  19. [Перевод] Разбираем самый маленький PNG в мире

    Самый миниатюрный PNG в мире весит 67 байт и представляет собой один чёрный пиксель. Выше вы видите его в 200-кратном увеличении. Красота, не так ли? Состоит этот файл из четырёх частей: Сигнатура PNG, одинаковая во всех файлах этого формата: 8 байт. Метаданные изображения, включая его размеры: 25 байт. Данные пикселя: 22 байта. Маркер «конец изображения»: 12 байт. Далее я опишу этот файл подробнее и постараюсь объяснить принцип работы формата PNG. В качестве небольшой затравки скажу, что в конце предстоит неожиданный поворот. Хотя, надеюсь, вам и без того интересно побольше узнать о PNG.

    habr.com/ru/companies/ruvds/ar

    #ruvds_перевод #png #сжатие_изображений #обработка_изображений #deflate #структура_png