home.social

#кодировки_текста — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #кодировки_текста, aggregated by home.social.

  1. [Перевод] Контрабанда данных внутри эмодзи

    Меня заинтриговал комментарий GuB-42 на Hacker News: При помощи последовательностей ZWJ (Zero Width Joiner) теоретически можно закодировать в один эмодзи неограниченный объём данных. Действительно ли можно закодировать в один эмодзи произвольные данные? tl;dr: да, однако я нашёл решение и без ZWJ. На самом деле, можно закодировать данные в любой символ Unicode. Например, в этом предложении есть скрытое послание: This sentence has a hidden message󠅟󠅘󠄐󠅝󠅩󠄜󠄐󠅩󠅟󠅥󠄐󠅖󠅟󠅥󠅞󠅔󠄐󠅤󠅘󠅕󠄐󠅘󠅙󠅔󠅔󠅕󠅞󠄐󠅝󠅕󠅣󠅣󠅑󠅗󠅕󠄐󠅙󠅞󠄐󠅤󠅘󠅕󠄐󠅤󠅕󠅨󠅤󠄑. (Попробуйте вставить его в декодер .)

    habr.com/ru/articles/883342/

    #unicode #кодовые_точки #кодировки_текста #стеганография #водяные_знаки

  2. [Перевод] Красота и изящество таблицы ASCII

    Если вы программист или хотя бы немного связаны с программированием 1 , то без сомнения сталкивались с таблицей ASCII . Таблица ASCII полезна. Но знали ли вы, что она ещё красива и изящна ? Сегодня даже не близкие к программированию люди могут знать об ASCII благодаря книгам и фильмам наподобие «Марсианина» 2 ASCII по-прежнему с нами; даже если вы передаёте современный Unicode 3 , то должны знать, что самый популярный формат кодировки UTF-8 специально спроектирован как обратно совместимый с ASCII! Декодировав эту статью как ASCII, вы в целом поймёте её смысл… если закроете глаза на мусорные символы в конце предложений.

    habr.com/ru/companies/ruvds/ar

    #ruvds_переводы #ascii #кодировки_текста #unicode #пишущие_машинки #телетайп #стандарты

  3. [Перевод] Нельзя предполагать, что все используют UTF-8

    Как вычислять кодировку при помощи статистики Люди говорят на бесчисленном количестве разных языков. Эти языки не только несовместимы между собой, но и представляют огромную трудность при транспиляции в среде исполнения. К сожалению, все попытки стандартизации провалились. По крайней мере, в таком положении вещей есть, кого винить: Бога. Ведь именно он вынудил человечество говорить на разных языках из-за древнего спора о строительстве объекта недвижимости . Однако человечество может винить себя за то, что сложности в общении испытывают компьютеры . И одна из самых больших проблем одновременно является самой простой: компьютеры не договорились о том, как записывать буквы двоичным кодом.

    habr.com/ru/companies/ruvds/ar

    #ruvds_переводы #unicode #кодировки_текста #win1252 #koi8 #utf8 #utf16 #определение_кодировок