#кодировки_текста — Public Fediverse posts
Live and recent posts from across the Fediverse tagged #кодировки_текста, aggregated by home.social.
-
[Перевод] Контрабанда данных внутри эмодзи
Меня заинтриговал комментарий GuB-42 на Hacker News: При помощи последовательностей ZWJ (Zero Width Joiner) теоретически можно закодировать в один эмодзи неограниченный объём данных. Действительно ли можно закодировать в один эмодзи произвольные данные? tl;dr: да, однако я нашёл решение и без ZWJ. На самом деле, можно закодировать данные в любой символ Unicode. Например, в этом предложении есть скрытое послание: This sentence has a hidden message󠅟󠅘󠄐󠅝󠅩󠄜󠄐󠅩󠅟󠅥󠄐󠅖󠅟󠅥󠅞󠅔󠄐󠅤󠅘󠅕󠄐󠅘󠅙󠅔󠅔󠅕󠅞󠄐󠅝󠅕󠅣󠅣󠅑󠅗󠅕󠄐󠅙󠅞󠄐󠅤󠅘󠅕󠄐󠅤󠅕󠅨󠅤󠄑. (Попробуйте вставить его в декодер .)
https://habr.com/ru/articles/883342/
#unicode #кодовые_точки #кодировки_текста #стеганография #водяные_знаки
-
[Перевод] Красота и изящество таблицы ASCII
Если вы программист или хотя бы немного связаны с программированием 1 , то без сомнения сталкивались с таблицей ASCII . Таблица ASCII полезна. Но знали ли вы, что она ещё красива и изящна ? Сегодня даже не близкие к программированию люди могут знать об ASCII благодаря книгам и фильмам наподобие «Марсианина» 2 ASCII по-прежнему с нами; даже если вы передаёте современный Unicode 3 , то должны знать, что самый популярный формат кодировки UTF-8 специально спроектирован как обратно совместимый с ASCII! Декодировав эту статью как ASCII, вы в целом поймёте её смысл… если закроете глаза на мусорные символы в конце предложений.
https://habr.com/ru/companies/ruvds/articles/831138/
#ruvds_переводы #ascii #кодировки_текста #unicode #пишущие_машинки #телетайп #стандарты
-
[Перевод] Нельзя предполагать, что все используют UTF-8
Как вычислять кодировку при помощи статистики Люди говорят на бесчисленном количестве разных языков. Эти языки не только несовместимы между собой, но и представляют огромную трудность при транспиляции в среде исполнения. К сожалению, все попытки стандартизации провалились. По крайней мере, в таком положении вещей есть, кого винить: Бога. Ведь именно он вынудил человечество говорить на разных языках из-за древнего спора о строительстве объекта недвижимости . Однако человечество может винить себя за то, что сложности в общении испытывают компьютеры . И одна из самых больших проблем одновременно является самой простой: компьютеры не договорились о том, как записывать буквы двоичным кодом.
https://habr.com/ru/companies/ruvds/articles/811811/
#ruvds_переводы #unicode #кодировки_текста #win1252 #koi8 #utf8 #utf16 #определение_кодировок