#языки — Public Fediverse posts
Live and recent posts from across the Fediverse tagged #языки, aggregated by home.social.
-
Лингвистическая относительность в программировании — как наше мышление определяет выбор языка и стиль кодирования
Поводом к написанию предыдущей статьи «Шаблоны и принципы деления кода на классы» послужил случай с начинающим программистом, который обратился ко мне за помощью. Однако та история получила неожиданное продолжение, ставшее, в свою очередь, одной из предпосылок уже для этой статьи. И видимо, волей судьбы или просто по забавному стечению обстоятельств, эта история оказалась напрямую связана с комментариями к первой статье, где в ходе жаркого диалога я затронул тему мышления и восприятия кода разработчиком. Так родилась идея поделиться накопившимися за 10-летний стаж наблюдениями и плодами размышлений: - Как стиль написания кода отражает образ мышления разработчика. - Как разработчики воспринимают код программы. - Почему один язык программирования, что называется, «заходит», а другой - нет.
https://habr.com/ru/companies/cinimex/articles/1013914/
#коддинг #java #python #программирование #функциональное_программирование #процедурное_программирование #ооп #ооп_программирование #языки_программирования #языки
-
EMNLP 2025 глазами аналитика из Яндекса: мировые тренды и наши решения
Всем привет! Меня зовут Катя Еникеева, я руковожу командой аналитики перевода в Яндексе. Мы занимаемся оценкой качества машинного перевода — моделей, которые работают в Яндекс Переводчике, Браузере, Поиске и во множестве других сервисов. Качество перевода можно измерять по‑разному, но можно выделить два основных направления: экспертная разметка и автоматические метрики. В последние годы автометрики всё чаще строятся поверх LLM: фактически это отдельный пайплайн, который анализирует исходный текст и полученный перевод. Поэтому нас интересует не только способность моделей переводить, но и их умение анализировать качество перевода, что может быть заметно сложнее. Под катом вас ждёт обзор самых интересных решений, представленных на конференции EMNLP 2025. Наша команда перевода приехала на EMNLP 2025 не только слушать, но и рассказывать о своей работе. В этом году у нас приняли две статьи: одну — в Findings основной конференции, вторую — на WMT. О них я тоже подробно расскажу.
https://habr.com/ru/companies/yandex/articles/991144/
#яндекс #машинный_перевод #конференции #ml #языки #перевод #llm #emnlp
-
Я написал компилятор на C++ при помощи LLVM (2)
GitHub Из прошлой статьи мы знаем, что я разрабатываю свой компилятор - Onyx . С того момента язык активно развивался, теперь он поддерживает:
https://habr.com/ru/articles/989684/
#llvm #llvm_ir #llvm_компилятор_llvm_ir #c++ #язык_программирования #языки #как_написать_свой_язык #компиляторы #компилятор #как_написать_язык
-
Проект по созданию системы передачи текста музыкой
Всем добрый день. Решил поделиться одним из почти заброшенных проектов десятилетней давности – передача текста музыкой. Программирование здесь тоже будет, поэтому можно считать это ИТ-проектом. Читать далее:
-
Научная, научно-популярная и образовательная литература. Наукова, науково-популярна та освітня література. Scientific, popular science and educational literature.
#библиотека #книги #наука #математика #физика #химия #астрономия #литература #биология #лингвистика #языки #история #этнография #философия #психология
#library #books #science #mathematics #physics #chemistry #astronomy #literature #biology #linguistics #languages #ethnography #philosophy #psychology -
Научная, научно-популярная и образовательная литература. Наукова, науково-популярна та освітня література. Scientific, popular science and educational literature.
#библиотека #книги #наука #математика #физика #химия #астрономия #литература #биология #лингвистика #языки #история #этнография #философия #психология
#library #books #science #mathematics #physics #chemistry #astronomy #literature #biology #linguistics #languages #ethnography #philosophy #psychology -
Точка, запятая и прочие: как появились привычные нам знаки препинания, и при чём тут венецианцы?
В конце предложения должна быть точка — и точка. Да, в современной сетевой переписке это уже не факт, и многими воспринимается как настаивающая и даже «токсичная» интонация, но формально правила русского и других языков с письменностями на основе кириллицы и латиницы неумолимы. Использование запятых, двое- и многоточий, дефисов и тому подобного в них тоже не слишком отличается. Более того, со второй половины XIX века европейские знаки препинания и правила их применения проникают даже в такие языки, как китайский и японский. Почему это произошло, и как именно оформился привычный нам ассортимент знаков препинания? Попробуем разобраться.
https://habr.com/ru/companies/ruvds/articles/971260/
#ruvds_статьи_выходного_дня #шрифты #тексты #пунктуация #знаки_препинания #история #языки
-
Точка, запятая и прочие: как появились привычные нам знаки препинания, и при чём тут венецианцы?
В конце предложения должна быть точка — и точка. Да, в современной сетевой переписке это уже не факт, и многими воспринимается как настаивающая и даже «токсичная» интонация, но формально правила русского и других языков с письменностями на основе кириллицы и латиницы неумолимы. Использование запятых, двое- и многоточий, дефисов и тому подобного в них тоже не слишком отличается. Более того, со второй половины XIX века европейские знаки препинания и правила их применения проникают даже в такие языки, как китайский и японский. Почему это произошло, и как именно оформился привычный нам ассортимент знаков препинания? Попробуем разобраться.
https://habr.com/ru/companies/ruvds/articles/971260/
#ruvds_статьи_выходного_дня #шрифты #тексты #пунктуация #знаки_препинания #история #языки
-
Точка, запятая и прочие: как появились привычные нам знаки препинания, и при чём тут венецианцы?
В конце предложения должна быть точка — и точка. Да, в современной сетевой переписке это уже не факт, и многими воспринимается как настаивающая и даже «токсичная» интонация, но формально правила русского и других языков с письменностями на основе кириллицы и латиницы неумолимы. Использование запятых, двое- и многоточий, дефисов и тому подобного в них тоже не слишком отличается. Более того, со второй половины XIX века европейские знаки препинания и правила их применения проникают даже в такие языки, как китайский и японский. Почему это произошло, и как именно оформился привычный нам ассортимент знаков препинания? Попробуем разобраться.
https://habr.com/ru/companies/ruvds/articles/971260/
#ruvds_статьи_выходного_дня #шрифты #тексты #пунктуация #знаки_препинания #история #языки
-
Точка, запятая и прочие: как появились привычные нам знаки препинания, и при чём тут венецианцы?
В конце предложения должна быть точка — и точка. Да, в современной сетевой переписке это уже не факт, и многими воспринимается как настаивающая и даже «токсичная» интонация, но формально правила русского и других языков с письменностями на основе кириллицы и латиницы неумолимы. Использование запятых, двое- и многоточий, дефисов и тому подобного в них тоже не слишком отличается. Более того, со второй половины XIX века европейские знаки препинания и правила их применения проникают даже в такие языки, как китайский и японский. Почему это произошло, и как именно оформился привычный нам ассортимент знаков препинания? Попробуем разобраться.
https://habr.com/ru/companies/ruvds/articles/971260/
#ruvds_статьи_выходного_дня #шрифты #тексты #пунктуация #знаки_препинания #история #языки
-
Как я создал платформу для изучения иврита: от идеи до работающего сервиса
Я построил полноценную образовательную платформу для изучения иврита — с интерактивными тренажерами, умным словарем на 4000+ слов и системой подписок. В статье рассказываю о нетривиальных технических решениях, архитектурных выборах и ошибках, которые пришлось исправлять по ходу. Продукт: hebrewglot.com Стек: Next.js 15, TypeScript, PostgreSQL + SQLite, Stripe, NextAuth Погнали
https://habr.com/ru/articles/963834/
#иврит #nextjs #typescript #веб_разработка #postgresql #интернационализация #морфология #израиль #языки
-
DSL KeyPad — ввод более 4 700 символов Юникода прямо с клавиатуры
Зачем? — У меня и самой был запрос на такую программу. Программу с кучей «нестандартных» символов. Существующие решения не отвечали моим потребностям и тогда я решила создать своё, подходящее под мои хотелки: многоязычный ввод, ввод типографских, математических и даже алхимических символов. И теперь я надеюсь, что сие «изобретение» окажется полезным не только для меня. Такой инструмент необходим мне для разработки вселенной — построение канона культур, писательство (именно работа над книгой стала триггером для начала разработки) и работа с языками. Создавать новые языки на основе существующих систем ныне будет проще — все нужные символы как на ладони. В статье представлен обзор на DSL KeyPad и его основные фичи, благодаря которым вы сможете печатать с внушительным арсеналом символов, имея всего-то две языковые раскладки: русскую и английскую. Румынский? Немецкий? Или может быть Вьетнамский? Старославянский? Да легко — множество комбинаций и ряд фич позволит вам писать на куче языков. Да хоть Германские руны и Глаголицу печатать. Прилагаются и широкие возможности кастомизации под свои нужды. А это примеры названий языков и систем, написанные с помощью моей программы: Қазақ тілі, Хуэйзў йүян, Забони тоҷикӣ, Йағнобӣ зивок, Аԥсуа бызшәа, Авар мацӏ, Українська мова, Словѣньскъ ѩꙁꙑкъ, Црногорски језик, Ли́мба Рꙋмѫнѣскъ, Итәнмәӈин крвэԓхатас, Даһур Усүүэ, Эвэды̄ турэ̄н, Азәрбајҹанҹа, Башҡорт теле, Тэлэңгэт, Чӑваш чӗлхи… Ænglisċ sprǣċe, Français, Tiếng Việt, Hànyǔ Pīnyīn, Norrœnt mál, Limba Română, Español, Język polski, Čeština, Bokmål, Tamaziɣt, Türkçe, Sää’mǩiõll…
https://habr.com/ru/articles/932600/
#типографика #autohotkey #раскладка_клавиатуры #unicode #юникод #языки #клавиатура #набор_текста #qwerty #йцукен
-
(english original on top ^)
Итак, сегодня я объясню вам первую, более старую идею. Этот #апостериорный #конланг основан на матрицах (спойлер: вторая идея основана на деревьях). Во-первых, у вас во рту есть 4 места (заднее, как «к»; среднее, как «л»; переднее, или зубы, как «с» и «н»; и губы, как «п»). Далее, у вас есть 4 способа взаимодействия с ними (носовой, как "n"; стук, как "t"; аппроксимация, как "s" (или "j" i meah "y", й, в случае с задним рядом), трение, как "th").
Итак, матрица согласных выглядит так:
g k j h
l r c x
n t s z
m p v f
звучит как:
ng k y gh
l r ch sh
n t (t)s th
m p w f
ts-th - это моё самое слабое место, но я не могу придумать ничего лучше :(
Затем у нас есть стандартные пять гласных (a e i o u), в сумме 80 слогов.
В идеале каждое место, взаимодействие и гласная вносят свой вклад в конечное значение слога. Четыре категории для места, четыре категории для способа, пять - для гласной, и они суммируются в значение. Например, если бы задняя часть означала «human», tap – «action» и o – «group» (теоретически), тогда «ko» будет чем-то вроде «contact» (не знаю). Тогда, с похожим слогом, например, «to», когда teeth-place означает «feeling», это будет что-то вроде «rough». (Я на самом деле хз, как лучше распределить категории, мб, нужны дополнительные исследования в области философии, психологии и лингвистики. Для мест я предлагаю: back-human – middle-nature – teeth-feelinss – lips-abstract).
Итак, теперь у нас есть слог! Мы общаемся с помощью слогов? Нет! Мы общаемся с помощью трёх категорий: значения; роль в тексте; наше отношение или заполняющие слова, например, «like», «idk», «ну», «типа».
Для значений мы объединяем три слога вперёд (согласный-гласный, или CV), как в koselu. Во-первых, «ko» – самый важный, он даёт представление о том, о чём идёт речь. Во-вторых, сужает его до… Меньшая группа вещей. А третья определяет именно то, о чём мы говорим. И нет, мы не создаём их, когда говорим, это не #ithkuil — создатели создают слова один раз, записывают их в словарь, и учащемуся нужно только увидеть их там, узнать их значение, и их структура должна очень помочь в запоминании. Схожие (по значению) вещи звучат похоже. Разные вещи звучат по-разному. В построении слов есть (должна быть) логика. Расположение слов в алфавитном порядке (алфавитный порядок [g k j h l r c x n t s z m p v f a e i o u]) также классифицирует их по значению, сферам, поэтому поиск слова по значению почти так же прост, как поиск по звуку!
В слове 80 слогов и 80**3=512000 возможных значений, чего должно быть достаточно для создания слов на любую возможную тему в человечестве, и в будущем появятся свободные.
Теперь поговорим о грамматике. Для неё мы используем обратную (VC) - гласные согласные, например, "on"). Их может быть сколько угодно, и мы можем даже строить предложения в разных парадигмах. Например, тема и информация (T-cat I-black = кот чёрный), подлежащее, глагол, дополнение (S-cat V-eating O-fish - кот ест рыбу), дополнение и дескриптор (O-cat D-black - кот чёрный), объедините их (подлежащее-объект-тема, кот, дескриптор-информация, чёрный, объект-объект-тема, рыба, дескриптор-тема, мокрый, объект-глагол-информация, ест, дескриптор-информация, быстро = кот чёрный и быстро съедает ту рыбу, которая мокрая, знаете ли).
Всего 80 грамматических слогов, и они также перекрёстные 4-4-5, но взаимодействие места и гласный означают разные вещи, не [человек - природа - чувство - абстрактный], а связанные с грамматикой вещи. Следует изучить разные (фактически, все возможные) языки, чтобы понять, как распределять эти грамматические конструкции. Слоги
И концепция из #lojban (но используется во всех языках, по сути, самыми разными способами), междометия — структура VCV, 400 вариантов. В идеале они объединяют значения грамматических и содержательных слогов, но тут только одна согласная, и я не совсем уверен, должна ли она быть уникальной или иметь значение, как в содержательном слове. Тогда у нас есть две гласные — первая означает то же, что и в грамматических словах, вторая — то же, что и в содержательных словах. Одна междометия может заменить целое предложение, например, «я согласен с этим» мы заменяем на «ok».
Будет список предопределённых междометий для использования, как и в содержательных словах, но этот список гораздо короче и постоянен (5*16*5 = 400 слов).
Кроме того... можно создать очень классный способ записи языка. Например, содержательные слова — картинки, составленные из трёх частей (первый слог в середине, объект изображения, второй — некоторые детали, и третье — некий оттенок или контур, но часть рисунка), грамматика — ошибки и/или границы (контуры) между и/или вокруг этих рисунков, и отношение — контур вокруг всего предложения (или пустое место, если оно отдельно).
Вот и всё — моя первая маленькая идея для конланга. Расскажите, где я ошибаюсь, что вам нравится, хотите ли вы увидеть этот конланг готовым, или вы вообще можете помочь этому случиться.
#конлангинг #эсперанто #токипона #язык #языки #лингвистика -
[Перевод] Не пытайтесь угадать мой язык
Если вы всё ещё используете IP-геолокацию для выбора отображаемого языка, то хватит заниматься ерундой. Это ошибочное допущение, замаскированное под фичу. IP сообщает, откуда пришёл запрос, и на этом всё. Он не сообщает, какой язык нужен пользователю, на каком языке он говорит и какой язык понимает. Подобная система постоянно ломается — VPN, путешествия, эмиграция, страны с несколькими официальными языками. Это не умное, а раздражающее решение.
-
MVP, Agile, бета-тестирование: как я использовала IT-фреймворки, чтобы написать книгу про изучение языков
Привет! Меня зовут Лена Кочева, сейчас я помогаю учить языки как консультант, а раньше работала IT-аналитиком. Айтишный бэкграунд наложил отпечаток: мне нравилось раскладывать процесс изучения на четкие алгоритмы. В прошлом году решила написала книгу, как учить язык по принципу 20/80. Но если бы я знала, во что ввязываюсь… 😅 В этой статье расскажу, как айтишный бэкграунд помог мне затащить совсем неайтишный проект. Бонусом — как устроен процесс издания книги, сколько зарабатывает автор и почему я разве что выйду в ноль, даже издавшись в издательстве. В главных ролях: - « Лингво-хакинг. Как выучить иностранный язык эффективно и без выгорания » —руководство для тех, кто учит язык для работы или эмиграции. - И я — изо всех сил старающаяся сделать хорошо 😁
https://habr.com/ru/articles/893024/
#языки #книги #книги_нужно_читать #личный_опыт #издательство
-
Финский — мой официальный фейл. Но почему?
Привет, Хабр! Меня зовут Саша Потапова, я бегло говорю на английском, испанском, французском и считала бы себя полиглотом, если бы не одно «но» — финский, который стал моим фейлом. Причем я усердно его учила, а способности к языкам у меня несколько выше среднего. Так что сегодня поделюсь своим опытом изучения финского, расскажу о его особенностях (господи, сколько их!) и причинах своего поражения.
-
Как учить язык быстро и самостоятельно
Я более‑менее знаю пять языков, на четырех пишу, читаю и общаюсь, на одном читаю и криво общаюсь, еще пару-тройку языков понимаю — они в архиве. Все, что здесь написано, это мой личный опыт, а не «байки из интернета» или компиляция ИИ. Когда я выучил еще три в дополнение к своему родному, то думал, что теперь все знаю о том, как учить языки. Когда выучил еще один и начал два других, некоторые вещи пришлось пересмотреть. Думаю, это зависит от количества, и полиглоты, владеющие 10–15 языками, скорее всего, будут иметь уже другое мнение насчет учебы. Так что сейчас я делюсь наработками, которые у меня есть на данном этапе. Если же вы знаете меньше пяти языков, подумайте хорошо, если вы хотите оспорить моё мнение. Узнать больше
https://habr.com/ru/articles/875138/
#языки #английский #самообучение #самообразование #майндхакинг
-
Пацанский английский. Ленивый способ наконец выучить английский язык: без курсов, без зубрежки, бесплатно
Привет, Хабр! Я не являюсь преподавателем английского языка, но, как и многие присутствующие, долгие годы хотел постигнуть его дебри. В школе я от всего сердца завидовал ребятам, которым он даётся налегке, без видимых трудностей. Я же зубрил, пытался понять, получал двойки… и люто ненавидел английский язык как школьный предмет. Мечтал владеть, но совсем не хотел учить. После школы и университета приступал к его изучению несколько раз, однако каждый мой всплеск быстро угасал. Наконец случилось чудо. В одну из очередных попыток я нащупал способ, который позволил продолжать развиваться, делать успехи, осознавать их и разжигать мой огонь всё сильнее и сильнее. Сегодня мне сложно представить день, проведенный без английского языка. И мне не хочется говорить без “изучения”, поскольку не сказал бы, что я именно учу. Скорее — постепенно “прошиваюсь” английским, как это обычно происходит с новорожденным детьми, которые постепенно начинают говорить, слушая и наблюдая за своими родителями. В настоящее время мой словарный запас не такой большой: 9 — 12 тысяч слов (зависит от теста). Я свободно смотрю видео на Ютубе разнообразной тематики (видеоуроки, спорт, фитнес, музыка, путешествия, кулинария, обзоры и т.д.), читаю документацию, компьютерную и популярную литературу, публицистику.
https://habr.com/ru/articles/851910/
#английский_язык #английский_язык_самообразование #языки #изучение_английского #изучение_иностранных_языков #иностранные_языки #английский_онлайн #английский_обучение_языки
-
Испанский без иллюзий: мой опыт изучения языка. Часть 1
Hola, Хабр! Это Женя Сильянова из МТС Диджитал. В свое время я девять лет жила в Испании, сегодня хочу поделиться своим опытом изучения иностранного с нуля. Сейчас мой уровень — С1, как-то я даже написала на испанском дипломную работу и получила диплом за подписью самого короля Испании: это не что-то уникальное, но приятно. Как долго я учила язык, с какими сложностями столкнулась и какие мифы чаще всего мне встречаются об испанском, рассказываю под катом.
-
Подошёл к концу семидневный марафон по венгерскому языку, в котором я участвовал.
За 350 рублей или 1500 форинтов мы получили нечто очень странное.
Тут по ссылке я рассказываю подробнее (там просто 2000 символов, оно сюда явно не влезет). -
Обожаю венгерский язык за то, что он иногда ведёт себя как чёртов конструктор :)
Устанавливать (софт, винду, что-то ещё) - telepíteni
Основа - telepít (он/она устанавливает)
telepíthet - он/она может устанавливать (имеет такую возможность)
telepíthető - причастие от предыдущего (он/она - имеющий возможность устанавливать)
telepíthetőség - сама возможность устанавливать, возможность установки, если короче
újratelepíthetőség - возможность повторной установки (переустановки)И вот это прекрасное слово ещё и может быть членом предложения и принимать суффиксы множественного числа (újratelepíthetőségek) или оказываться в одном из 18 венгерских падежей.
Абсурд конечно, но "простите за мою возможность повторной установки" переводится примерно как "Bacsánat az újratelepíthetőségemért".Ну а самое длинное венгерское слово (44 буквы) - megszentségteleníthetetlenségeskedéseitekért.
Восхитительный язык!
-
Мета-Переводчики: реальность или фантастика?
Всем Хабр! В этой статье пойдет речь о переводчиках. Но не в привычном (во всяком случае, в IT-мире) понимании, - а с точки зрения математики. Да-да, это редкий случай, когда нас будут интересовать переводчики вне позиции смыслов. Сразу оговорюсь, как это стало чаще заводиться в моих статьях: Создать Мета-Переводчик
https://habr.com/ru/articles/794286/
#переводчик #машина_тьюринга #автоматы #GPT #синтаксис #грамматика #иерархия_Хомского #языки
-
Зри в корень — это не зря
— Как не взопреть, разбираясь в куче никак не связанных переводов одного слова в английском языке. — Как в этом поможет этимологический словарь. — Почему это лучше простого запоминания. Узнать
https://habr.com/ru/articles/792848/
#английский #английский_язык #языки #образование #эффективность #как_учиться #лайфхак
-
Вот есть французское le main - рука.
Подумал, а если в английском, main этимологически произошло от него.
Главный... Рука...
Т.е. рука это что-то важное. Типа не сможешь хватать - всё. Конец. Т.е. главное - непрерывно связанно с чем-то материальным.
Вооот он! капитализм зарывшийся в языке :ageblobcat: -
Сижу, забиваю в словарик неизвестные слова из "Le Temps des cathédrales"
На последнем куплете я сломался...
Il est foutu le temps des cathédrales
La foule des barbares
Est aux portes de la ville
Laissez entrer ces païens, ces vandalesВремя кафедральных соборов поимели...
Можно конечно более литературно. Но почему в оригинале именно это слово.
"It's the past participle of the verb foutre, which literally (originally) means to cum, but it hast lost its sexual meaning for a long time."
Хах.. ну ладно. Время кончило -> Время настало -> Пришел конец
-
Как интересно.
Devoir, Deber
Глагол "быть обязанным" во французском и испанском соответственно.Параллельно с этим, "домашнее задание" обычно так и переводится как devoirs или deberes, соответственно.
У нас это "задание на дом", у них это "обязанности"