home.social

#лексикография — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #лексикография, aggregated by home.social.

  1. Как мы собираем ингушский язык: словарь, корпус и ИИ в одном проекте

    Ингушский язык — один из нахских языков кавказской семьи, родной для примерно 400–500 тысяч человек. На нём говорят в Ингушетии, частично в Чечне и диаспоре по всей России. Язык живой и имеет государственный статус, но его цифровое присутствие долго оставалось минимальным: разрозненные PDF-словари, несколько сообществ в соцсетях, почти ничего пригодного для повседневного использования. Так появился PaydaDosh — открытая лингвистическая платформа, которая сегодня является крупнейшим онлайн-словарём ингушского языка.

    habr.com/ru/articles/1024816/

    #ингушский_язык #лингвистика #словарь #малые_языки #лексикография #корпус_текстов #NLP #открытые_данные