home.social

#компьютерная_лингвистика — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #компьютерная_лингвистика, aggregated by home.social.

  1. Молитва любви, или трудности перевода на праиндоевропейский с помощью нейросети

    Ранее я уже писал здесь о языковой модели Déiwos-Lókwos GPT , способной общаться на праиндоевропейском языке, подсказывать слова из праиндоевропейского лексикона и переводить тексты (особенно стихи) на праиндоевропейский. В прошлой заметке я делал реконструктивный эксперимент с переводом своего стихотворения на праиндоевропейский, "обкатывая модель". В этот раз я решил эксперимент повторить, но дать модели более сложное стихотворение – тоже моего собственного сочинения, но содержащее более сложную лексику.

    habr.com/ru/articles/967784/

    #праиндоевропейский_язык #перевод #gpt #нейросеть #языковые_модели #лингвистика #компьютерная_лингвистика #искусственный_интеллект

  2. ChatGPT теперь говорит на праиндоевропейском (и перевёл на праиндоевропейский моё стихотворение)

    Пользователь Reddit с ником Low-Needleworker-139 неделю назад объявил в сабреддите r/IndoEuropean , что создал на базе ChatGPT свою пользовательскую языковую модель, которую обучил на имеющемся корпусе реконструкций праиндоевропейского языка. Этот пользовательский чатбот получил название Déiwos-Lókwos GPT . Модель, согласно заявлениям пользователя, отражает как фонетику и грамматику (включая ларингалы и аблаут) так и характерный поэтический регистр, реконструируемый для праиндоевропейского. Одной из ключевых особенностей модели является её способность дообучаться на ходу: например, она придумает и сохранит неологизм, если у неё нет подходящего праиндоевропейского слова (например, "поезд" ). Обо всех подобных усовершенствованиях она сообщает системными сообщениями с заголовком UPGRADE . Автор предложил всем желающим тестировать модель, что я и сделал. Помимо праиндоевропейского, модель говорит на английском (другие языки не проверял, общался с ботом на английском). С первых сообщений нейросеть говорит, что она особенно хороша в поэзии и намекает, что надо дать ей перевести стишок... ну что ж, здесь у нас явно есть общие темы для разговора!

    habr.com/ru/articles/904956/

    #gpt #чатбот #chatgpt #компьютерная_лингвистика #искусственный_интеллект #nlp #праиндоевропейский_язык #языковые_модели #нейросети

  3. Как проверить оперативную память на ошибки

    Неожиданные перезагрузки, «синие экраны смерти», зависания операционной системы, фризы в интерфейсе Windows – все это признаки неисправной оперативной памяти. Сегодня мы расскажем, как проверить ОЗУ на ошибки, какие программы для этого понадобятся и что делать, если обнаружились неполадки.

    habr.com/ru/articles/836934/

    #компьютеры #компьютерное_зрение #компьютерная_графика #компьютерная_лингвистика #компьютерные_игры #компьютер #компоненты

  4. Как почистить компьютер от пыли

    Клочья пыли внутри корпусов забивают радиаторы систем охлаждения и мешают вентиляторам пропускать через себя большие массы воздуха. Это повышает рабочие температуры комплектующих и ведет к их преждевременному выходу из строя. Чтобы продлить срок службы компонентов, нужно регулярно чистить системные блоки от пыли. Многие боятся повредить комплектующие, а потому отдают персональные компьютеры на обслуживание профессионалам. В реальности чистить ПК от пыли безопасно. Если вы уверены в своих силах, то эта статья для вас. Сегодня мы расскажем, как самостоятельно почистить системный блок от пыли в домашних условиях и что для этого понадобится.

    habr.com/ru/articles/836890/

    #компьютеры #компьютерная_графика #компьютерные_игры #компьютер #компьютерная_лингвистика

  5. Язык твой — друг твой. Развиваем малые языки в эпоху ИИ

    Всем привет. Хочу поделиться с сообществом небольшим опытом и наработками для исследования и развития языков, в особенности малых. Для большинства таких языков нет ни систем машинного перевода, ни виртуальных ассистентов, ни других языковых моделей. Основная проблема тут в недостатке данных и отсутствии большого интереса у крупных компаний в их развитии. Однако есть достаточно большое число людей, которым дорог их язык, и которые прикладывают усилия по их сохранению и развитию. Предлагаю обсудить это и познакомиться с инструментами, которые помогут не только собирать данные, но и делать на их основе полезные вещи, типа паралельных книг для изучения языка и систем машинного перевода. Мы научимся: 1. Дообучать мультиязычные языковые модели, переводящие текст в векторное представление (эмбеддинги). 2. Использовать их для выравнивания текстов библиотекой lingtrain-aligner, извлекая из текстов параллельные корпуса. 3. Загружать датасеты и модели на HuggingFace, чтобы это было доступно всем. 4. Создавать из выравнивания параллельные книги для изучения языков. 5. Начнем собирать датасет инструкций на малых языках, чтобы языковые модели и виртуальные смогли понимать и общаться на чувашском, якутском, башкирском и других языках. Все это в делается в виде открытых проектов и сообществ, поэтому приглашаю всех интересующихся изучением и поддержкой языков подключаться к нам , будет интересно.

    habr.com/ru/articles/791188/

    #lingtrain #машинное_обучение #компьютерная_лингвистика #малые_языки #opensourse #labse #параллельный_корпус #nlp #петпроекты