home.social

#large_concept_model — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #large_concept_model, aggregated by home.social.

  1. Почему токенизация – костыль? Передовые подходы для больших языковых моделей следующего поколения

    Сдерживает ли токенизация потенциал больших языковых моделей? Несмотря на свою популярность, этот подход имеет ряд ограничений, которые становятся всё более заметными с развитием LLM. В статье мы разберём, почему токенизация является костылём, какие проблемы она создаёт и какие альтернативные методы предлагают исследователи для их решения. От байтовых моделей до работы с концептами — как пытаются улучшить ситуацию и что это может означать для будущего языковых моделей.

    habr.com/ru/articles/873120/

    #большие_языковые_модели #llm #токенизация #bytelevel_models #Byte_Latent_Transformer #Large_Concept_Model #ограничения_ии #патчинг #концепты #мультиязычность