home.social

#chatgptoss — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #chatgptoss, aggregated by home.social.

  1. [Перевод] Большое сравнение архитектур LLM

    Это перевод классной статьи с детальным обзором архитектур главных опенсорсных LLM: очень структурировано, доходчиво и с изумительными картиночками. И такой обзор просто обязан быть на русском языке. Поговорим про DeepSeek V3/R1, OLMo 2, Gemma 3, Mistral Small 3.1, Llama 4, Qwen3, SmolLM3, Kimi K2, GPT-OSS, Grok 2.5, GLM-4.5, Qwen3-Next. Ну а дальше слово автору: Прошло семь лет с момента разработки оригинальной архитектуры GPT. На первый взгляд, оглядываясь назад на GPT-2 (2019) и вперед на DeepSeek-V3 и Llama 4 (2024-2025), можно удивиться тому, насколько структурно похожими остаются эти модели. Однако я считаю, что все еще есть большая ценность в изучении структурных изменений самих архитектур, чтобы увидеть, чем занимаются разработчики LLM в 2025 году.

    habr.com/ru/articles/958880/

    #ai #llm #qwen #kimi #chatgpt #chatgptoss #ллм #большие_языковые_модели #архитектура