home.social

#glm5 — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #glm5, aggregated by home.social.

  1. Из коробки не работает: запускаем свежие большие LLM

    В последнее время открытых моделей сверхбольшого размера развелось неимоверное количество, даже не просто моделей, а производителей. Вариации GLM, Kimi, DeepSeek занимают по нескольку строк в топ 5-10-20. Понадобилось перебрать основные LLM для тестов и выбора "рабочей лошадки", для чего пришлось немного пошуршать в интернетах. Оставлю в качестве памятки, вдруг кому-то окажется полезным. Всё делалось на базе образов vllm-openai, платформ B200/H200 и дров 590.48.01. На момент начала экспериментов - примерно пару недель тому назад - версии vllm 0.16 ещё не было, но, как выяснилось в итоге, это не сильно повлияло на ситуацию. Основные костыли остались теми же самыми. Разве что кастомизация образа не для каждой модели нужна теперь. В целом там, понятное дело, никакого RocketScience нету (особенно после того, как почитаешь китайские форумы в поисках нюансов). Но если бы кто-то посидел заранее и собрал советы в одном месте - жизнь была бы немного проще )) поэтому делюсь. Итак, поехали.

    habr.com/ru/articles/1006202/

    #KimiK25 #DeepSeekv32 #GLM5 #Qwen35 #vllm #B200 #H200

  2. xAI just unveiled GLM‑5, a new frontier model that pushes open‑source AI forward. Paired with an AI‑driven customer intelligence platform, it tackles agentic tasks with DeepSeek sparse attention. Curious how this could reshape LLM applications? Dive into the details. #GLM5 #ZhipuAI #OpenSourceAI #FrontierModel

    🔗 aidailypost.com/news/xai-launc

  3. #ZAI: #GLM5, a new large language model, is designed for #complexsystemsengineering and long-horizon agentic tasks. It boasts 744 billion parameters and integrates #DeepSeek #SparseAttention for improved efficiency. GLM-5 outperforms previous models on various benchmarks, including #reasoning, #coding, and #agentictasks, and is open-sourced for wider accessibility. z.ai/blog/glm-5?AIagents.at #AIagent #AI #ML #NLP #LLM #GenAI