home.social

#aiopensource — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #aiopensource, aggregated by home.social.

  1. 🚀 Cập nhật công cụ RL mã nguồn mở! Pipeline tích hợp 6 phương pháp reinforcement learning hiện đại (SFT, PPO, DPO, GRPO, SimPO, KTO) cùng công cụ tối ưu inference như Flash Attention 2 và MCTS. Dễ dàng cấu hình qua file YAML, kèm dataset mẫu cho từng phương pháp. Dự án hướng tới AI mã nguồn mở & minh bạch!

    #MachineLearning #HọcMáy #AIOpenSource #ReinforcementLearning #TríTuệNhânTạo

    [Tags được gợi ý: #AIResearch #DeepLearning #OpenSource]

    reddit.com/r/LocalLLaMA/commen