home.social

#họcmay — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #họcmay, aggregated by home.social.

  1. SDPO: Tối ưu hóa Chính sách thông qua Tái chưng cất – phương pháp học tăng cường mới tận dụng phản hồi dạng văn bản (lỗi runtime, đánh giá) để chuyển tín hiệu phần thưởng thưa thành tín hiệu học dày đặc. Mô hình tự làm "thầy giáo" bằng cách điều chỉnh dự đoán dựa trên phản hồi, cải thiện hiệu suất 10× nhanh hơn, vết lập luận ngắn hơn 7×, đặc biệt hiệu quả với mô hình lớn.

    #ReinforcementLearning #AI #MachineLearning #SDPO #NLP #HọcMáy #AIResearch #TựHọc

    self-distillation.github.io/SDP

  2. 🔔 Ra mắt BULaMU‑Dream – mô hình text‑to‑image đầu tiên thế giới được huấn luyện từ đầu cho ngôn ngữ châu Phi. Dự án mở nguồn trên HuggingFace, chi tiết kỹ thuật có trên Zenodo. Hãy khám phá khả năng sáng tạo mới! #AI #MachineLearning #TextToImage #AfricanLanguage #DeepLearning #TríTuệNhânTạo #HọcMáy #NgônNgữChâuPhi

    v.redd.it/csobk5s91xgg1

  3. Mô hình AI tạo ảnh từ văn bản đầu tiên hỗ trợ ngôn ngữ châu Phi: BULaMU-Dream, hiện đã có thể tải về trên Hugging Face. Được huấn luyện từ đầu với ngôn ngữ bản địa châu Phi, mở đường cho đa dạng hóa AI. #TextToImage #AI #MachineLearning #BULaMU_Dream #NgônNgữChâuPhi #TríTuệNhânTạo #HọcMáy #CôngNghệAI

    reddit.com/r/LocalLLaMA/commen

  4. 🚀 Đánh bại GPT-2 với chi phí dưới $100! Andrej Karpathy chia sẻ hành trình nanochat - chỉ 3 giờ huấn luyện trên 8×H100 đã vượt qua GPT-2 trong benchmark CORE. Bài viết tiết lộ chi tiết kiến trúc, tối ưu hóa và script để tái tạo kết quả.

    #AI #MachineLearning #TríTuệNhânTạo #HọcMáy #NanoChat #GPT2

    reddit.com/r/LocalLLaMA/commen

  5. Cuốn sổ tay AI cần biết 2024: NLP, LLM, RAG, Agentic AI... Cập nhật công cụ và mô hình hàng đầu như GPT-4o, Llama 3, Stable Diffusion. Từ AI cơ bản đến ứng dụng nâng cao, giúp bạn theo kịp làn sóng công nghệ. #AI #MachineLearning #Technology #TríTuệNhânTạo #HọcMáy #CôngNghệ

    dev.to/ms_74/to-those-who-are-

  6. **Tìm kiếm mô hình 70B tốt cho roleplay và sáng tạo**
    Người dùng mô hình 70B chia sẻ kinh nghiệm và đề xuất các phiên bản như L3.3-70B, Apocrypha-L3.3, Anubis-70B, v1.1/v1.2, MS-Nevoria. Một số mô tả: "điên rồ nhưng ngẫu nhiên", "ý tưởng độc đáo". Có gợi ý nào hay không? #AI #MôHình70B #Roleplay #SángTạo #HọcMáy #LLM #TechVN #70BModels #AIExperiment

    reddit.com/r/LocalLLaMA/commen

  7. Dự án chuyển Chronos Bolt (mô hình thời gian) và T5 sang NPU di động đã được chia sẻ code thực thi, mở ra khả năng chạy inference AI hiệu năng cao trên thiết bị nhúng. #AI #NPU #MobileAI #ChronosBolt #T5 #MachineLearning #HọcMáy #TríTuệNhânTạo

    reddit.com/r/LocalLLaMA/commen

  8. Dự án chuyển Chronos Bolt (mô hình thời gian) và T5 sang NPU di động đã được chia sẻ code thực thi, mở ra khả năng chạy inference AI hiệu năng cao trên thiết bị nhúng. #AI #NPU #MobileAI #ChronosBolt #T5 #MachineLearning #HọcMáy #TríTuệNhânTạo

    reddit.com/r/LocalLLaMA/commen

  9. Dự án chuyển Chronos Bolt (mô hình thời gian) và T5 sang NPU di động đã được chia sẻ code thực thi, mở ra khả năng chạy inference AI hiệu năng cao trên thiết bị nhúng. #AI #NPU #MobileAI #ChronosBolt #T5 #MachineLearning #HọcMáy #TríTuệNhânTạo

    reddit.com/r/LocalLLaMA/commen

  10. Tuần này Hugging Face ra mắt nhiều mô hình AI ấn tượng: GLM-4.7 (358B) đa ngôn ngữ, AgentCPM cho agent thông minh, VibeVoice-ASR nhận diện giọng nói chất lượng cao, Qwen3 TTS, Step3-VL đa phương tiện, FLUX.2 Klein tạo ảnh, LTX-2 tạo video từ ảnh và Chroma (6B) đa dạng đa phương thức. Cập nhật mới nhất cho phát triển AI toàn diện.
    #AI #HuggingFace #MachineLearning #GLM4 #TTS #ASR #TextToImage #VideoGeneration #Multimodal #TríTuệNhânTạo #HọcMáy #XửLýNgônNgữ #NhậnDiệnGiọngNói #TạoẢnhAI #TạoVideoA

  11. Behind the scenes của AudioMuse-AI: phát triển phần mềm tạo playlist thông minh bằng học máy, tích hợp mô hình MSD Musicnn và CLAP để phân tích độ tương tự giữa bài hát. Đang tối ưu hóa CLAP thành phiên bản nhỏ hơn (80M → 8M tham số) để chạy hiệu quả trên máy đơn. Tự host, bảo mật, không phụ thuộc dịch vụ bên ngoài. Dự án mã nguồn mở, cảm ơn cộng đồng đã ủng hộ hơn 1000 sao trên GitHub! #AudioMuseAI #Selfhosted #MachineLearning #MusicTech #OpenSource #AI #HọcMáy #ÂmNhạc #CôngNghệ #MãNguồnMở

    htt

  12. Fine‑tune mô hình nhỏ để Text2SQL nhanh hơn! 🚀
    Dùng `distil‑cli` + Claude skill: tạo model, chuẩn bị dữ liệu, train, xuất `model.gguf` (2.2 GB) rồi `ollama create/run`. Kết quả: độ chính xác LLM‑as‑a‑Judge tăng từ 36 % → 74 % (gần bằng teacher) và ROUGE ~88 %. Ví dụ: câu hỏi “số ứng viên mỗi vị trí” → SQL chi tiết hơn. Demo: script Python đọc CSV → SQLite, hỏi “trung bình lương mỗi phòng ban”. #AI #MachineLearning #FineTuning #Ollama #Text2SQL #TríTuệNhânTạo #HọcMáy #TinhChỉnhMôHình #CôngNghệ

  13. 🕹️ Chạy mô hình ngôn ngữ trên “đồ cũ” siêu tiết kiệm! 🎮
    - Viết bigram char‑level trên CPU 6502 của NES, chỉ 2 KB RAM, trọng lượng < 1 KB, nhúng vào ROM hack Final Fantasy & Dragon Warrior để sinh tên fantasy.
    - Đưa inference vào thời gian biên dịch C++ bằng template metaprogramming; compiler tự tạo RNG và kết quả đã được bake sẵn trong binary, không tính toán khi chạy.

    #AI #MachineLearning #TríTuệNhânTạo #HọcMáy #NES #Cplusplus #MetaProgramming #LLM #ngôn_ngữ_mô_hình

    https://www.reddit

  14. Liên tục học (Continual Learning) trong AI 2026 thực sự nghĩa là gì? Cập nhật trọng số mô hình theo thời gian thật hay chỉ là hệ thống bộ nhớ ngoài + huấn luyện định kỳ? Mô hình như Opus 5.0 có được vá liên tục? Hay kiến trúc chỉ là retrieval + làm mịn offline? Phân biệt giữa "học thực sự" và "nhớ + cập nhật phần mềm" là then chốt cho tiến tới AGI. #ContinualLearning #AI #MachineLearning #TríTuệNhânTạo #HọcMáy #AGI

    reddit.com/r/singularity/comme

  15. Sparse nén mô hình fine-tuned và dataset thành delta từ bản gốc. Nén 14GB xuống 1.4GB (lossless) hoặc 50MB (tương đương LoRA), phục hồi trong 4 giây. Áp dụng sau khi training, phù hợp mọi mô hình đã huấn luyện. Hiệu quả cho AI y tế, tài chính, pháp lý. #AI #MachineLearning #FineTuning #ModelCompression #Sparse #TríTuệNhânTạo #HọcMáy #NénMôHình

    reddit.com/r/LocalLLaMA/commen

  16. Chia sẻ bài viết tương tác về Tokenization, Embeddings và Vector Search bằng Transformers.js. Tác giả dùng AI nhưng tập trung vào lab tương tác để học. Đây là tương lai giáo dục hay chỉ spam? #HọcMáy #AI #TechTutorial #InteractiveLearning #BàiHọc #CôngNghệ #AIEducation

    reddit.com/r/LocalLLaMA/commen

  17. Voice AI: TTS - Giving Your AI a Voice 🗣️🔊

    Chúng ta đã tìm hiểu về cách Voice AI nghe (ASR), hiểu (NLU), quyết định (Dialog Management), nhớ (Context) và viết (NLG). Giờ là bước cuối: làm cho nó nói - TTS (Text-to-Speech).

    Pipeline của TTS hoàn chỉnh vòng lặp Voice AI. Bài viết tiếp theo sẽ tổng kết toàn bộ hệ thống và chia sẻ những lỗi thực tế ảnh hưởng đến Voice AI trong môi trường sản xuất.

    #VoiceAI #TTS #TextToSpeech #AI #TríTuệNhânTạo #CôngNghệ #Tech #AIvoice #MachineLearning #HọcMáy

  18. Một dự án thú vị sử dụng AI! Người dùng đã kết hợp dự báo thời tiết cục bộ và Llama3.1 8B để chọn trang phục cho cả tuần. Hệ thống dùng thư viện meteostat dự đoán nhiệt độ, sau đó Llama3.1 gợi ý đồ mặc phù hợp, thậm chí phát ra báo thức mỗi sáng!

    #AI #Llama3_1 #WeatherPrediction #OutfitPicker #LocalLLaMA #TechProject
    #AIDựĐoán #DựBáoThờiTiết #ChọnTrangPhục #HọcMáy

    reddit.com/r/LocalLLaMA/commen

  19. Cộng đồng đang tìm kiếm công cụ benchmark tốt nhất cho các cổng AI LiteLLM và mô hình. Các tiêu chí quan trọng bao gồm TTFT, tốc độ xuất token, độ chính xác, và kiểm tra dưới áp lực. Bạn có biết công cụ "plug and play" nào không?

    #AI #Benchmarking #LiteLLM #LLM #Tools #ArtificialIntelligence #ĐánhGiáAI #CôngCụAI #HọcMáy

    reddit.com/r/LocalLLaMA/commen

  20. Việc giám sát các ứng dụng LLM và agent AI đòi hỏi một phương pháp mới gọi là "khả năng quan sát" (observability). Thay vì chỉ theo dõi hệ thống, cần giám sát toàn trình các quyết định, chất lượng suy luận và việc sử dụng công cụ của AI. Điều này giúp gỡ lỗi nhanh hơn, đảm bảo chất lượng và triển khai các hệ thống AI đáng tin cậy.

    #AI #LLM #Observability #MachineLearning #Developer #Technology #TríTuệNhânTạo #HọcMáy #CôngNghệ #LậpTrìnhViên #QuanSát

    dev.to/kuldeep_paul/ai-agent-o

  21. Hướng dẫn tinh chỉnh mô hình Qwen2.5-Coder-1.5B cho phân tích cảm xúc tiếng Trung. Có thể chạy trên Google Colab miễn phí trong 20-30 phút. Độ chính xác tăng từ 91,6% lên 97,8%. #AI #MachineLearning #Qwen2.5 #PhânTíchCảmXúc #GoogleColab #TinhChỉnhMôHình #TríTuệNhânTạo #HọcMáy

    i.redd.it/7xx856mftfzf1.png

  22. Hệ sinh thái LLaMA đang bùng nổ, nhưng đâu là mảnh ghép còn thiếu? Nhiều người cho rằng đó là các công cụ chuẩn bị và chú thích dữ liệu, vốn vẫn là một nút thắt cổ chai thủ công lớn cho việc tinh chỉnh mô hình. Bạn nghĩ sao?

    #LLaMA #AI #DataPrep #MachineLearning #HệSinhTháiLLaMA #DữLiệu #HọcMáy

    reddit.com/r/LocalLLaMA/commen