#họcmay — Public Fediverse posts
Live and recent posts from across the Fediverse tagged #họcmay, aggregated by home.social.
-
SDPO: Tối ưu hóa Chính sách thông qua Tái chưng cất – phương pháp học tăng cường mới tận dụng phản hồi dạng văn bản (lỗi runtime, đánh giá) để chuyển tín hiệu phần thưởng thưa thành tín hiệu học dày đặc. Mô hình tự làm "thầy giáo" bằng cách điều chỉnh dự đoán dựa trên phản hồi, cải thiện hiệu suất 10× nhanh hơn, vết lập luận ngắn hơn 7×, đặc biệt hiệu quả với mô hình lớn.
#ReinforcementLearning #AI #MachineLearning #SDPO #NLP #HọcMáy #AIResearch #TựHọc
-
🔔 Ra mắt BULaMU‑Dream – mô hình text‑to‑image đầu tiên thế giới được huấn luyện từ đầu cho ngôn ngữ châu Phi. Dự án mở nguồn trên HuggingFace, chi tiết kỹ thuật có trên Zenodo. Hãy khám phá khả năng sáng tạo mới! #AI #MachineLearning #TextToImage #AfricanLanguage #DeepLearning #TríTuệNhânTạo #HọcMáy #NgônNgữChâuPhi
-
Mô hình AI tạo ảnh từ văn bản đầu tiên hỗ trợ ngôn ngữ châu Phi: BULaMU-Dream, hiện đã có thể tải về trên Hugging Face. Được huấn luyện từ đầu với ngôn ngữ bản địa châu Phi, mở đường cho đa dạng hóa AI. #TextToImage #AI #MachineLearning #BULaMU_Dream #NgônNgữChâuPhi #TríTuệNhânTạo #HọcMáy #CôngNghệAI
https://www.reddit.com/r/LocalLLaMA/comments/1qt497v/the_first_text_to_image_model_for_an_african/
-
🚀 Đánh bại GPT-2 với chi phí dưới $100! Andrej Karpathy chia sẻ hành trình nanochat - chỉ 3 giờ huấn luyện trên 8×H100 đã vượt qua GPT-2 trong benchmark CORE. Bài viết tiết lộ chi tiết kiến trúc, tối ưu hóa và script để tái tạo kết quả.
#AI #MachineLearning #TríTuệNhânTạo #HọcMáy #NanoChat #GPT2
https://www.reddit.com/r/LocalLLaMA/comments/1qsj8x4/beating_gpt2_for_100_the_nanochat_journey/
-
Cuốn sổ tay AI cần biết 2024: NLP, LLM, RAG, Agentic AI... Cập nhật công cụ và mô hình hàng đầu như GPT-4o, Llama 3, Stable Diffusion. Từ AI cơ bản đến ứng dụng nâng cao, giúp bạn theo kịp làn sóng công nghệ. #AI #MachineLearning #Technology #TríTuệNhânTạo #HọcMáy #CôngNghệ
https://dev.to/ms_74/to-those-who-are-left-behind-in-the-ai-rush-45f5
-
**Tìm kiếm mô hình 70B tốt cho roleplay và sáng tạo**
Người dùng mô hình 70B chia sẻ kinh nghiệm và đề xuất các phiên bản như L3.3-70B, Apocrypha-L3.3, Anubis-70B, v1.1/v1.2, MS-Nevoria. Một số mô tả: "điên rồ nhưng ngẫu nhiên", "ý tưởng độc đáo". Có gợi ý nào hay không? #AI #MôHình70B #Roleplay #SángTạo #HọcMáy #LLM #TechVN #70BModels #AIExperimenthttps://www.reddit.com/r/LocalLLaMA/comments/1qrasty/70b_models/
-
Dự án chuyển Chronos Bolt (mô hình thời gian) và T5 sang NPU di động đã được chia sẻ code thực thi, mở ra khả năng chạy inference AI hiệu năng cao trên thiết bị nhúng. #AI #NPU #MobileAI #ChronosBolt #T5 #MachineLearning #HọcMáy #TríTuệNhânTạo
-
Dự án chuyển Chronos Bolt (mô hình thời gian) và T5 sang NPU di động đã được chia sẻ code thực thi, mở ra khả năng chạy inference AI hiệu năng cao trên thiết bị nhúng. #AI #NPU #MobileAI #ChronosBolt #T5 #MachineLearning #HọcMáy #TríTuệNhânTạo
-
Dự án chuyển Chronos Bolt (mô hình thời gian) và T5 sang NPU di động đã được chia sẻ code thực thi, mở ra khả năng chạy inference AI hiệu năng cao trên thiết bị nhúng. #AI #NPU #MobileAI #ChronosBolt #T5 #MachineLearning #HọcMáy #TríTuệNhânTạo
-
Thảo luận về sync, async và event-driven trong yêu cầu AI trong sản xuất thực tế. Làm thế nào để xử lý các cuộc gọi AI dài hạn hoặc phát trực tuyến? #AI #TríTuệNhânTạo #LậpTrình #Async #EventDriven #SảnXuấtThựcTế #MachineLearning #HọcMáy
https://www.reddit.com/r/programming/comments/1qoimgd/discussion_sync_vs_async_vs_eventdriven_ai/
-
Tuần này Hugging Face ra mắt nhiều mô hình AI ấn tượng: GLM-4.7 (358B) đa ngôn ngữ, AgentCPM cho agent thông minh, VibeVoice-ASR nhận diện giọng nói chất lượng cao, Qwen3 TTS, Step3-VL đa phương tiện, FLUX.2 Klein tạo ảnh, LTX-2 tạo video từ ảnh và Chroma (6B) đa dạng đa phương thức. Cập nhật mới nhất cho phát triển AI toàn diện.
#AI #HuggingFace #MachineLearning #GLM4 #TTS #ASR #TextToImage #VideoGeneration #Multimodal #TríTuệNhânTạo #HọcMáy #XửLýNgônNgữ #NhậnDiệnGiọngNói #TạoẢnhAI #TạoVideoA -
Behind the scenes của AudioMuse-AI: phát triển phần mềm tạo playlist thông minh bằng học máy, tích hợp mô hình MSD Musicnn và CLAP để phân tích độ tương tự giữa bài hát. Đang tối ưu hóa CLAP thành phiên bản nhỏ hơn (80M → 8M tham số) để chạy hiệu quả trên máy đơn. Tự host, bảo mật, không phụ thuộc dịch vụ bên ngoài. Dự án mã nguồn mở, cảm ơn cộng đồng đã ủng hộ hơn 1000 sao trên GitHub! #AudioMuseAI #Selfhosted #MachineLearning #MusicTech #OpenSource #AI #HọcMáy #ÂmNhạc #CôngNghệ #MãNguồnMở
htt
-
Fine‑tune mô hình nhỏ để Text2SQL nhanh hơn! 🚀
Dùng `distil‑cli` + Claude skill: tạo model, chuẩn bị dữ liệu, train, xuất `model.gguf` (2.2 GB) rồi `ollama create/run`. Kết quả: độ chính xác LLM‑as‑a‑Judge tăng từ 36 % → 74 % (gần bằng teacher) và ROUGE ~88 %. Ví dụ: câu hỏi “số ứng viên mỗi vị trí” → SQL chi tiết hơn. Demo: script Python đọc CSV → SQLite, hỏi “trung bình lương mỗi phòng ban”. #AI #MachineLearning #FineTuning #Ollama #Text2SQL #TríTuệNhânTạo #HọcMáy #TinhChỉnhMôHình #CôngNghệ -
🕹️ Chạy mô hình ngôn ngữ trên “đồ cũ” siêu tiết kiệm! 🎮
- Viết bigram char‑level trên CPU 6502 của NES, chỉ 2 KB RAM, trọng lượng < 1 KB, nhúng vào ROM hack Final Fantasy & Dragon Warrior để sinh tên fantasy.
- Đưa inference vào thời gian biên dịch C++ bằng template metaprogramming; compiler tự tạo RNG và kết quả đã được bake sẵn trong binary, không tính toán khi chạy.#AI #MachineLearning #TríTuệNhânTạo #HọcMáy #NES #Cplusplus #MetaProgramming #LLM #ngôn_ngữ_mô_hình
https://www.reddit
-
Liên tục học (Continual Learning) trong AI 2026 thực sự nghĩa là gì? Cập nhật trọng số mô hình theo thời gian thật hay chỉ là hệ thống bộ nhớ ngoài + huấn luyện định kỳ? Mô hình như Opus 5.0 có được vá liên tục? Hay kiến trúc chỉ là retrieval + làm mịn offline? Phân biệt giữa "học thực sự" và "nhớ + cập nhật phần mềm" là then chốt cho tiến tới AGI. #ContinualLearning #AI #MachineLearning #TríTuệNhânTạo #HọcMáy #AGI
https://www.reddit.com/r/singularity/comments/1q6attw/continual_learning_in_2026
-
Sparse nén mô hình fine-tuned và dataset thành delta từ bản gốc. Nén 14GB xuống 1.4GB (lossless) hoặc 50MB (tương đương LoRA), phục hồi trong 4 giây. Áp dụng sau khi training, phù hợp mọi mô hình đã huấn luyện. Hiệu quả cho AI y tế, tài chính, pháp lý. #AI #MachineLearning #FineTuning #ModelCompression #Sparse #TríTuệNhânTạo #HọcMáy #NénMôHình
https://www.reddit.com/r/LocalLLaMA/comments/1q47kyt/delta_compression_for_finetuned_models_and/
-
Kiểm toán quyết định của AI: Một kỹ thuật mới sử dụng đồ thị ngữ cảnh giúp chúng ta hiểu được quá trình suy luận của AI, khiến nó trở nên minh bạch hơn.
#AI #ExplainableAI #Auditing #ContextGraph #Technology #MachineLearning #AIgiảithích #Kiểmtoán #Côngnghệ #Họcmáy #TintứcAI
https://www.reddit.com/r/LocalLLaMA/comments/1q1zkij/queryable_context_graph_to_audit_ai_decision/
-
Nhân viên Anthropic dự đoán Continual Learning sẽ "được giải quyết một cách hài lòng" vào năm 2026. #ContinualLearning #HọcTậpLiênTục #TríTuệNhânTạo #AI #Anthropic #Year2026 #Năm2026 #MachineLearning #HọcMáy
https://www.reddit.com/r/singularity/comments/1pu9pof/anthropics_sholto_douglas_predicts_continual/
-
Chia sẻ bài viết tương tác về Tokenization, Embeddings và Vector Search bằng Transformers.js. Tác giả dùng AI nhưng tập trung vào lab tương tác để học. Đây là tương lai giáo dục hay chỉ spam? #HọcMáy #AI #TechTutorial #InteractiveLearning #BàiHọc #CôngNghệ #AIEducation
https://www.reddit.com/r/LocalLLaMA/comments/1pu8zj3/i_wrote_an_interactive_blog_post_teaching_how/
-
Voice AI: TTS - Giving Your AI a Voice 🗣️🔊
Chúng ta đã tìm hiểu về cách Voice AI nghe (ASR), hiểu (NLU), quyết định (Dialog Management), nhớ (Context) và viết (NLG). Giờ là bước cuối: làm cho nó nói - TTS (Text-to-Speech).
Pipeline của TTS hoàn chỉnh vòng lặp Voice AI. Bài viết tiếp theo sẽ tổng kết toàn bộ hệ thống và chia sẻ những lỗi thực tế ảnh hưởng đến Voice AI trong môi trường sản xuất.
#VoiceAI #TTS #TextToSpeech #AI #TríTuệNhânTạo #CôngNghệ #Tech #AIvoice #MachineLearning #HọcMáy
-
Một dự án thú vị sử dụng AI! Người dùng đã kết hợp dự báo thời tiết cục bộ và Llama3.1 8B để chọn trang phục cho cả tuần. Hệ thống dùng thư viện meteostat dự đoán nhiệt độ, sau đó Llama3.1 gợi ý đồ mặc phù hợp, thậm chí phát ra báo thức mỗi sáng!
#AI #Llama3_1 #WeatherPrediction #OutfitPicker #LocalLLaMA #TechProject
#AIDựĐoán #DựBáoThờiTiết #ChọnTrangPhục #HọcMáyhttps://www.reddit.com/r/LocalLLaMA/comments/1pemqji/i_made_this_video_for_a_project_where_i_used_a/
-
Cộng đồng đang tìm kiếm công cụ benchmark tốt nhất cho các cổng AI LiteLLM và mô hình. Các tiêu chí quan trọng bao gồm TTFT, tốc độ xuất token, độ chính xác, và kiểm tra dưới áp lực. Bạn có biết công cụ "plug and play" nào không?
#AI #Benchmarking #LiteLLM #LLM #Tools #ArtificialIntelligence #ĐánhGiáAI #CôngCụAI #HọcMáy
https://www.reddit.com/r/LocalLLaMA/comments/1pduptm/best_current_benchmarking_tool/
-
Việc giám sát các ứng dụng LLM và agent AI đòi hỏi một phương pháp mới gọi là "khả năng quan sát" (observability). Thay vì chỉ theo dõi hệ thống, cần giám sát toàn trình các quyết định, chất lượng suy luận và việc sử dụng công cụ của AI. Điều này giúp gỡ lỗi nhanh hơn, đảm bảo chất lượng và triển khai các hệ thống AI đáng tin cậy.
#AI #LLM #Observability #MachineLearning #Developer #Technology #TríTuệNhânTạo #HọcMáy #CôngNghệ #LậpTrìnhViên #QuanSát
-
So sánh GLM-4.6 IQ2_M và GLM-4.6-REAP-268B Q2_K_XL: Hai phương pháp nén khác nhau, một giảm chất lượng toàn bộ mô hình và một loại bỏ cấu trúc nhất định. #GLM #AI #MachineLearning #MôHìnhNén #TríTuệNhânTạo #HọcMáy #NénMôHình #PhươngPhápNén #English: #GLM #AI #MachineLearning #ModelCompression #ArtificialIntelligence
-
Hướng dẫn tinh chỉnh mô hình Qwen2.5-Coder-1.5B cho phân tích cảm xúc tiếng Trung. Có thể chạy trên Google Colab miễn phí trong 20-30 phút. Độ chính xác tăng từ 91,6% lên 97,8%. #AI #MachineLearning #Qwen2.5 #PhânTíchCảmXúc #GoogleColab #TinhChỉnhMôHình #TríTuệNhânTạo #HọcMáy
-
Ra mắt TorchTL, một thư viện tối giản cho vòng lặp huấn luyện PyTorch. Thiết kế nhỏ gọn, không phụ thuộc và mở rộng trong tương lai. #TorchTL #PyTorch #MachineLearning #HọcMáy #ThưViệnPython #PyTorchLightning
-
Hệ sinh thái LLaMA đang bùng nổ, nhưng đâu là mảnh ghép còn thiếu? Nhiều người cho rằng đó là các công cụ chuẩn bị và chú thích dữ liệu, vốn vẫn là một nút thắt cổ chai thủ công lớn cho việc tinh chỉnh mô hình. Bạn nghĩ sao?
#LLaMA #AI #DataPrep #MachineLearning #HệSinhTháiLLaMA #DữLiệu #HọcMáy
https://www.reddit.com/r/LocalLLaMA/comments/1o5dh3v/whats_the_missing_piece_in_the_llama_ecosystem/