#kiểmthửai — Public Fediverse posts
Live and recent posts from across the Fediverse tagged #kiểmthửai, aggregated by home.social.
-
Khi triển khai ứng dụng LLM, làm sao kiểm tra thay đổi model trước khi release?
Tác giả đang dùng cách thử thủ công (10-20 prompts → deploy → theo dõi → fix lỗi). AWS SageMaker shadow testing quá phức tạp. Câu hỏi cho cộng đồng:
1. Cách kiگاهی tra model mới hiệu quả?
2. Có công cụ replay traffic thực tế?
3. Thủ công đã đủ chưa?
Bạn có giải pháp nào? #LLM #AITesting #MachineLearning #AI #TríTuệNhânTạo #KiểmThửAI #HọcMáyhttps://www.reddit.com/r/LocalLLaMA/comments/1qr27hi/how_do_you_test_llm_mod
-
Bài test thực tế so sánh GLM 4.7 và Minimax M2.1 trong việc tạo kiểm thử e2e. Minimax M2.1 vượt trội về tốc độ và độ tin cậy (40 phút vs 70 phút không xong của GLM).
Đáng chú ý, GLM 4.7 dù không hoàn thành nhưng lại phát hiện lỗi thiết kế code, điều mà Minimax bỏ qua. Người dùng ưu tiên Minimax M2.1 cho hiệu suất, nhưng vẫn cân nhắc GLM làm backup cho các vấn đề sâu hơn.
#AI #LLM #GLM47 #MinimaxM21 #AITesting #TechReview #SoSanhAI #KiểmThửAI