home.social

#dữliệu — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #dữliệu, aggregated by home.social.

  1. Meles – công cụ mã nguồn mở AGPL bằng Java cho thu thập & lưu trữ dữ liệu. Hỗ trợ nguồn đa dạng (serial, TCP, I2C), xử lý bằng script XML, tính toán lambda, gửi qua MQTT, lưu vào Postgres/SQLite, hiển thị Grafana, cảnh báo qua draw.io (email/matrix). Chưa có GUI, nhưng có thể điều khiển bằng telnet, matrix, email. #OpenSource #Meles #DataIngestion #DAQ #Java #IoT #MãNguồnMở #DữLiệu

    reddit.com/r/opensource/commen

  2. Mô hình AI nhỏ gọn (500MB) giúp ẩn danh thông tin cá nhân (PII) trong văn bản ngay trên thiết bị! 🛡️ Không cần gửi dữ liệu lên dịch vụ bên thứ ba, đảm bảo riêng tư. Dễ dàng tinh chỉnh cho ngôn ngữ khác (có ví dụ tiếng Tây Ban Nha) hoặc lĩnh vực chuyên biệt. Tuyệt vời để chia sẻ dữ liệu nhạy cảm một cách an toàn.

    #AI #Anonymization #Privacy #LocalProcessing #MãHoá #BảoMật #RiêngTư #DữLiệu

    reddit.com/r/LocalLLaMA/commen

  3. Quản lý nhà nước trên môi trường số đang lấy dữ liệu làm trung tâm, coi đây là "nguồn tài nguyên mới". Đề án phát triển ứng dụng dữ liệu dân cư, định danh và xác thực điện tử đã phát huy hiệu quả, góp phần vào công cuộc chuyển đổi số quốc gia.
    #ChuyểnĐổiSố #QuảnLýNhàNước #DữLiệu #KỷNguyênSố
    #DigitalTransformation #StateManagement #Data #DigitalEra

    vietnamnet.vn/quan-ly-nha-nuoc

  4. Hướng dẫn thu thập danh sách và giá du lịch thực tế: dùng residential proxies để mô phỏng vị trí địa lý, lấy giá cuối cùng, thuế, khuyến mãi từ Booking, Airbnb, Agoda… Kiến trúc: job → selector vùng → IP residential, Playwright/Puppeteer, xoay IP, giữ cookie. Kết quả: dữ liệu chính xác, phân tích giá theo khu vực, dự báo nhu cầu. #Tourism #Data #Tech #Proxy #Travel #DuLịch #DữLiệu #CôngNghệ

    dev.to/anna_6c67c00f5c3f536609

  5. Một ứng dụng mới không cần code để xử lý file CSV vừa ra mắt! Công cụ này giúp bạn dễ dàng làm sạch, biến đổi dữ liệu CSV bằng cách xây dựng các "pipeline" trực quan, không cần chạm vào dòng lệnh. Rất tiện lợi cho các đội vận hành, marketing, và nhà phân tích dữ liệu muốn đơn giản hóa quy trình ETL. Nhà phát triển đang tìm kiếm phản hồi để cải thiện sản phẩm.

    #NoCode #CSV #DataProcessing #SideProject #Tool
    #KhôngCode #XửLýDữLiệu #CSV #CôngCụMới #DữLiệu

    reddit.com/r/SideProject/comm

  6. Công cụ TableFirst giúp người dùng không chuyên mô tả bảng bằng tiếng Anh để truy xuất dữ liệu. Thử nghiệm trên BIRD-SQL Mini-Dev cho thấy: phát hiện bảng chính xác 84.2%; tạo SQL tự động đạt 60.6% (nhưng 85% có thể dùng sau sửa nhanh). TableFirst nhanh hơn, rẻ hơn, hỗ trợ công việc sơ khai. Đang tìm người dùng thử nghiệm beta!
    #TableFirst #AI #DataTool #BusinessIntelligence #DữLiệu #CôngCụAI

    reddit.com/r/SaaS/comments/1pe

  7. #TOON #JSON #TokenOptimization #DataFormats #LLM #AI #MachineLearning #Programming #Tech #JSON #TOON #TốiƯuToken #MôHìnhNgônNgữ #TríTuệNhânTạo #LậpTrình #CôngNghệ #DữLiệu

    **Tóm tắt:** Việc sử dụng TOON có thể tiết kiệm 20-35% token khi xử lý các mảng dữ liệu đồng nhất (danh sách người dùng, nhật ký), nhưng lại có thể tốn thêm 15-20% token với dữ liệu cấu trúc lồng ghép phức tạp hoặc đối tượng cấu hình. TOON hiệu quả với dữ liệu dạng bảng, trong khi JSON vẫn tối ưu hơn cho cấu trúc lồng ghép sâu

  8. #TOON #JSON #TokenOptimization #DataFormats #LLM #AI #MachineLearning #Programming #Tech #JSON #TOON #TốiƯuToken #MôHìnhNgônNgữ #TríTuệNhânTạo #LậpTrình #CôngNghệ #DữLiệu

    **Tóm tắt:** Việc sử dụng TOON có thể tiết kiệm 20-35% token khi xử lý các mảng dữ liệu đồng nhất (danh sách người dùng, nhật ký), nhưng lại có thể tốn thêm 15-20% token với dữ liệu cấu trúc lồng ghép phức tạp hoặc đối tượng cấu hình. TOON hiệu quả với dữ liệu dạng bảng, trong khi JSON vẫn tối ưu hơn cho cấu trúc lồng ghép sâu

  9. #TOON #JSON #TokenOptimization #DataFormats #LLM #AI #MachineLearning #Programming #Tech #JSON #TOON #TốiƯuToken #MôHìnhNgônNgữ #TríTuệNhânTạo #LậpTrình #CôngNghệ #DữLiệu

    **Tóm tắt:** Việc sử dụng TOON có thể tiết kiệm 20-35% token khi xử lý các mảng dữ liệu đồng nhất (danh sách người dùng, nhật ký), nhưng lại có thể tốn thêm 15-20% token với dữ liệu cấu trúc lồng ghép phức tạp hoặc đối tượng cấu hình. TOON hiệu quả với dữ liệu dạng bảng, trong khi JSON vẫn tối ưu hơn cho cấu trúc lồng ghép sâu

  10. #TOON #JSON #TokenOptimization #DataFormats #LLM #AI #MachineLearning #Programming #Tech #JSON #TOON #TốiƯuToken #MôHìnhNgônNgữ #TríTuệNhânTạo #LậpTrình #CôngNghệ #DữLiệu

    **Tóm tắt:** Việc sử dụng TOON có thể tiết kiệm 20-35% token khi xử lý các mảng dữ liệu đồng nhất (danh sách người dùng, nhật ký), nhưng lại có thể tốn thêm 15-20% token với dữ liệu cấu trúc lồng ghép phức tạp hoặc đối tượng cấu hình. TOON hiệu quả với dữ liệu dạng bảng, trong khi JSON vẫn tối ưu hơn cho cấu trúc lồng ghép sâu

  11. #TOON #JSON #TokenOptimization #DataFormats #LLM #AI #MachineLearning #Programming #Tech #JSON #TOON #TốiƯuToken #MôHìnhNgônNgữ #TríTuệNhânTạo #LậpTrình #CôngNghệ #DữLiệu

    **Tóm tắt:** Việc sử dụng TOON có thể tiết kiệm 20-35% token khi xử lý các mảng dữ liệu đồng nhất (danh sách người dùng, nhật ký), nhưng lại có thể tốn thêm 15-20% token với dữ liệu cấu trúc lồng ghép phức tạp hoặc đối tượng cấu hình. TOON hiệu quả với dữ liệu dạng bảng, trong khi JSON vẫn tối ưu hơn cho cấu trúc lồng ghép sâu

  12. Một người dùng đang tìm giải pháp tự lưu trữ kho ảnh/video khổng lồ của mình để không phải trả phí Google Drive. Anh ấy muốn có tính năng nhận diện khuôn mặt, sắp xếp tự động và công cụ loại bỏ trùng lặp, giống Google Photos nhưng tự host. Cân nhắc dùng PC cũ làm máy chủ.

    #SelfHosting #MediaManagement #FaceRecognition #HomeServer #DataManagement #TựLưuTrữ #QuảnLýẢnh #NhậnDiệnKhuônMặt #MáyChủGiaĐình #DữLiệu

    reddit.com/r/selfhosted/commen

  13. 🇻🇳 Sắp tới, các bộ, tỉnh sẽ rà soát, đánh giá và xếp hạng chất lượng các cơ sở dữ liệu (CSDL) trên toàn quốc. Bộ Công an chịu trách nhiệm thẩm định, công bố kết quả vào năm 2026, nhằm nâng cao tiêu chuẩn quản lý dữ liệu quốc gia. #CSDL #DữLiệu #ThẩmĐịnh #XếpHạng #Vietnam #Database #QualityAssessment #VietnamNet

    vietnamnet.vn/sap-danh-gia-xep

  14. Vấn đề dữ liệu UAT: Các công ty và nhà phát triển có gặp khó khăn với dữ liệu trong UAT không? Ví dụ, các bất thường và dữ liệu không chính xác trong môi trường kiểm thử, khiến việc kiểm thử trở nên khó khăn? Bạn có vấn đề gì không? Bởi vì mình có một điều gì đó đặc biệt dành cho các bạn-lite! 🫠
    #UAT #DữLiệu #Checker #DataTesting #TestingChallenges #VấnĐềKiểmThử #DữLiệuUAT

    reddit.com/r/SaaS/comments/1or

  15. Tôi đã xây dựng uAPI để chuyển đổi các trang web hỗn loạn thành hợp đồng JSON nhất quán mà bạn có thể tin cậy. uAPI cung cấp giao diện đọc ổn định cho web, trả về-envelope JSON nhất quán cho bất kỳ trang công khai nào được phép. #uAPI #JSON #HợpĐống #TrìnhDuyệt #WebScrapping #DataEngineering #MachineLearning #TrìnhXửLýDữLiệu #HọcMáy #CôngNghệ #TinHọc #TrangWeb #DữLiệu #KhoaHọcDữLiệu

    reddit.com/r/SideProject/comme

  16. Dữ liệu đã trở thành “tài sản chiến lược thứ 5” của nền kinh tế hiện đại—trái tim và máu của chuyển đổi số quốc gia, theo Giám đốc Trung tâm Dữ liệu Quốc gia Nguyễn Ngọc Cương. #Data #DigitalEconomy #Vietnam #Economy #Technology #DữLiệu #KinhTếSố #ChuyểnĐổiSố

    vietnamnet.vn/du-lieu-tro-than

  17. Việt Nam đang thúc đẩy mạnh mẽ quá trình chuyển đổi sang mô hình quản trị dựa trên dữ liệu và trí tuệ nhân tạo (AI).

    Theo Cục Chuyển đổi số quốc gia, "Khung kiến trúc tổng thể quốc gia số" sẽ là nền tảng chính, giúp hình thành một hạ tầng phân tích, dự báo và điều hành thông minh trên quy mô toàn quốc.

    #ChuyểnĐổiSố #TríTuệNhânTạo #QuảnTrịSố #DữLiệu #CôngNghệ #ViệtNam
    #DigitalTransformation #AI #DataDriven #Governance #Technology #Vietnam

    vietnamnet.vn/thuc-day-chuyen-

  18. Hệ sinh thái LLaMA đang bùng nổ, nhưng đâu là mảnh ghép còn thiếu? Nhiều người cho rằng đó là các công cụ chuẩn bị và chú thích dữ liệu, vốn vẫn là một nút thắt cổ chai thủ công lớn cho việc tinh chỉnh mô hình. Bạn nghĩ sao?

    #LLaMA #AI #DataPrep #MachineLearning #HệSinhTháiLLaMA #DữLiệu #HọcMáy

    reddit.com/r/LocalLLaMA/commen

  19. Một công cụ mới giúp tự động viết báo cáo về các tập dữ liệu, hỗ trợ xuất ra nhiều định dạng phổ biến như Word, LaTeX, hay Jupyter notebooks. Tiết kiệm thời gian cho các nhà phân tích dữ liệu!

    #DataScience #Automation #AI #Technology #DữLiệu #TựĐộngHóa #CôngNghệ

    speedylytics.com/