home.social

#文件處理 — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #文件處理, aggregated by home.social.

  1. #開源分享 一款用於從各種文件中提取文本的工具:Kreuzberg,支持從 PDF、圖像、辦公文件等多種文件中提取文本

    智慧處理,可自動對掃描文件進行OCR,自動檢測文本文件的編碼

    支持強制對包含嵌入圖像或掃描內容的PDF進行OCR

    支持PDF、Word、PowerPoint、Excel、HTML、圖片等多種檔案格式

    專案地址: github.com/Goldziher/kreuzberg

    #文本提取 #文件處理 #Kreuzberg