#tesseract_ocr — Public Fediverse posts on home.social

konsensor :mastodon: @[email protected] · 2026-03-01 · 13:41 UTC

@alsternerd Grandios! Das hat wunderbar geklappt! Vielen Dank! #Fedora #Tesseract_OCR #PaperWork #OpenPaperWork

#fedora #tesseract_ocr #paperwork #openpaperwork

konsensor :mastodon: @[email protected] · 2026-03-01 · 13:41 UTC

@alsternerd Grandios! Das hat wunderbar geklappt! Vielen Dank! #Fedora #Tesseract_OCR #PaperWork #OpenPaperWork

#fedora #tesseract_ocr #paperwork #openpaperwork

konsensor :mastodon: @[email protected] · 2026-03-01 · 13:41 UTC

@alsternerd Grandios! Das hat wunderbar geklappt! Vielen Dank! #Fedora #Tesseract_OCR #PaperWork #OpenPaperWork

#fedora #tesseract_ocr #paperwork #openpaperwork

konsensor :mastodon: @[email protected] · 2026-03-01 · 13:41 UTC

@alsternerd Grandios! Das hat wunderbar geklappt! Vielen Dank! #Fedora #Tesseract_OCR #PaperWork #OpenPaperWork

#openpaperwork #paperwork #tesseract_ocr #fedora

konsensor :mastodon: @[email protected] · 2026-03-01 · 13:41 UTC

@alsternerd Grandios! Das hat wunderbar geklappt! Vielen Dank! #Fedora #Tesseract_OCR #PaperWork #OpenPaperWork

#fedora #tesseract_ocr #paperwork #openpaperwork

Kir4ik52 :blobfoxnerd: @[email protected] · 2024-10-30 · 09:34 UTC

Pdf-extract-API

Проект предлагает инструмент для конвертации изображений и PDF-файлов в текст форматов Markdown и JSON с высокой точностью, включая поддержку табличных данных и математических формул.

Он основан на FastAPI, использует Celery для асинхронной обработки и Redis для кэширования результатов OCR, предоставляя различные стратегии для конвертации, такие как Marker, Surya-OCR и Tesseract, а также возможность удаления персонально идентифицируемой информации.

src: https://github.com/CatchTheTornado/pdf-extract-api

#blacktriangle #opensorce #github #OCR #tesseract_ocr #tesseract #markdown #pdf #fastapi #json #marker #Surya-OCR #Celery

#blacktriangle #opensorce #github #ocr #tesseract_ocr #tesseract

Kir4ik52 :blobfoxnerd: @[email protected] · 2024-10-30 · 09:34 UTC

Pdf-extract-API

Проект предлагает инструмент для конвертации изображений и PDF-файлов в текст форматов Markdown и JSON с высокой точностью, включая поддержку табличных данных и математических формул.

Он основан на FastAPI, использует Celery для асинхронной обработки и Redis для кэширования результатов OCR, предоставляя различные стратегии для конвертации, такие как Marker, Surya-OCR и Tesseract, а также возможность удаления персонально идентифицируемой информации.

src: https://github.com/CatchTheTornado/pdf-extract-api

#blacktriangle #opensorce #github #OCR #tesseract_ocr #tesseract #markdown #pdf #fastapi #json #marker #Surya-OCR #Celery

#blacktriangle #opensorce #github #ocr #tesseract_ocr #tesseract

Kir4ik52 :blobfoxnerd: @[email protected] · 2024-10-30 · 09:34 UTC

Pdf-extract-API

Проект предлагает инструмент для конвертации изображений и PDF-файлов в текст форматов Markdown и JSON с высокой точностью, включая поддержку табличных данных и математических формул.

Он основан на FastAPI, использует Celery для асинхронной обработки и Redis для кэширования результатов OCR, предоставляя различные стратегии для конвертации, такие как Marker, Surya-OCR и Tesseract, а также возможность удаления персонально идентифицируемой информации.

src: https://github.com/CatchTheTornado/pdf-extract-api

#blacktriangle #opensorce #github #OCR #tesseract_ocr #tesseract #markdown #pdf #fastapi #json #marker #Surya-OCR #Celery

#blacktriangle #opensorce #github #ocr #tesseract_ocr #tesseract

Kir4ik52 :blobfoxnerd: @[email protected] · 2024-10-30 · 09:34 UTC

Pdf-extract-API

Проект предлагает инструмент для конвертации изображений и PDF-файлов в текст форматов Markdown и JSON с высокой точностью, включая поддержку табличных данных и математических формул.

Он основан на FastAPI, использует Celery для асинхронной обработки и Redis для кэширования результатов OCR, предоставляя различные стратегии для конвертации, такие как Marker, Surya-OCR и Tesseract, а также возможность удаления персонально идентифицируемой информации.

src: https://github.com/CatchTheTornado/pdf-extract-api

#blacktriangle #opensorce #github #OCR #tesseract_ocr #tesseract #markdown #pdf #fastapi #json #marker #Surya-OCR #Celery

#celery #surya #marker #json #fastapi #pdf

Kir4ik52 :blobfoxnerd: @[email protected] · 2024-10-30 · 09:34 UTC

Pdf-extract-API

Проект предлагает инструмент для конвертации изображений и PDF-файлов в текст форматов Markdown и JSON с высокой точностью, включая поддержку табличных данных и математических формул.

Он основан на FastAPI, использует Celery для асинхронной обработки и Redis для кэширования результатов OCR, предоставляя различные стратегии для конвертации, такие как Marker, Surya-OCR и Tesseract, а также возможность удаления персонально идентифицируемой информации.

src: https://github.com/CatchTheTornado/pdf-extract-api

#blacktriangle #opensorce #github #OCR #tesseract_ocr #tesseract #markdown #pdf #fastapi #json #marker #Surya-OCR #Celery

#blacktriangle #opensorce #github #ocr #tesseract_ocr #tesseract

Habr @[email protected] · 2024-08-17 · 14:32 UTC

Создание плагина для распознавания текста на иврите: мой опыт и решения

Всем привет! Хочу поделиться недавним проектом, в котором я разрабатывал плагин для распознавания текста на иврите. Задача была непростая, особенно учитывая, что клиент уже пытался использовать Tesseract OCR, но точность распознавания оставляла желать лучшего. В этой статье расскажу о том, с какими трудностями я столкнулся и как их преодолел.

https://habr.com/ru/articles/836714/

#искусственный_интеллект #ocrтехнологии #распознавание_текста #paddleocr #tesseract_ocr #python #датасет #аугментация #easyocr

#easyocr #аугментация #датасет #python #tesseract_ocr #paddleocr

Habr @[email protected] · 2024-08-17 · 14:32 UTC

Создание плагина для распознавания текста на иврите: мой опыт и решения

Всем привет! Хочу поделиться недавним проектом, в котором я разрабатывал плагин для распознавания текста на иврите. Задача была непростая, особенно учитывая, что клиент уже пытался использовать Tesseract OCR, но точность распознавания оставляла желать лучшего. В этой статье расскажу о том, с какими трудностями я столкнулся и как их преодолел.

https://habr.com/ru/articles/836714/

#искусственный_интеллект #ocrтехнологии #распознавание_текста #paddleocr #tesseract_ocr #python #датасет #аугментация #easyocr

#easyocr #аугментация #датасет #python #tesseract_ocr #paddleocr

Habr @[email protected] · 2024-08-17 · 14:32 UTC

Создание плагина для распознавания текста на иврите: мой опыт и решения

Всем привет! Хочу поделиться недавним проектом, в котором я разрабатывал плагин для распознавания текста на иврите. Задача была непростая, особенно учитывая, что клиент уже пытался использовать Tesseract OCR, но точность распознавания оставляла желать лучшего. В этой статье расскажу о том, с какими трудностями я столкнулся и как их преодолел.

https://habr.com/ru/articles/836714/

#искусственный_интеллект #ocrтехнологии #распознавание_текста #paddleocr #tesseract_ocr #python #датасет #аугментация #easyocr

#искусственный_интеллект #ocrтехнологии #распознавание_текста #paddleocr #tesseract_ocr #python