#ocrтехнологии — Public Fediverse posts on home.social

Habr @[email protected] · 2026-05-11 · 16:02 UTC

Извлечение параметров из 2D-чертежей: 6 YOLO-моделей, кастомный OCR и стрелочная логика

PDF‑чертёж кажется простым документом, пока не нужно автоматически вытащить из него всё, что влияет на стоимость изготовления детали : габариты, диаметры, резьбы, квалитеты, шероховатости, материал, массу и тип детали. Мы собрали для этого пайплайн из детекции, OCR и инженерной логики: научили систему находить проекции, отделять контур детали от служебных линий, связывать стрелки с размерами и превращать чертёж в JSON для калькулятора стоимости. В статье разбираем архитектуру решения, узкие места и приёмы, которые реально сработали на производственных чертежах. Читать кейс

https://habr.com/ru/articles/1033824/

#ocr #ocrтехнологии #детекция_текста #распознавание_документов #машинное_зрение #компьютерное_зрение #обработка_изображений #инженерная_оптимизация

#инженерная_оптимизация #обработка_изображений #компьютерное_зрение #машинное_зрение #распознавание_документов #детекция_текста

Habr @[email protected] · 2026-05-11 · 16:02 UTC

Извлечение параметров из 2D-чертежей: 6 YOLO-моделей, кастомный OCR и стрелочная логика

PDF‑чертёж кажется простым документом, пока не нужно автоматически вытащить из него всё, что влияет на стоимость изготовления детали : габариты, диаметры, резьбы, квалитеты, шероховатости, материал, массу и тип детали. Мы собрали для этого пайплайн из детекции, OCR и инженерной логики: научили систему находить проекции, отделять контур детали от служебных линий, связывать стрелки с размерами и превращать чертёж в JSON для калькулятора стоимости. В статье разбираем архитектуру решения, узкие места и приёмы, которые реально сработали на производственных чертежах. Читать кейс

https://habr.com/ru/articles/1033824/

#ocr #ocrтехнологии #детекция_текста #распознавание_документов #машинное_зрение #компьютерное_зрение #обработка_изображений #инженерная_оптимизация

#инженерная_оптимизация #обработка_изображений #компьютерное_зрение #машинное_зрение #распознавание_документов #детекция_текста

Habr @[email protected] · 2026-05-11 · 16:02 UTC

Извлечение параметров из 2D-чертежей: 6 YOLO-моделей, кастомный OCR и стрелочная логика

PDF‑чертёж кажется простым документом, пока не нужно автоматически вытащить из него всё, что влияет на стоимость изготовления детали : габариты, диаметры, резьбы, квалитеты, шероховатости, материал, массу и тип детали. Мы собрали для этого пайплайн из детекции, OCR и инженерной логики: научили систему находить проекции, отделять контур детали от служебных линий, связывать стрелки с размерами и превращать чертёж в JSON для калькулятора стоимости. В статье разбираем архитектуру решения, узкие места и приёмы, которые реально сработали на производственных чертежах. Читать кейс

https://habr.com/ru/articles/1033824/

#ocr #ocrтехнологии #детекция_текста #распознавание_документов #машинное_зрение #компьютерное_зрение #обработка_изображений #инженерная_оптимизация

#инженерная_оптимизация #обработка_изображений #компьютерное_зрение #машинное_зрение #распознавание_документов #детекция_текста

Habr @[email protected] · 2026-05-11 · 16:02 UTC

Извлечение параметров из 2D-чертежей: 6 YOLO-моделей, кастомный OCR и стрелочная логика

PDF‑чертёж кажется простым документом, пока не нужно автоматически вытащить из него всё, что влияет на стоимость изготовления детали : габариты, диаметры, резьбы, квалитеты, шероховатости, материал, массу и тип детали. Мы собрали для этого пайплайн из детекции, OCR и инженерной логики: научили систему находить проекции, отделять контур детали от служебных линий, связывать стрелки с размерами и превращать чертёж в JSON для калькулятора стоимости. В статье разбираем архитектуру решения, узкие места и приёмы, которые реально сработали на производственных чертежах. Читать кейс

https://habr.com/ru/articles/1033824/

#ocr #ocrтехнологии #детекция_текста #распознавание_документов #машинное_зрение #компьютерное_зрение #обработка_изображений #инженерная_оптимизация

#ocr #ocrтехнологии #детекция_текста #распознавание_документов #машинное_зрение #компьютерное_зрение

Habr @[email protected] · 2026-05-05 · 12:02 UTC

OCR в кармане: как HunyuanOCR на 1B параметров потеснил гигантов в задачах парсинга документов

Всем привет! Меня зовут Артем, я Data Scientist в компании Raft Digital Solutions . В этой статье расскажу про свой опыт работы с HunyuanOCR end-to-end моделью от Tencent для распознавания текста на 1B параметров. Несмотря на громкие заявления о «SOTA-результатах» и компактности, в публичных обзорах практически не описано, как эта модель ведет себя в реальных задачах: с чем приходится столкнуться при настройке окружения, почему она может уйти в бесконечное зацикливание и как заставить её эффективно парсить сложные таблицы на обычном «железе». Поделюсь результатами своих экспериментов, покажу боевые промпты и объясню, в каких сценариях этот OCR-инструмент реально помогает экономить время, а где лучше даже не пытаться его использовать.

https://habr.com/ru/companies/raft/articles/1031684/

#ocr #document #ocrтехнологии #ocr_распознавание_документов #document_parsing #распознавание_текста #обработка_документов #таблицы #сканы #imagetotext

#imagetotext #сканы #таблицы #обработка_документов #распознавание_текста #document_parsing

Habr @[email protected] · 2026-05-05 · 12:02 UTC

OCR в кармане: как HunyuanOCR на 1B параметров потеснил гигантов в задачах парсинга документов

Всем привет! Меня зовут Артем, я Data Scientist в компании Raft Digital Solutions . В этой статье расскажу про свой опыт работы с HunyuanOCR end-to-end моделью от Tencent для распознавания текста на 1B параметров. Несмотря на громкие заявления о «SOTA-результатах» и компактности, в публичных обзорах практически не описано, как эта модель ведет себя в реальных задачах: с чем приходится столкнуться при настройке окружения, почему она может уйти в бесконечное зацикливание и как заставить её эффективно парсить сложные таблицы на обычном «железе». Поделюсь результатами своих экспериментов, покажу боевые промпты и объясню, в каких сценариях этот OCR-инструмент реально помогает экономить время, а где лучше даже не пытаться его использовать.

https://habr.com/ru/companies/raft/articles/1031684/

#ocr #document #ocrтехнологии #ocr_распознавание_документов #document_parsing #распознавание_текста #обработка_документов #таблицы #сканы #imagetotext

#imagetotext #сканы #таблицы #обработка_документов #распознавание_текста #document_parsing

Habr @[email protected] · 2026-05-05 · 12:02 UTC

OCR в кармане: как HunyuanOCR на 1B параметров потеснил гигантов в задачах парсинга документов

Всем привет! Меня зовут Артем, я Data Scientist в компании Raft Digital Solutions . В этой статье расскажу про свой опыт работы с HunyuanOCR end-to-end моделью от Tencent для распознавания текста на 1B параметров. Несмотря на громкие заявления о «SOTA-результатах» и компактности, в публичных обзорах практически не описано, как эта модель ведет себя в реальных задачах: с чем приходится столкнуться при настройке окружения, почему она может уйти в бесконечное зацикливание и как заставить её эффективно парсить сложные таблицы на обычном «железе». Поделюсь результатами своих экспериментов, покажу боевые промпты и объясню, в каких сценариях этот OCR-инструмент реально помогает экономить время, а где лучше даже не пытаться его использовать.

https://habr.com/ru/companies/raft/articles/1031684/

#ocr #document #ocrтехнологии #ocr_распознавание_документов #document_parsing #распознавание_текста #обработка_документов #таблицы #сканы #imagetotext

#imagetotext #сканы #таблицы #обработка_документов #распознавание_текста #document_parsing

Habr @[email protected] · 2026-05-05 · 12:02 UTC

OCR в кармане: как HunyuanOCR на 1B параметров потеснил гигантов в задачах парсинга документов

Всем привет! Меня зовут Артем, я Data Scientist в компании Raft Digital Solutions . В этой статье расскажу про свой опыт работы с HunyuanOCR end-to-end моделью от Tencent для распознавания текста на 1B параметров. Несмотря на громкие заявления о «SOTA-результатах» и компактности, в публичных обзорах практически не описано, как эта модель ведет себя в реальных задачах: с чем приходится столкнуться при настройке окружения, почему она может уйти в бесконечное зацикливание и как заставить её эффективно парсить сложные таблицы на обычном «железе». Поделюсь результатами своих экспериментов, покажу боевые промпты и объясню, в каких сценариях этот OCR-инструмент реально помогает экономить время, а где лучше даже не пытаться его использовать.

https://habr.com/ru/companies/raft/articles/1031684/

#ocr #document #ocrтехнологии #ocr_распознавание_документов #document_parsing #распознавание_текста #обработка_документов #таблицы #сканы #imagetotext

#ocr #document #ocrтехнологии #ocr_распознавание_документов #document_parsing #распознавание_текста

Habr @[email protected] · 2026-04-10 · 13:42 UTC

Как гибрид IDP и VLM экономит миллионы на верификации данных

Последние 2 года мы в Content AI активно тестируем Vision Language Models (VLM) для обработки документов. Модели вроде Qwen2.5-VL или Gemini 2.5 отлично работают с простыми формами — чеками, типовыми договорами. Но на документах со сложными фонами, многоуровневыми таблицами или нестандартной версткой VLM часто галлюцинирует, теряет строки и путается в реквизитах. В одной из предыдущих статей мы пришли к выводу, что будущее за комбинированным подходом , когда VLM усиливает IDP-решения. В этот раз мы проверили гипотезу: пусть VLM не распознает документ с нуля, а проверяет черновик из IDP-системы и исправляет ошибки, опираясь на исходное изображение. Базовым OCR движком выступила наша платформа ContentCapture. Практическая цель эксперимента — автоматизировать верификацию документов. Сейчас в крупных компаниях сотни операторов вручную сверяют распознанные данные с оригиналами.

https://habr.com/ru/companies/contentai/articles/1021880/

#idp #llmмодели #vlm #ocr #ocrтехнологии

#ocrтехнологии #ocr #vlm #llmмодели #idp

Habr @[email protected] · 2026-04-10 · 13:42 UTC

Как гибрид IDP и VLM экономит миллионы на верификации данных

Последние 2 года мы в Content AI активно тестируем Vision Language Models (VLM) для обработки документов. Модели вроде Qwen2.5-VL или Gemini 2.5 отлично работают с простыми формами — чеками, типовыми договорами. Но на документах со сложными фонами, многоуровневыми таблицами или нестандартной версткой VLM часто галлюцинирует, теряет строки и путается в реквизитах. В одной из предыдущих статей мы пришли к выводу, что будущее за комбинированным подходом , когда VLM усиливает IDP-решения. В этот раз мы проверили гипотезу: пусть VLM не распознает документ с нуля, а проверяет черновик из IDP-системы и исправляет ошибки, опираясь на исходное изображение. Базовым OCR движком выступила наша платформа ContentCapture. Практическая цель эксперимента — автоматизировать верификацию документов. Сейчас в крупных компаниях сотни операторов вручную сверяют распознанные данные с оригиналами.

https://habr.com/ru/companies/contentai/articles/1021880/

#idp #llmмодели #vlm #ocr #ocrтехнологии

#ocrтехнологии #ocr #vlm #llmмодели #idp

Habr @[email protected] · 2026-04-10 · 13:42 UTC

Как гибрид IDP и VLM экономит миллионы на верификации данных

Последние 2 года мы в Content AI активно тестируем Vision Language Models (VLM) для обработки документов. Модели вроде Qwen2.5-VL или Gemini 2.5 отлично работают с простыми формами — чеками, типовыми договорами. Но на документах со сложными фонами, многоуровневыми таблицами или нестандартной версткой VLM часто галлюцинирует, теряет строки и путается в реквизитах. В одной из предыдущих статей мы пришли к выводу, что будущее за комбинированным подходом , когда VLM усиливает IDP-решения. В этот раз мы проверили гипотезу: пусть VLM не распознает документ с нуля, а проверяет черновик из IDP-системы и исправляет ошибки, опираясь на исходное изображение. Базовым OCR движком выступила наша платформа ContentCapture. Практическая цель эксперимента — автоматизировать верификацию документов. Сейчас в крупных компаниях сотни операторов вручную сверяют распознанные данные с оригиналами.

https://habr.com/ru/companies/contentai/articles/1021880/

#idp #llmмодели #vlm #ocr #ocrтехнологии

#ocrтехнологии #ocr #vlm #llmмодели #idp

Habr @[email protected] · 2026-04-10 · 13:42 UTC

Как гибрид IDP и VLM экономит миллионы на верификации данных

Последние 2 года мы в Content AI активно тестируем Vision Language Models (VLM) для обработки документов. Модели вроде Qwen2.5-VL или Gemini 2.5 отлично работают с простыми формами — чеками, типовыми договорами. Но на документах со сложными фонами, многоуровневыми таблицами или нестандартной версткой VLM часто галлюцинирует, теряет строки и путается в реквизитах. В одной из предыдущих статей мы пришли к выводу, что будущее за комбинированным подходом , когда VLM усиливает IDP-решения. В этот раз мы проверили гипотезу: пусть VLM не распознает документ с нуля, а проверяет черновик из IDP-системы и исправляет ошибки, опираясь на исходное изображение. Базовым OCR движком выступила наша платформа ContentCapture. Практическая цель эксперимента — автоматизировать верификацию документов. Сейчас в крупных компаниях сотни операторов вручную сверяют распознанные данные с оригиналами.

https://habr.com/ru/companies/contentai/articles/1021880/

#idp #llmмодели #vlm #ocr #ocrтехнологии

Habr @[email protected] · 2026-02-24 · 15:42 UTC

Стопроцентное распознавание

У истории про « элитный вайбкодинг », вызвавшей заметный интерес широких айтишных масс, есть не менее интересная предыстория. Проектному управлению посвящается.

https://habr.com/ru/articles/1003178/

#ocr #ocrтехнологии #управление_проектами #проектное_управление #проектное_планирование #проектное_финансирование

#проектное_финансирование #проектное_планирование #проектное_управление #управление_проектами #ocrтехнологии #ocr

Habr @[email protected] · 2026-02-06 · 12:22 UTC

Классический IDP и VLM в обработке документов: почему выигрывает комбинация подходов

В прошлых материалах мы уже рассказывали о том, как мультимодальные модели (VLM) справляются с извлечением данных из финансовых документов, и показывали, что в ряде сценариев они могут конкурировать с оптимизированными классическими IDP-решениями. Однако мы решили не ограничиваться одним типом документов и продолжили исследование, сравнив технологии на широком спектре материалов. В пул вошли сканы высокого качества и фотографии со сложным фоном, структурированные табличные формы и документы с элементами рукописного текста, русскоязычные и англоязычные тексты. Сегодня мы готовы поделиться сводными итогами.

https://habr.com/ru/companies/contentai/articles/993628/

#IDP #llmмодели #vlm #ocrтехнологии #ocr

#ocr #ocrтехнологии #vlm #llmмодели #idp

Habr @[email protected] · 2025-10-29 · 12:22 UTC

Как я собрал AI-ассистента для отца с больным сердцем: Tool-Calling RAG Pipeline на GPT-4o-mini без LangChain

Мой отец — человек, переживший несколько сложнейших операций на сердце. Жизнь с хроническим заболеванием — это бесконечный поток анализов, заключений и схем приёма лекарств. Находясь далеко (я живу во Вьетнаме), я постоянно волновался: не забудет ли он про дозу, правильно ли понял назначение, задал ли все нужные вопросы врачу? Мне нужен был не просто бот-напоминалка, а второй пилот — умный, конфиденциальный и мультимодальный AI-Кардиолог . Ассистент, который знает его анамнез наизусть, понимает голосовые команды и может «прочитать» фотографию свежего анализа. Я решил собрать полноценный автономный агент с возможностью вызова внешних инструментов ( Tool‑Calling ) и локальной базой знаний ( RAG ), но без использования громоздких фреймворков вроде LangChain или LlamaIndex.

https://habr.com/ru/articles/961280/

#ai #rag #tool_calling #python #telegrambot #gpt4o_mini #chromadb #ocrтехнологии #медицина #llm

#llm #медицина #ocrтехнологии #chromadb #gpt4o_mini #telegrambot

Habr @[email protected] · 2025-09-22 · 04:32 UTC

End-to-end вместо трёх костылей: как мы обошли OCR и выиграли по скорости и точности

Ребята, вы когда-нибудь сталкивались с тем, что ваш шикарный AI-пайплайн для обработки документов спотыкается на самом простом — на чтении текста с картинки? OCR выдает абракадабру, цифры перепутаны, а дальше по цепочке летит вся ваша безупречная логика. Знакомо? У нас была точно такая же боль.

https://habr.com/ru/companies/datafeel/articles/948380/

#ml #ai #ocr #ocrтехнологии #qa #business #business_model #data #nlp #llm

#llm #nlp #data #business_model #business #qa

Habr @[email protected] · 2025-07-03 · 19:32 UTC

Как мы научили нейросети читать паспорта: история борьбы с бликами, водяными знаками и кривыми фото

Привет, Хабр! Если вы когда-либо сталкивались с автоматическим распознаванием документов, то знаете, насколько сложно работать с документами удостоверяющими личность (ID-документами). Хотя, казалось бы, что может быть проще, чем распознать фото паспорта, но на практике это может вызывать сложности у OCR-алгоритмов. Ведь паспорта, водительские удостоверения и другие ID-формы часто содержат сложные фоны, голограммы, блики от ламинации и т.п. Раньше для распознавания ID-документов в наших продуктах мы использовали бинаризацию — метод, который упрощал изображение до черно-белого формата. Однако вместе с шумами при бинаризации «затирались» и полезные данные. А когда в кадр попадали пальцы или документ лежал под углом, результаты распознавания могли стать совсем непредсказуемыми. Под катом расскажем, как нам удалось повысить точность распознавания ID-документов на 40%, какие технологии за этим стоят и почему старые методы перестали справляться с современными вызовами. Узнать подробности

https://habr.com/ru/companies/contentai/articles/924660/

#распознавание_образов #распознавание_изображений #распознавание_текста #документы_удостоверяющие_личность #паспорта #паспорт #ocr #ocrтехнологии

#распознавание_образов #распознавание_изображений #распознавание_текста #документы_удостоверяющие_личность #паспорта #паспорт

Habr @[email protected] · 2025-06-17 · 11:02 UTC

Что будет, если пригласить на свидание OCR и GPT?

Привет, Хабр! Снова на связи Кирилл Пронин, разработчик PIX RPA из PIX Robotics , со мной Александр Сулейкин , Founder DUC Technologies и сегодня мы с вами затронем тему «Что будет, если объединить OCR и GPT?». Признайтесь честно, видели какие ужасные результаты распознавания выдают современные open source решения для кириллицы? Вряд ли из коробки, можно что-то использовать сразу в своих решениях роботизации и автоматизации. Но что же будет, если мы обучим модель не через стандартные методы машинного обучения, а через GPT? Каков будет результат? Стоит ли это исследовать и браться за реализацию? Обо всем подробно в этой статье.

https://habr.com/ru/articles/919104/

#open_source #искусственный_интеллект #машинное_обучение #машинное_зрение #оптическое_распознавание #ocrтехнологии #idp #ocr #обучение_нейронных_сетей

#open_source #искусственный_интеллект #машинное_обучение #машинное_зрение #оптическое_распознавание #ocrтехнологии

Habr @[email protected] · 2025-06-06 · 16:42 UTC

Как мы делали технологию, которая умеет верифицировать подписи в документах

Верификация подписи — новая полезная фича для работы с документами, которая войдет в наш кросс-платформенный продукт ContentCapture для интеллектуальной обработки информации. Задача технологии — помогать пользователям проверять подлинность подписи на документах в автоматическом режиме, тем самым упрощая ежедневные бизнес-процессы и обеспечивая более высокий уровень безопасности. Ниже рассказываем, как мы создавали эту технологию.

https://habr.com/ru/companies/contentai/articles/913208/

#подписи #верификация #ocrтехнологии #ocr #разработка #contentcapture #j #обучение_нейронных_сетей

#обучение_нейронных_сетей #j #contentcapture #разработка #ocr #ocrтехнологии

Habr @[email protected] · 2025-05-19 · 09:22 UTC

Рукописный редактор на Python: инструкция для тех, кто хочет «рисовать» код

Привет, меня зовут Лёня! Я автор YouTube‑канала eleday о программировании на Python. Недавно в школе была проверочная работа и мне пришлось писать код на бумаге. Такой подход показался странным: все-таки программа может исполняться только на компьютере и логично набирать ее там же. Подобная цепочка рассуждений привела к интересной идее — редактору рукописного ввода. В этой статье расскажу о задумке и деталях ее реализации. Создадим виртуальный лист, на котором можно набросать код от руки — и он будет исполняться!

https://habr.com/ru/companies/selectel/articles/910602/

#selectel #python #javascript #распознавание_текста #ocr #ocrтехнологии #webпрограммирование

#webпрограммирование #ocrтехнологии #ocr #распознавание_текста #javascript #python

Habr @[email protected] · 2025-05-14 · 16:42 UTC

Как декомпозиция повышает точность распознавания текста: опыт с фотографиями СТС

Привет! Меня зовут Наталия Вареник, я DS-инженер в Авито , занимаюсь моделями распознавания изображений. Расскажу про один из наших проектов — пайплайн для распознавания номеров с фотографии свидетельства транспортного средства (СТС). В статье описала особенности задачи и рассказала, как мы решали её с помощью декомпозиции. Материал будет полезен начинающим и мидл-DS-инженерам, которые хотят узнать больше про декомпозицию задачи на этапах разметки и построения моделей. А еще материал стоит прочитать тем, кто работает с доменами, где нужно иметь дело с задачами распознавания информации с документов — наш подход прекрасно переносится на другие категории. В целом рекомендую статью всем, кто интересуется компьютерным зрением и его применимостью в разных сферах.

https://habr.com/ru/companies/avito/articles/908650/

#Распознавание_текста_на_фото #распознавание_документов #компьтерное_зрение #ocr #ocrтехнологии #декомпозиция_задач #стс #fullstack_разработка

#fullstack_разработка #стс #декомпозиция_задач #ocrтехнологии #ocr #компьтерное_зрение

Habr @[email protected] · 2025-04-23 · 16:12 UTC

[Перевод] Решалка судоку: сам не представляю, как она у меня получилась

В этой статье мы разберём, как написать программу для решения судоку. Предполагается, что ранее читатель не пробовал алгоритмически решать судоку, тем более — с применением нейронных сетей.

https://habr.com/ru/companies/timeweb/articles/903580/

#timeweb_статьи_перевод #судоку #искусственный_интеллект #нейросети #игры #математика #логика #ocr #ocrтехнологии #логика

#timeweb_статьи_перевод #судоку #искусственный_интеллект #нейросети #игры #математика

Habr @[email protected] · 2025-03-20 · 17:52 UTC

Технологии распознавания паспорта – 10 лет. Хабрология от Smart Engines

Десять лет назад, 17 марта 2015 года, мы опубликовали свой самый первый хабр . Тогда мы впервые представили городу и миру нашу технологию распознавания паспорта на мобильнике. Публика в комментах разделилась на два лагеря: одни сомневались в пользе решения, другие критиковали за недостаток возможностей и предлагали идеи по улучшению. Теперь, с высоты уже немалого времени докладываем: 1) идея себя оправдала и даже превзошла самые смелые ожидания; 2) работа по совершенствованию технологии была проделана; 3) работы было и будет очень много. Собрали для вас хайлайты этой увлекательной и яркой истории. Как это было?

https://habr.com/ru/companies/smartengines/articles/892420/

#ии #распознавание_образов #распознавание_изображений #распознавание_текста #распознавание_паспорта #документы #ocr #ocrтехнологии #компьютерное_зрение #программирование

#программирование #компьютерное_зрение #ocrтехнологии #ocr #документы #распознавание_паспорта

Habr @[email protected] · 2025-03-05 · 14:12 UTC

Распознавание день в день: как настроить шаблон нового документа без программирования

Привет, Хабр! Вы прекрасно знаете, что мы в Smart Engines непрерывно совершенствуем наши системы распознавания российского паспорта и других документов. Вместе с этим мы постоянно расширяем список документов, которые могут быть распознаны при помощи наших решений, – и будем делать это и дальше. Но что если бизнесу нужно оперативно настроить распознавание нового корпоративного документа с жесткой структурой? Сегодня такая потребность есть практически у любой организации. Можно прийти с этой задачей к нам, и мы обязательно поможем. Но есть и альтернативный сценарий – встроить возможность настройки распознавания к себе. Для этого мы выпустили специальный инструмент – дизайнер форм . С ним ждать никого не придется, а добавлять распознавание новых форм можно будет по мере их появления, буквально день в день . О нем мы сегодня и поговорим.

https://habr.com/ru/companies/smartengines/articles/888190/

#smart_engines #распознавание_образов #распознавание_изображений #документы #настройка_формы #ocr #ocrтехнологии #искусственный_интеллект #дизайнер #nocode

#nocode #дизайнер #искусственный_интеллект #ocrтехнологии #ocr #настройка_формы

Habr @[email protected] · 2025-02-25 · 12:42 UTC

Распознавание текста в банке: трудности и решения

Привет, Хабр. Я Александр Иванов, техлид команды компьютерного зрения. У любого банка очень много задач, связанных с документами. Особенно важна задача по оцифровке. Ее можно решить, скормив скан мощной мультимодальной LLM, но это работает не всегда. Поэтому мы разрабатываем специализированные решения по оцифровке разных текстов, о чем я и расскажу.

https://habr.com/ru/companies/tbank/articles/885558/

#llm #модели #ocr #ocrтехнологии

#ocrтехнологии #ocr #модели #llm

Habr @[email protected] · 2025-02-11 · 10:52 UTC

Разворачиваем простой OCR-сервер на Python

Тема компьютерного зрения достаточно обширна: в ней рассматриваются различные способы распознавания статичных изображений и видео. Однако многие из предлагаемых в интернете решений требуют повышенных вычислительных мощностей, сложного ПО и специального оборудования. В этой статье мы не будем рассматривать что‑то сложное, а вместо этого разберём создание простого сервера для распознавания изображений на Python.

https://habr.com/ru/companies/otus/articles/880038/

#computer_vision #ocrтехнологии #python #компьютерное_зрение #распознавание_изображений

#распознавание_изображений #компьютерное_зрение #python #ocrтехнологии #computer_vision

Habr @[email protected] · 2024-11-26 · 07:52 UTC

Оптимизировали 5 рабочих процессов с помощью AI. Не rocket science, но уже экономит ресурсы

Вероятно, вы уже видели новость от экс-data-подрядчика Google , что искусственный интеллект не оправдывает надежд бизнеса и вложенных в него денег. Проблема в том, что сделать AI реально полезным можно только после обучение нейросети на большом объёме ваших корпоративных данных (и на этом этапе всё обычно останавливается). Процессы, где внедрение AI сразу приносит пользу, тоже есть, но это не rocket science. В статье я покажу пять кейсов из нашей практики: расшифровку звонков и подготовку протоколов встреч, умный поиск по системе с OCR, распознавание и оцифровку документов (IDP) и AI-ассистента.

https://habr.com/ru/companies/1forma/articles/860578/

#искусственный_интеллект #расшифровка_видеоконференции #саммаризация #ocrтехнологии #idp #ai_ассистент #bpm #bpms #автоматизация_бизнеспроцессов

#искусственный_интеллект #расшифровка_видеоконференции #саммаризация #ocrтехнологии #idp #ai_ассистент

Habr @[email protected] · 2024-10-04 · 09:02 UTC

Адские условия: Самый суровый краш-тест технологии распознавания паспорта

Как вы знаете, в ситуациях, когда необходимо быстро и безопасно обработать данные паспорта и любых других документов, технологии распознавания Smart Engines творят настоящие чудеса. Качеству и надежности нашей технологии доверяют лидеры цифровой трансформации: госведомства, ведущие банки, аэропорты, промышленность и бизнес. Мы ценим доверие наших клиентов, а для вас, дорогие читатели, решили наглядно показать эффективность наших систем. Так сказать, лучше один раз увидеть, чем сто раз услышать. Летс гоу!

https://habr.com/ru/companies/smartengines/articles/848130/

#распознавание_образов #распознавание_изображений #распознавание_текста #распознавание_паспорта #документы #ocrтехнологии #ocr #компьютерное_зрение #тест #smart_engines

#smart_engines #тест #компьютерное_зрение #ocr #ocrтехнологии #документы

Habr @[email protected] · 2024-09-19 · 14:22 UTC

Методы предпроцессинга в IDP-системе ITFB EasyDoc

Всем привет! На связи команда Data Science компании ITFB Group. У нашей компании есть собственная разработка ITFB EasyDoc — система распознавания и извлечения данных из любого типа документов. В современном мире автоматизация обработки документов стала неотъемлемой частью множества бизнес-процессов. Предобработка изображений документов является важным шагом для обеспечения точности и надежности дальнейшего распознавания атрибутов. В этой статье мы хотим рассказать о некоторых эффективных методах предпроцессинга документов, позволяющих увеличивать как качество OCR-систем (Optical Character Recognition), так и различные CV и NLP пайплайны. Всем, кому интересна эта тема, — добро пожаловать под кат.

https://habr.com/ru/companies/itfb/articles/844380/

#ocr #ocrтехнологии #распознавание #распознавание_изображений #распознавание_паспорта #распознавание_документов #распознавание_объектов #распознавание_номеров #распознавание_текста #idp

#idp #распознавание_текста #распознавание_номеров #распознавание_объектов #распознавание_документов #распознавание_паспорта

Habr @[email protected] · 2024-09-11 · 10:22 UTC

Итоги ICDAR-2024: Как и зачем нужно делать распознавание объяснимым

В солнечных Афинах завершилась конференция ICDAR-2024. Причиной ли тому средиземноморское солнце или живой энтузиазм выступающих, но здесь было действительно жарко. Что неудивительно - ведь это главное международное мероприятие, посвященное вопросам распознавания. Одна из ключевых тем встречи – современные вызовы и перспективы OCR. Ведущие ученые со всего мира сошлись во мнении, что технологии распознавания жизненно необходимо сделать более понятными и интерпретируемыми . А для этого создать простую OCR явно недостаточно. Нам в Smart Engines есть что добавить по этому поводу. Рассказываем, зачем нужно “объяснять” OCR и как это правильно сделать. Объясняем тут

https://habr.com/ru/companies/smartengines/articles/840788/

#распознавание_речи #распознавание_документов #распознавание_паспорта #ocr #ocrтехнологии #icdar #репортаж #ии #обработка_изображений #обработка_данных

#обработка_данных #обработка_изображений #ии #репортаж #icdar #ocrтехнологии

Habr @[email protected] · 2024-08-22 · 10:02 UTC

Выбираем систему распознавания: 20 вопросов, которые нужно задать вендору перед внедрением

Сориентироваться на рынке технологий распознавания документов – задача непростая. А отнестись к выбору системы стоит, между тем, ответственно: от надежности разработчика ПО зависит, будет ли решение функционировать без сбоев и будет ли работать вообще. Чтобы в дальнейшем дорогостоящее IT-решение не разочаровало – мы, Smart Engines , подготовили универсальный чек-лист. Он поможет вам минимизировать риски (спойлер: их немало) при выборе разработчика системы оптического распознавания текста и подобрать оптимальное решение.

https://habr.com/ru/companies/smartengines/articles/837530/

#ии #как_выбрать #как_выбрать_компанию #распознавание #ocr #ocrтехнологии #ocrskd #распознавание_образов #технологии #бизнес

#бизнес #технологии #распознавание_образов #ocrskd #ocrтехнологии #ocr

Habr @[email protected] · 2024-08-17 · 14:32 UTC

Создание плагина для распознавания текста на иврите: мой опыт и решения

Всем привет! Хочу поделиться недавним проектом, в котором я разрабатывал плагин для распознавания текста на иврите. Задача была непростая, особенно учитывая, что клиент уже пытался использовать Tesseract OCR, но точность распознавания оставляла желать лучшего. В этой статье расскажу о том, с какими трудностями я столкнулся и как их преодолел.

https://habr.com/ru/articles/836714/

#искусственный_интеллект #ocrтехнологии #распознавание_текста #paddleocr #tesseract_ocr #python #датасет #аугментация #easyocr

#easyocr #аугментация #датасет #python #tesseract_ocr #paddleocr

Habr @[email protected] · 2024-06-04 · 13:22 UTC

ML в OCR: зачем и как

Привет, меня зовут Георгий Гончаров, я инженер‑консультант OCR‑платформы SOICA, предназначенной для распознавания и обработки текстовых и графических данных. Поскольку это собственная разработка, то мы постоянно внедряем новые фичи. Недавно начали использовать ML‑технологию для извлечения данных из высокоструктурированных документов. В статье расскажу, почему и как мы реализовали эту функциональность и каких результатов удалось достичь.

https://habr.com/ru/companies/slsoft/articles/819391/

#ml #ocr #ocrтехнологии #SOICA #machine_learning #neural_networks

#neural_networks #machine_learning #soica #ocrтехнологии #ocr #ml

Habr @[email protected] · 2024-04-26 · 09:12 UTC

Локальная REST-служба, или как за 5 минут интегрировать Smart ID Engine

Сегодня мы расскажем, как встроить нашу систему распознавания документов, удостоверяющих личность, Smart ID Engine в виде локально работающей службы с интерфейсом REST API.

https://habr.com/ru/companies/smartengines/articles/810627/

#restful #rest_api #распознавание #ocrтехнологии #распознавание_паспорта

#распознавание_паспорта #ocrтехнологии #распознавание #rest_api #restful

Habr @[email protected] · 2024-03-15 · 00:22 UTC

Как выбрать и внедрить OCR-систему для распознавания и сверки документов

Приветствую, друзья! Меня зовут Александр Вихарев, и я работаю системным аналитиком в проектах для Fix Price. Одной из самых сложных задач при работе с документацией является сверка документов. Причем сверка трудна и с точки зрения программной реализации, если заниматься этим самостоятельно. Для нас же эта задача особенно важна, поскольку все документы должны подписываться только теми людьми, у которых есть на это полномочия. В противном случае это может привести к правовым и финансовым проблемам — например, при подписании договоров на оказание услуг. Также могут наблюдаться и несовпадения в предварительно согласованной и подписанной версиях, что при ручной проверке выявлять долго. Чтобы избежать этого и освободить время специалистов компании, занимающихся сверкой документации, было решено разработать свою OCR-систему на основе решений внешних поставщиков. Технология OCR (optical character recognition, оптическое распознавание символов) позволяет извлекать текстовые слои из отсканированных документов для сверки и переводить их в удобные для работы форматы.

https://habr.com/ru/companies/fix_price/articles/800171/

#ocrтехнологии #ocr #нейросети #искусственный_интеллект #документация

#документация #искусственный_интеллект #нейросети #ocr #ocrтехнологии