home.social

#ocrтехнологии — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #ocrтехнологии, aggregated by home.social.

  1. Извлечение параметров из 2D-чертежей: 6 YOLO-моделей, кастомный OCR и стрелочная логика

    PDF‑чертёж кажется простым документом, пока не нужно автоматически вытащить из него всё, что влияет на стоимость изготовления детали : габариты, диаметры, резьбы, квалитеты, шероховатости, материал, массу и тип детали. Мы собрали для этого пайплайн из детекции, OCR и инженерной логики: научили систему находить проекции, отделять контур детали от служебных линий, связывать стрелки с размерами и превращать чертёж в JSON для калькулятора стоимости. В статье разбираем архитектуру решения, узкие места и приёмы, которые реально сработали на производственных чертежах. Читать кейс

    habr.com/ru/articles/1033824/

    #ocr #ocrтехнологии #детекция_текста #распознавание_документов #машинное_зрение #компьютерное_зрение #обработка_изображений #инженерная_оптимизация

  2. Извлечение параметров из 2D-чертежей: 6 YOLO-моделей, кастомный OCR и стрелочная логика

    PDF‑чертёж кажется простым документом, пока не нужно автоматически вытащить из него всё, что влияет на стоимость изготовления детали : габариты, диаметры, резьбы, квалитеты, шероховатости, материал, массу и тип детали. Мы собрали для этого пайплайн из детекции, OCR и инженерной логики: научили систему находить проекции, отделять контур детали от служебных линий, связывать стрелки с размерами и превращать чертёж в JSON для калькулятора стоимости. В статье разбираем архитектуру решения, узкие места и приёмы, которые реально сработали на производственных чертежах. Читать кейс

    habr.com/ru/articles/1033824/

    #ocr #ocrтехнологии #детекция_текста #распознавание_документов #машинное_зрение #компьютерное_зрение #обработка_изображений #инженерная_оптимизация

  3. Извлечение параметров из 2D-чертежей: 6 YOLO-моделей, кастомный OCR и стрелочная логика

    PDF‑чертёж кажется простым документом, пока не нужно автоматически вытащить из него всё, что влияет на стоимость изготовления детали : габариты, диаметры, резьбы, квалитеты, шероховатости, материал, массу и тип детали. Мы собрали для этого пайплайн из детекции, OCR и инженерной логики: научили систему находить проекции, отделять контур детали от служебных линий, связывать стрелки с размерами и превращать чертёж в JSON для калькулятора стоимости. В статье разбираем архитектуру решения, узкие места и приёмы, которые реально сработали на производственных чертежах. Читать кейс

    habr.com/ru/articles/1033824/

    #ocr #ocrтехнологии #детекция_текста #распознавание_документов #машинное_зрение #компьютерное_зрение #обработка_изображений #инженерная_оптимизация

  4. Извлечение параметров из 2D-чертежей: 6 YOLO-моделей, кастомный OCR и стрелочная логика

    PDF‑чертёж кажется простым документом, пока не нужно автоматически вытащить из него всё, что влияет на стоимость изготовления детали : габариты, диаметры, резьбы, квалитеты, шероховатости, материал, массу и тип детали. Мы собрали для этого пайплайн из детекции, OCR и инженерной логики: научили систему находить проекции, отделять контур детали от служебных линий, связывать стрелки с размерами и превращать чертёж в JSON для калькулятора стоимости. В статье разбираем архитектуру решения, узкие места и приёмы, которые реально сработали на производственных чертежах. Читать кейс

    habr.com/ru/articles/1033824/

    #ocr #ocrтехнологии #детекция_текста #распознавание_документов #машинное_зрение #компьютерное_зрение #обработка_изображений #инженерная_оптимизация

  5. OCR в кармане: как HunyuanOCR на 1B параметров потеснил гигантов в задачах парсинга документов

    Всем привет! Меня зовут Артем, я Data Scientist в компании Raft Digital Solutions . В этой статье расскажу про свой опыт работы с HunyuanOCR end-to-end моделью от Tencent для распознавания текста на 1B параметров. Несмотря на громкие заявления о «SOTA-результатах» и компактности, в публичных обзорах практически не описано, как эта модель ведет себя в реальных задачах: с чем приходится столкнуться при настройке окружения, почему она может уйти в бесконечное зацикливание и как заставить её эффективно парсить сложные таблицы на обычном «железе». Поделюсь результатами своих экспериментов, покажу боевые промпты и объясню, в каких сценариях этот OCR-инструмент реально помогает экономить время, а где лучше даже не пытаться его использовать.

    habr.com/ru/companies/raft/art

    #ocr #document #ocrтехнологии #ocr_распознавание_документов #document_parsing #распознавание_текста #обработка_документов #таблицы #сканы #imagetotext

  6. OCR в кармане: как HunyuanOCR на 1B параметров потеснил гигантов в задачах парсинга документов

    Всем привет! Меня зовут Артем, я Data Scientist в компании Raft Digital Solutions . В этой статье расскажу про свой опыт работы с HunyuanOCR end-to-end моделью от Tencent для распознавания текста на 1B параметров. Несмотря на громкие заявления о «SOTA-результатах» и компактности, в публичных обзорах практически не описано, как эта модель ведет себя в реальных задачах: с чем приходится столкнуться при настройке окружения, почему она может уйти в бесконечное зацикливание и как заставить её эффективно парсить сложные таблицы на обычном «железе». Поделюсь результатами своих экспериментов, покажу боевые промпты и объясню, в каких сценариях этот OCR-инструмент реально помогает экономить время, а где лучше даже не пытаться его использовать.

    habr.com/ru/companies/raft/art

    #ocr #document #ocrтехнологии #ocr_распознавание_документов #document_parsing #распознавание_текста #обработка_документов #таблицы #сканы #imagetotext

  7. OCR в кармане: как HunyuanOCR на 1B параметров потеснил гигантов в задачах парсинга документов

    Всем привет! Меня зовут Артем, я Data Scientist в компании Raft Digital Solutions . В этой статье расскажу про свой опыт работы с HunyuanOCR end-to-end моделью от Tencent для распознавания текста на 1B параметров. Несмотря на громкие заявления о «SOTA-результатах» и компактности, в публичных обзорах практически не описано, как эта модель ведет себя в реальных задачах: с чем приходится столкнуться при настройке окружения, почему она может уйти в бесконечное зацикливание и как заставить её эффективно парсить сложные таблицы на обычном «железе». Поделюсь результатами своих экспериментов, покажу боевые промпты и объясню, в каких сценариях этот OCR-инструмент реально помогает экономить время, а где лучше даже не пытаться его использовать.

    habr.com/ru/companies/raft/art

    #ocr #document #ocrтехнологии #ocr_распознавание_документов #document_parsing #распознавание_текста #обработка_документов #таблицы #сканы #imagetotext

  8. OCR в кармане: как HunyuanOCR на 1B параметров потеснил гигантов в задачах парсинга документов

    Всем привет! Меня зовут Артем, я Data Scientist в компании Raft Digital Solutions . В этой статье расскажу про свой опыт работы с HunyuanOCR end-to-end моделью от Tencent для распознавания текста на 1B параметров. Несмотря на громкие заявления о «SOTA-результатах» и компактности, в публичных обзорах практически не описано, как эта модель ведет себя в реальных задачах: с чем приходится столкнуться при настройке окружения, почему она может уйти в бесконечное зацикливание и как заставить её эффективно парсить сложные таблицы на обычном «железе». Поделюсь результатами своих экспериментов, покажу боевые промпты и объясню, в каких сценариях этот OCR-инструмент реально помогает экономить время, а где лучше даже не пытаться его использовать.

    habr.com/ru/companies/raft/art

    #ocr #document #ocrтехнологии #ocr_распознавание_документов #document_parsing #распознавание_текста #обработка_документов #таблицы #сканы #imagetotext

  9. Как гибрид IDP и VLM экономит миллионы на верификации данных

    Последние 2 года мы в Content AI активно тестируем Vision Language Models (VLM) для обработки документов. Модели вроде Qwen2.5-VL или Gemini 2.5 отлично работают с простыми формами — чеками, типовыми договорами. Но на документах со сложными фонами, многоуровневыми таблицами или нестандартной версткой VLM часто галлюцинирует, теряет строки и путается в реквизитах. В одной из предыдущих статей мы пришли к выводу, что будущее за комбинированным подходом , когда VLM усиливает IDP-решения. В этот раз мы проверили гипотезу: пусть VLM не распознает документ с нуля, а проверяет черновик из IDP-системы и исправляет ошибки, опираясь на исходное изображение. Базовым OCR движком выступила наша платформа ContentCapture. Практическая цель эксперимента — автоматизировать верификацию документов. Сейчас в крупных компаниях сотни операторов вручную сверяют распознанные данные с оригиналами.

    habr.com/ru/companies/contenta

    #idp #llmмодели #vlm #ocr #ocrтехнологии

  10. Как гибрид IDP и VLM экономит миллионы на верификации данных

    Последние 2 года мы в Content AI активно тестируем Vision Language Models (VLM) для обработки документов. Модели вроде Qwen2.5-VL или Gemini 2.5 отлично работают с простыми формами — чеками, типовыми договорами. Но на документах со сложными фонами, многоуровневыми таблицами или нестандартной версткой VLM часто галлюцинирует, теряет строки и путается в реквизитах. В одной из предыдущих статей мы пришли к выводу, что будущее за комбинированным подходом , когда VLM усиливает IDP-решения. В этот раз мы проверили гипотезу: пусть VLM не распознает документ с нуля, а проверяет черновик из IDP-системы и исправляет ошибки, опираясь на исходное изображение. Базовым OCR движком выступила наша платформа ContentCapture. Практическая цель эксперимента — автоматизировать верификацию документов. Сейчас в крупных компаниях сотни операторов вручную сверяют распознанные данные с оригиналами.

    habr.com/ru/companies/contenta

    #idp #llmмодели #vlm #ocr #ocrтехнологии

  11. Как гибрид IDP и VLM экономит миллионы на верификации данных

    Последние 2 года мы в Content AI активно тестируем Vision Language Models (VLM) для обработки документов. Модели вроде Qwen2.5-VL или Gemini 2.5 отлично работают с простыми формами — чеками, типовыми договорами. Но на документах со сложными фонами, многоуровневыми таблицами или нестандартной версткой VLM часто галлюцинирует, теряет строки и путается в реквизитах. В одной из предыдущих статей мы пришли к выводу, что будущее за комбинированным подходом , когда VLM усиливает IDP-решения. В этот раз мы проверили гипотезу: пусть VLM не распознает документ с нуля, а проверяет черновик из IDP-системы и исправляет ошибки, опираясь на исходное изображение. Базовым OCR движком выступила наша платформа ContentCapture. Практическая цель эксперимента — автоматизировать верификацию документов. Сейчас в крупных компаниях сотни операторов вручную сверяют распознанные данные с оригиналами.

    habr.com/ru/companies/contenta

    #idp #llmмодели #vlm #ocr #ocrтехнологии

  12. Как гибрид IDP и VLM экономит миллионы на верификации данных

    Последние 2 года мы в Content AI активно тестируем Vision Language Models (VLM) для обработки документов. Модели вроде Qwen2.5-VL или Gemini 2.5 отлично работают с простыми формами — чеками, типовыми договорами. Но на документах со сложными фонами, многоуровневыми таблицами или нестандартной версткой VLM часто галлюцинирует, теряет строки и путается в реквизитах. В одной из предыдущих статей мы пришли к выводу, что будущее за комбинированным подходом , когда VLM усиливает IDP-решения. В этот раз мы проверили гипотезу: пусть VLM не распознает документ с нуля, а проверяет черновик из IDP-системы и исправляет ошибки, опираясь на исходное изображение. Базовым OCR движком выступила наша платформа ContentCapture. Практическая цель эксперимента — автоматизировать верификацию документов. Сейчас в крупных компаниях сотни операторов вручную сверяют распознанные данные с оригиналами.

    habr.com/ru/companies/contenta

    #idp #llmмодели #vlm #ocr #ocrтехнологии

  13. Стопроцентное распознавание

    У истории про « элитный вайбкодинг », вызвавшей заметный интерес широких айтишных масс, есть не менее интересная предыстория. Проектному управлению посвящается.

    habr.com/ru/articles/1003178/

    #ocr #ocrтехнологии #управление_проектами #проектное_управление #проектное_планирование #проектное_финансирование

  14. Классический IDP и VLM в обработке документов: почему выигрывает комбинация подходов

    В прошлых материалах мы уже рассказывали о том, как мультимодальные модели (VLM) справляются с извлечением данных из финансовых документов, и показывали, что в ряде сценариев они могут конкурировать с оптимизированными классическими IDP-решениями. Однако мы решили не ограничиваться одним типом документов и продолжили исследование, сравнив технологии на широком спектре материалов. В пул вошли сканы высокого качества и фотографии со сложным фоном, структурированные табличные формы и документы с элементами рукописного текста, русскоязычные и англоязычные тексты. Сегодня мы готовы поделиться сводными итогами.

    habr.com/ru/companies/contenta

    #IDP #llmмодели #vlm #ocrтехнологии #ocr

  15. Как я собрал AI-ассистента для отца с больным сердцем: Tool-Calling RAG Pipeline на GPT-4o-mini без LangChain

    Мой отец — человек, переживший несколько сложнейших операций на сердце. Жизнь с хроническим заболеванием — это бесконечный поток анализов, заключений и схем приёма лекарств. Находясь далеко (я живу во Вьетнаме), я постоянно волновался: не забудет ли он про дозу, правильно ли понял назначение, задал ли все нужные вопросы врачу? Мне нужен был не просто бот-напоминалка, а второй пилот — умный, конфиденциальный и мультимодальный AI-Кардиолог . Ассистент, который знает его анамнез наизусть, понимает голосовые команды и может «прочитать» фотографию свежего анализа. Я решил собрать полноценный автономный агент с возможностью вызова внешних инструментов ( Tool‑Calling ) и локальной базой знаний ( RAG ), но без использования громоздких фреймворков вроде LangChain или LlamaIndex.

    habr.com/ru/articles/961280/

    #ai #rag #tool_calling #python #telegrambot #gpt4o_mini #chromadb #ocrтехнологии #медицина #llm

  16. End-to-end вместо трёх костылей: как мы обошли OCR и выиграли по скорости и точности

    Ребята, вы когда-нибудь сталкивались с тем, что ваш шикарный AI-пайплайн для обработки документов спотыкается на самом простом — на чтении текста с картинки? OCR выдает абракадабру, цифры перепутаны, а дальше по цепочке летит вся ваша безупречная логика. Знакомо? У нас была точно такая же боль.

    habr.com/ru/companies/datafeel

    #ml #ai #ocr #ocrтехнологии #qa #business #business_model #data #nlp #llm

  17. Как мы научили нейросети читать паспорта: история борьбы с бликами, водяными знаками и кривыми фото

    Привет, Хабр! Если вы когда-либо сталкивались с автоматическим распознаванием документов, то знаете, насколько сложно работать с документами удостоверяющими личность (ID-документами). Хотя, казалось бы, что может быть проще, чем распознать фото паспорта, но на практике это может вызывать сложности у OCR-алгоритмов. Ведь паспорта, водительские удостоверения и другие ID-формы часто содержат сложные фоны, голограммы, блики от ламинации и т.п. Раньше для распознавания ID-документов в наших продуктах мы использовали бинаризацию — метод, который упрощал изображение до черно-белого формата. Однако вместе с шумами при бинаризации «затирались» и полезные данные. А когда в кадр попадали пальцы или документ лежал под углом, результаты распознавания могли стать совсем непредсказуемыми. Под катом расскажем, как нам удалось повысить точность распознавания ID-документов на 40%, какие технологии за этим стоят и почему старые методы перестали справляться с современными вызовами. Узнать подробности

    habr.com/ru/companies/contenta

    #распознавание_образов #распознавание_изображений #распознавание_текста #документы_удостоверяющие_личность #паспорта #паспорт #ocr #ocrтехнологии

  18. Что будет, если пригласить на свидание OCR и GPT?

    Привет, Хабр! Снова на связи Кирилл Пронин, разработчик PIX RPA из PIX Robotics , со мной Александр Сулейкин , Founder DUC Technologies и сегодня мы с вами затронем тему «Что будет, если объединить OCR и GPT?». Признайтесь честно, видели какие ужасные результаты распознавания выдают современные open source решения для кириллицы? Вряд ли из коробки, можно что-то использовать сразу в своих решениях роботизации и автоматизации. Но что же будет, если мы обучим модель не через стандартные методы машинного обучения, а через GPT? Каков будет результат? Стоит ли это исследовать и браться за реализацию? Обо всем подробно в этой статье.

    habr.com/ru/articles/919104/

    #open_source #искусственный_интеллект #машинное_обучение #машинное_зрение #оптическое_распознавание #ocrтехнологии #idp #ocr #обучение_нейронных_сетей

  19. Как мы делали технологию, которая умеет верифицировать подписи в документах

    Верификация подписи — новая полезная фича для работы с документами, которая войдет в наш кросс-платформенный продукт ContentCapture для интеллектуаль­ной обработки информации. Задача технологии — помогать пользователям проверять подлинность подписи на документах в автоматическом режиме, тем самым упрощая ежедневные бизнес-процессы и обеспечивая более высокий уровень безопасности. Ниже рассказываем, как мы создавали эту технологию.

    habr.com/ru/companies/contenta

    #подписи #верификация #ocrтехнологии #ocr #разработка #contentcapture #j #обучение_нейронных_сетей

  20. Рукописный редактор на Python: инструкция для тех, кто хочет «рисовать» код

    Привет, меня зовут Лёня! Я автор YouTube‑канала eleday о программировании на Python. Недавно в школе была проверочная работа и мне пришлось писать код на бумаге. Такой подход показался странным: все-таки программа может исполняться только на компьютере и логично набирать ее там же. Подобная цепочка рассуждений привела к интересной идее — редактору рукописного ввода. В этой статье расскажу о задумке и деталях ее реализации. Создадим виртуальный лист, на котором можно набросать код от руки — и он будет исполняться!

    habr.com/ru/companies/selectel

    #selectel #python #javascript #распознавание_текста #ocr #ocrтехнологии #webпрограммирование

  21. Как декомпозиция повышает точность распознавания текста: опыт с фотографиями СТС

    Привет! Меня зовут Наталия Вареник, я DS-инженер в Авито , занимаюсь моделями распознавания изображений. Расскажу про один из наших проектов — пайплайн для распознавания номеров с фотографии свидетельства транспортного средства (СТС). В статье описала особенности задачи и рассказала, как мы решали её с помощью декомпозиции. Материал будет полезен начинающим и мидл-DS-инженерам, которые хотят узнать больше про декомпозицию задачи на этапах разметки и построения моделей. А еще материал стоит прочитать тем, кто работает с доменами, где нужно иметь дело с задачами распознавания информации с документов — наш подход прекрасно переносится на другие категории. В целом рекомендую статью всем, кто интересуется компьютерным зрением и его применимостью в разных сферах.

    habr.com/ru/companies/avito/ar

    #Распознавание_текста_на_фото #распознавание_документов #компьтерное_зрение #ocr #ocrтехнологии #декомпозиция_задач #стс #fullstack_разработка

  22. [Перевод] Решалка судоку: сам не представляю, как она у меня получилась

    В этой статье мы разберём, как написать программу для решения судоку. Предполагается, что ранее читатель не пробовал алгоритмически решать судоку, тем более — с применением нейронных сетей.

    habr.com/ru/companies/timeweb/

    #timeweb_статьи_перевод #судоку #искусственный_интеллект #нейросети #игры #математика #логика #ocr #ocrтехнологии #логика

  23. Технологии распознавания паспорта – 10 лет. Хабрология от Smart Engines

    Десять лет назад, 17 марта 2015 года, мы опубликовали свой самый первый хабр . Тогда мы впервые представили городу и миру нашу технологию распознавания паспорта на мобильнике. Публика в комментах разделилась на два лагеря: одни сомневались в пользе решения, другие критиковали за недостаток возможностей и предлагали идеи по улучшению. Теперь, с высоты уже немалого времени докладываем: 1) идея себя оправдала и даже превзошла самые смелые ожидания; 2) работа по совершенствованию технологии была проделана; 3) работы было и будет очень много. Собрали для вас хайлайты этой увлекательной и яркой истории. Как это было?

    habr.com/ru/companies/smarteng

    #ии #распознавание_образов #распознавание_изображений #распознавание_текста #распознавание_паспорта #документы #ocr #ocrтехнологии #компьютерное_зрение #программирование

  24. Распознавание день в день: как настроить шаблон нового документа без программирования

    Привет, Хабр! Вы прекрасно знаете, что мы в Smart Engines непрерывно совершенствуем наши системы распознавания российского паспорта и других документов. Вместе с этим мы постоянно расширяем список документов, которые могут быть распознаны при помощи наших решений, – и будем делать это и дальше. Но что если бизнесу нужно оперативно настроить распознавание нового корпоративного документа с жесткой структурой? Сегодня такая потребность есть практически у любой организации. Можно прийти с этой задачей к нам, и мы обязательно поможем. Но есть и альтернативный сценарий – встроить возможность настройки распознавания к себе. Для этого мы выпустили специальный инструмент – дизайнер форм . С ним ждать никого не придется, а добавлять распознавание новых форм можно будет по мере их появления, буквально день в день . О нем мы сегодня и поговорим.

    habr.com/ru/companies/smarteng

    #smart_engines #распознавание_образов #распознавание_изображений #документы #настройка_формы #ocr #ocrтехнологии #искусственный_интеллект #дизайнер #nocode

  25. Распознавание текста в банке: трудности и решения

    Привет, Хабр. Я Александр Иванов, техлид команды компьютерного зрения. У любого банка очень много задач, связанных с документами. Особенно важна задача по оцифровке. Ее можно решить, скормив скан мощной мультимодальной LLM, но это работает не всегда. Поэтому мы разрабатываем специализированные решения по оцифровке разных текстов, о чем я и расскажу.

    habr.com/ru/companies/tbank/ar

    #llm #модели #ocr #ocrтехнологии

  26. Разворачиваем простой OCR-сервер на Python

    Тема компьютерного зрения достаточно обширна: в ней рассматриваются различные способы распознавания статичных изображений и видео. Однако многие из предлагаемых в интернете решений требуют повышенных вычислительных мощностей, сложного ПО и специального оборудования. В этой статье мы не будем рассматривать что‑то сложное, а вместо этого разберём создание простого сервера для распознавания изображений на Python.

    habr.com/ru/companies/otus/art

    #computer_vision #ocrтехнологии #python #компьютерное_зрение #распознавание_изображений

  27. Оптимизировали 5 рабочих процессов с помощью AI. Не rocket science, но уже экономит ресурсы

    Вероятно, вы уже видели новость от экс-data-подрядчика Google , что искусственный интеллект не оправдывает надежд бизнеса и вложенных в него денег. Проблема в том, что сделать AI реально полезным можно только после обучение нейросети на большом объёме ваших корпоративных данных (и на этом этапе всё обычно останавливается). Процессы, где внедрение AI сразу приносит пользу, тоже есть, но это не rocket science. В статье я покажу пять кейсов из нашей практики: расшифровку звонков и подготовку протоколов встреч, умный поиск по системе с OCR, распознавание и оцифровку документов (IDP) и AI-ассистента.

    habr.com/ru/companies/1forma/a

    #искусственный_интеллект #расшифровка_видеоконференции #саммаризация #ocrтехнологии #idp #ai_ассистент #bpm #bpms #автоматизация_бизнеспроцессов

  28. Адские условия: Самый суровый краш-тест технологии распознавания паспорта

    Как вы знаете, в ситуациях, когда необходимо быстро и безопасно обработать данные паспорта и любых других документов, технологии распознавания Smart Engines творят настоящие чудеса. Качеству и надежности нашей технологии доверяют лидеры цифровой трансформации: госведомства, ведущие банки, аэропорты, промышленность и бизнес. Мы ценим доверие наших клиентов, а для вас, дорогие читатели, решили наглядно показать эффективность наших систем. Так сказать, лучше один раз увидеть, чем сто раз услышать. Летс гоу!

    habr.com/ru/companies/smarteng

    #распознавание_образов #распознавание_изображений #распознавание_текста #распознавание_паспорта #документы #ocrтехнологии #ocr #компьютерное_зрение #тест #smart_engines

  29. Методы предпроцессинга в IDP-системе ITFB EasyDoc

    Всем привет! На связи команда Data Science компании ITFB Group. У нашей компании есть собственная разработка ITFB EasyDoc — система распознавания и извлечения данных из любого типа документов. В современном мире автоматизация обработки документов стала неотъемлемой частью множества бизнес-процессов. Предобработка изображений документов является важным шагом для обеспечения точности и надежности дальнейшего распознавания атрибутов. В этой статье мы хотим рассказать о некоторых эффективных методах предпроцессинга документов, позволяющих увеличивать как качество OCR-систем (Optical Character Recognition), так и различные CV и NLP пайплайны. Всем, кому интересна эта тема, — добро пожаловать под кат.

    habr.com/ru/companies/itfb/art

    #ocr #ocrтехнологии #распознавание #распознавание_изображений #распознавание_паспорта #распознавание_документов #распознавание_объектов #распознавание_номеров #распознавание_текста #idp

  30. Итоги ICDAR-2024: Как и зачем нужно делать распознавание объяснимым

    В солнечных Афинах завершилась конференция ICDAR-2024. Причиной ли тому средиземноморское солнце или живой энтузиазм выступающих, но здесь было действительно жарко. Что неудивительно - ведь это главное международное мероприятие, посвященное вопросам распознавания. Одна из ключевых тем встречи – современные вызовы и перспективы OCR. Ведущие ученые со всего мира сошлись во мнении, что технологии распознавания жизненно необходимо сделать более понятными и интерпретируемыми . А для этого создать простую OCR явно недостаточно. Нам в Smart Engines есть что добавить по этому поводу. Рассказываем, зачем нужно “объяснять” OCR и как это правильно сделать. Объясняем тут

    habr.com/ru/companies/smarteng

    #распознавание_речи #распознавание_документов #распознавание_паспорта #ocr #ocrтехнологии #icdar #репортаж #ии #обработка_изображений #обработка_данных

  31. Выбираем систему распознавания: 20 вопросов, которые нужно задать вендору перед внедрением

    Сориентироваться на рынке технологий распознавания документов – задача непростая. А отнестись к выбору системы стоит, между тем, ответственно: от надежности разработчика ПО зависит, будет ли решение функционировать без сбоев и будет ли работать вообще. Чтобы в дальнейшем дорогостоящее IT-решение не разочаровало – мы, Smart Engines , подготовили универсальный чек-лист. Он поможет вам минимизировать риски (спойлер: их немало) при выборе разработчика системы оптического распознавания текста и подобрать оптимальное решение.

    habr.com/ru/companies/smarteng

    #ии #как_выбрать #как_выбрать_компанию #распознавание #ocr #ocrтехнологии #ocrskd #распознавание_образов #технологии #бизнес

  32. Создание плагина для распознавания текста на иврите: мой опыт и решения

    Всем привет! Хочу поделиться недавним проектом, в котором я разрабатывал плагин для распознавания текста на иврите. Задача была непростая, особенно учитывая, что клиент уже пытался использовать Tesseract OCR, но точность распознавания оставляла желать лучшего. В этой статье расскажу о том, с какими трудностями я столкнулся и как их преодолел.

    habr.com/ru/articles/836714/

    #искусственный_интеллект #ocrтехнологии #распознавание_текста #paddleocr #tesseract_ocr #python #датасет #аугментация #easyocr

  33. ML в OCR: зачем и как

    Привет, меня зовут Георгий Гончаров, я инженер‑консультант OCR‑платформы SOICA, предназначенной для распознавания и обработки текстовых и графических данных. Поскольку это собственная разработка, то мы постоянно внедряем новые фичи. Недавно начали использовать ML‑технологию для извлечения данных из высокоструктурированных документов. В статье расскажу, почему и как мы реализовали эту функциональность и каких результатов удалось достичь.

    habr.com/ru/companies/slsoft/a

    #ml #ocr #ocrтехнологии #SOICA #machine_learning #neural_networks

  34. Локальная REST-служба, или как за 5 минут интегрировать Smart ID Engine

    Сегодня мы расскажем, как встроить нашу систему распознавания документов, удостоверяющих личность, Smart ID Engine в виде локально работающей службы с интерфейсом REST API.

    habr.com/ru/companies/smarteng

    #restful #rest_api #распознавание #ocrтехнологии #распознавание_паспорта

  35. Как выбрать и внедрить OCR-систему для распознавания и сверки документов

    Приветствую, друзья! Меня зовут Александр Вихарев, и я работаю системным аналитиком в проектах для Fix Price. Одной из самых сложных задач при работе с документацией является сверка документов. Причем сверка трудна и с точки зрения программной реализации, если заниматься этим самостоятельно. Для нас же эта задача особенно важна, поскольку все документы должны подписываться только теми людьми, у которых есть на это полномочия. В противном случае это может привести к правовым и финансовым проблемам — например, при подписании договоров на оказание услуг. Также могут наблюдаться и несовпадения в предварительно согласованной и подписанной версиях, что при ручной проверке выявлять долго. Чтобы избежать этого и освободить время специалистов компании, занимающихся сверкой документации, было решено разработать свою OCR-систему на основе решений внешних поставщиков. Технология OCR (optical character recognition, оптическое распознавание символов) позволяет извлекать текстовые слои из отсканированных документов для сверки и переводить их в удобные для работы форматы.

    habr.com/ru/companies/fix_pric

    #ocrтехнологии #ocr #нейросети #искусственный_интеллект #документация