#распознавание_текста — Public Fediverse posts on home.social

Habr @[email protected] · 2026-05-21 · 14:52 UTC

Детекция чужого почерка в экзаменационных бланках без эталонного образца

Один ученик писал экзаменационную работу, а кто-то чужой дописал часть за него. Как мы научили нейросеть распознавать это. Дано: государственная аттестация, бумажные бланки, никакого онлайн-контроля. Классический способ фальсификации: ученик начинает работу сам, потом часть дописывает кто-то другой: сосед, нанятый человек, преподаватель. Проверяющий смотрит на текст, но не оценивает почерк. Задача ИИ: поймать фальсификацию почерка без эталона: система не знает заранее, как пишет конкретный ученик. Единственное, от чего можно отталкиваться - начало бланка, мы предполагаем, что первые строки написал сам экзаменуемый. Цель: определить, написан ли весь бланк экзаменационной работы одним человеком. На входе - скан бланка, порой низкого качества. На выходе — координаты подозрительных фрагментов для ручной проверки. Все это в режиме потоковой обработки. Основной вызов: экзаменационный бланк — это смешанный документ. Рукописный текст соседствует с формулами, графиками, схемами, печатной подложкой бланка.

https://habr.com/ru/articles/1037850/

#ocr #ocrтехнологии #computer_vision #yolo #компьютерное_зрение #pytorch #распознавание_текста #распознавание_рукописного_текста

#распознавание_рукописного_текста #распознавание_текста #pytorch #компьютерное_зрение #yolo #computer_vision

Habr @[email protected] · 2026-05-21 · 14:52 UTC

Детекция чужого почерка в экзаменационных бланках без эталонного образца

Один ученик писал экзаменационную работу, а кто-то чужой дописал часть за него. Как мы научили нейросеть распознавать это. Дано: государственная аттестация, бумажные бланки, никакого онлайн-контроля. Классический способ фальсификации: ученик начинает работу сам, потом часть дописывает кто-то другой: сосед, нанятый человек, преподаватель. Проверяющий смотрит на текст, но не оценивает почерк. Задача ИИ: поймать фальсификацию почерка без эталона: система не знает заранее, как пишет конкретный ученик. Единственное, от чего можно отталкиваться - начало бланка, мы предполагаем, что первые строки написал сам экзаменуемый. Цель: определить, написан ли весь бланк экзаменационной работы одним человеком. На входе - скан бланка, порой низкого качества. На выходе — координаты подозрительных фрагментов для ручной проверки. Все это в режиме потоковой обработки. Основной вызов: экзаменационный бланк — это смешанный документ. Рукописный текст соседствует с формулами, графиками, схемами, печатной подложкой бланка.

https://habr.com/ru/articles/1037850/

#ocr #ocrтехнологии #computer_vision #yolo #компьютерное_зрение #pytorch #распознавание_текста #распознавание_рукописного_текста

#распознавание_рукописного_текста #распознавание_текста #pytorch #компьютерное_зрение #yolo #computer_vision

Habr @[email protected] · 2026-05-21 · 14:52 UTC

Детекция чужого почерка в экзаменационных бланках без эталонного образца

Один ученик писал экзаменационную работу, а кто-то чужой дописал часть за него. Как мы научили нейросеть распознавать это. Дано: государственная аттестация, бумажные бланки, никакого онлайн-контроля. Классический способ фальсификации: ученик начинает работу сам, потом часть дописывает кто-то другой: сосед, нанятый человек, преподаватель. Проверяющий смотрит на текст, но не оценивает почерк. Задача ИИ: поймать фальсификацию почерка без эталона: система не знает заранее, как пишет конкретный ученик. Единственное, от чего можно отталкиваться - начало бланка, мы предполагаем, что первые строки написал сам экзаменуемый. Цель: определить, написан ли весь бланк экзаменационной работы одним человеком. На входе - скан бланка, порой низкого качества. На выходе — координаты подозрительных фрагментов для ручной проверки. Все это в режиме потоковой обработки. Основной вызов: экзаменационный бланк — это смешанный документ. Рукописный текст соседствует с формулами, графиками, схемами, печатной подложкой бланка.

https://habr.com/ru/articles/1037850/

#ocr #ocrтехнологии #computer_vision #yolo #компьютерное_зрение #pytorch #распознавание_текста #распознавание_рукописного_текста

#распознавание_рукописного_текста #распознавание_текста #pytorch #компьютерное_зрение #yolo #computer_vision

Habr @[email protected] · 2026-05-21 · 14:52 UTC

Детекция чужого почерка в экзаменационных бланках без эталонного образца

Один ученик писал экзаменационную работу, а кто-то чужой дописал часть за него. Как мы научили нейросеть распознавать это. Дано: государственная аттестация, бумажные бланки, никакого онлайн-контроля. Классический способ фальсификации: ученик начинает работу сам, потом часть дописывает кто-то другой: сосед, нанятый человек, преподаватель. Проверяющий смотрит на текст, но не оценивает почерк. Задача ИИ: поймать фальсификацию почерка без эталона: система не знает заранее, как пишет конкретный ученик. Единственное, от чего можно отталкиваться - начало бланка, мы предполагаем, что первые строки написал сам экзаменуемый. Цель: определить, написан ли весь бланк экзаменационной работы одним человеком. На входе - скан бланка, порой низкого качества. На выходе — координаты подозрительных фрагментов для ручной проверки. Все это в режиме потоковой обработки. Основной вызов: экзаменационный бланк — это смешанный документ. Рукописный текст соседствует с формулами, графиками, схемами, печатной подложкой бланка.

https://habr.com/ru/articles/1037850/

#ocr #ocrтехнологии #computer_vision #yolo #компьютерное_зрение #pytorch #распознавание_текста #распознавание_рукописного_текста

#ocr #ocrтехнологии #computer_vision #yolo #компьютерное_зрение #pytorch

Habr @[email protected] · 2026-05-06 · 09:02 UTC

Machine Unlearning. Как измерить и достичь «забывания»?

Всем привет! Меня зовут Вадим, я — Data Scientist в компании Raft. Эта статья написана по мотивам моего выступления на конференции

https://habr.com/ru/companies/oleg-bunin/articles/1014692/

#ai #ml #GenAI #perception #генерация #нейросеть #alighnment #RL #генерация_видео #распознавание_текста

#распознавание_текста #генерация_видео #rl #alighnment #нейросеть #генерация

Habr @[email protected] · 2026-05-06 · 09:02 UTC

Machine Unlearning. Как измерить и достичь «забывания»?

Всем привет! Меня зовут Вадим, я — Data Scientist в компании Raft. Эта статья написана по мотивам моего выступления на конференции

https://habr.com/ru/companies/oleg-bunin/articles/1014692/

#ai #ml #GenAI #perception #генерация #нейросеть #alighnment #RL #генерация_видео #распознавание_текста

#распознавание_текста #генерация_видео #rl #alighnment #нейросеть #генерация

Habr @[email protected] · 2026-05-06 · 09:02 UTC

Machine Unlearning. Как измерить и достичь «забывания»?

Всем привет! Меня зовут Вадим, я — Data Scientist в компании Raft. Эта статья написана по мотивам моего выступления на конференции

https://habr.com/ru/companies/oleg-bunin/articles/1014692/

#ai #ml #GenAI #perception #генерация #нейросеть #alighnment #RL #генерация_видео #распознавание_текста

#распознавание_текста #генерация_видео #rl #alighnment #нейросеть #генерация

Habr @[email protected] · 2026-05-06 · 09:02 UTC

Machine Unlearning. Как измерить и достичь «забывания»?

Всем привет! Меня зовут Вадим, я — Data Scientist в компании Raft. Эта статья написана по мотивам моего выступления на конференции

https://habr.com/ru/companies/oleg-bunin/articles/1014692/

#ai #ml #GenAI #perception #генерация #нейросеть #alighnment #RL #генерация_видео #распознавание_текста

#ai #ml #genai #perception #генерация #нейросеть

Habr @[email protected] · 2026-05-05 · 12:02 UTC

OCR в кармане: как HunyuanOCR на 1B параметров потеснил гигантов в задачах парсинга документов

Всем привет! Меня зовут Артем, я Data Scientist в компании Raft Digital Solutions . В этой статье расскажу про свой опыт работы с HunyuanOCR end-to-end моделью от Tencent для распознавания текста на 1B параметров. Несмотря на громкие заявления о «SOTA-результатах» и компактности, в публичных обзорах практически не описано, как эта модель ведет себя в реальных задачах: с чем приходится столкнуться при настройке окружения, почему она может уйти в бесконечное зацикливание и как заставить её эффективно парсить сложные таблицы на обычном «железе». Поделюсь результатами своих экспериментов, покажу боевые промпты и объясню, в каких сценариях этот OCR-инструмент реально помогает экономить время, а где лучше даже не пытаться его использовать.

https://habr.com/ru/companies/raft/articles/1031684/

#ocr #document #ocrтехнологии #ocr_распознавание_документов #document_parsing #распознавание_текста #обработка_документов #таблицы #сканы #imagetotext

#imagetotext #сканы #таблицы #обработка_документов #распознавание_текста #document_parsing

Habr @[email protected] · 2026-05-05 · 12:02 UTC

OCR в кармане: как HunyuanOCR на 1B параметров потеснил гигантов в задачах парсинга документов

Всем привет! Меня зовут Артем, я Data Scientist в компании Raft Digital Solutions . В этой статье расскажу про свой опыт работы с HunyuanOCR end-to-end моделью от Tencent для распознавания текста на 1B параметров. Несмотря на громкие заявления о «SOTA-результатах» и компактности, в публичных обзорах практически не описано, как эта модель ведет себя в реальных задачах: с чем приходится столкнуться при настройке окружения, почему она может уйти в бесконечное зацикливание и как заставить её эффективно парсить сложные таблицы на обычном «железе». Поделюсь результатами своих экспериментов, покажу боевые промпты и объясню, в каких сценариях этот OCR-инструмент реально помогает экономить время, а где лучше даже не пытаться его использовать.

https://habr.com/ru/companies/raft/articles/1031684/

#ocr #document #ocrтехнологии #ocr_распознавание_документов #document_parsing #распознавание_текста #обработка_документов #таблицы #сканы #imagetotext

#imagetotext #сканы #таблицы #обработка_документов #распознавание_текста #document_parsing

Habr @[email protected] · 2026-05-05 · 12:02 UTC

OCR в кармане: как HunyuanOCR на 1B параметров потеснил гигантов в задачах парсинга документов

Всем привет! Меня зовут Артем, я Data Scientist в компании Raft Digital Solutions . В этой статье расскажу про свой опыт работы с HunyuanOCR end-to-end моделью от Tencent для распознавания текста на 1B параметров. Несмотря на громкие заявления о «SOTA-результатах» и компактности, в публичных обзорах практически не описано, как эта модель ведет себя в реальных задачах: с чем приходится столкнуться при настройке окружения, почему она может уйти в бесконечное зацикливание и как заставить её эффективно парсить сложные таблицы на обычном «железе». Поделюсь результатами своих экспериментов, покажу боевые промпты и объясню, в каких сценариях этот OCR-инструмент реально помогает экономить время, а где лучше даже не пытаться его использовать.

https://habr.com/ru/companies/raft/articles/1031684/

#ocr #document #ocrтехнологии #ocr_распознавание_документов #document_parsing #распознавание_текста #обработка_документов #таблицы #сканы #imagetotext

#imagetotext #сканы #таблицы #обработка_документов #распознавание_текста #document_parsing

Habr @[email protected] · 2026-05-05 · 12:02 UTC

OCR в кармане: как HunyuanOCR на 1B параметров потеснил гигантов в задачах парсинга документов

Всем привет! Меня зовут Артем, я Data Scientist в компании Raft Digital Solutions . В этой статье расскажу про свой опыт работы с HunyuanOCR end-to-end моделью от Tencent для распознавания текста на 1B параметров. Несмотря на громкие заявления о «SOTA-результатах» и компактности, в публичных обзорах практически не описано, как эта модель ведет себя в реальных задачах: с чем приходится столкнуться при настройке окружения, почему она может уйти в бесконечное зацикливание и как заставить её эффективно парсить сложные таблицы на обычном «железе». Поделюсь результатами своих экспериментов, покажу боевые промпты и объясню, в каких сценариях этот OCR-инструмент реально помогает экономить время, а где лучше даже не пытаться его использовать.

https://habr.com/ru/companies/raft/articles/1031684/

#ocr #document #ocrтехнологии #ocr_распознавание_документов #document_parsing #распознавание_текста #обработка_документов #таблицы #сканы #imagetotext

#ocr #document #ocrтехнологии #ocr_распознавание_документов #document_parsing #распознавание_текста

Habr @[email protected] · 2025-11-16 · 06:42 UTC

Современные OCR для сложных документов: сравниваем 6 open-source моделей на реальном кошмаре инженера

Привет, Хабр! Каждый, кто хоть раз пытался вытащить данные из скана акта или старого отчета, знает эту боль. Классические OCR-инструменты, вроде старого доброго Apache Tika, отлично справляются с простым печатным текстом, но пасуют перед реальными вызовами: таблицами со сложной вёрсткой, рукописными пометками, мелким курсивом и разными шрифтами в одном документе. Чтобы не быть голословными, давайте посмотрим на типичный «сложный» документ и что с ним делает Tika.

https://habr.com/ru/articles/966846/

#ocr #распознавание_текста #vlm #llm #мультимодальные_модели #qwen3 #gemma3 #paddleocr

#paddleocr #gemma3 #qwen3 #мультимодальные_модели #llm #vlm

Habr @[email protected] · 2025-11-01 · 05:32 UTC

Эффект Даннинга — Крюгера в нейросети. OCR распознавание текста LLM: доверяй, но проверяй

В череде серых офисных будней возникла насущная проблема. Есть сканы договоров, содержащие адреса пунктов (заправок) в табличной форме. Необходимо занести названия и адреса в базу, добавив геоданные. Можно сделать вручную, но это не наш метод. На дворе XXI век, автоматизация, да и простую лень никто не отменял. Бесплатные OCR распознаватели справляются плохо, особенно с таблицами, платные — не пробовал, жаба бухгалтер не позволяет. Что же делать? И тут Qwen спешит на помощь! Скормил лист — вроде неплохо, вот оно счастье! Ан нет, опять «эмпирический опыт». Давайте посмотрим, что получилось, и с какими «когнитивными искажениями» пришлось столкнуться.

https://habr.com/ru/articles/962314/

#ocr #llm #qwen #когнитивные_искажения #распознавание_текста

#распознавание_текста #когнитивные_искажения #qwen #llm #ocr

Habr @[email protected] · 2025-10-28 · 20:12 UTC

«Манускрипт. Распознать нельзя забыть: как мы научили нейросеть читать рукописи XIX века»

Manuscript OCR — открытая нейросеть для чтения рукописей XIX века Мы обучили свою OCR-модель распознавать дореформенную кириллицу, нестандартные почерки и сложные сканы. Всё — на собственных данных, с нуля. В статье — как мы это сделали и ссылки на репозиторий с кодом. Открыть рукопись

https://habr.com/ru/articles/961062/

#ocr #нейросеть #исторические_данные #разметка_данных #синтетические_данные #распознавание_текста

#распознавание_текста #синтетические_данные #разметка_данных #исторические_данные #нейросеть #ocr

Habr @[email protected] · 2025-10-28 · 20:12 UTC

«Манускрипт. Распознать нельзя забыть: как мы научили нейросеть читать рукописи XIX века»

Manuscript OCR — открытая нейросеть для чтения рукописей XIX века Мы обучили свою OCR-модель распознавать дореформенную кириллицу, нестандартные почерки и сложные сканы. Всё — на собственных данных, с нуля. В статье — как мы это сделали и ссылки на репозиторий с кодом. Открыть рукопись

https://habr.com/ru/articles/961062/

#ocr #нейросеть #исторические_данные #разметка_данных #синтетические_данные #распознавание_текста

#распознавание_текста #синтетические_данные #разметка_данных #исторические_данные #нейросеть #ocr

Habr @[email protected] · 2025-10-28 · 20:12 UTC

«Манускрипт. Распознать нельзя забыть: как мы научили нейросеть читать рукописи XIX века»

Manuscript OCR — открытая нейросеть для чтения рукописей XIX века Мы обучили свою OCR-модель распознавать дореформенную кириллицу, нестандартные почерки и сложные сканы. Всё — на собственных данных, с нуля. В статье — как мы это сделали и ссылки на репозиторий с кодом. Открыть рукопись

https://habr.com/ru/articles/961062/

#ocr #нейросеть #исторические_данные #разметка_данных #синтетические_данные #распознавание_текста

#распознавание_текста #синтетические_данные #разметка_данных #исторические_данные #нейросеть #ocr

Habr @[email protected] · 2025-10-28 · 20:12 UTC

«Манускрипт. Распознать нельзя забыть: как мы научили нейросеть читать рукописи XIX века»

Manuscript OCR — открытая нейросеть для чтения рукописей XIX века Мы обучили свою OCR-модель распознавать дореформенную кириллицу, нестандартные почерки и сложные сканы. Всё — на собственных данных, с нуля. В статье — как мы это сделали и ссылки на репозиторий с кодом. Открыть рукопись

https://habr.com/ru/articles/961062/

#ocr #нейросеть #исторические_данные #разметка_данных #синтетические_данные #распознавание_текста

Habr @[email protected] · 2025-09-17 · 08:02 UTC

«Большие вызовы»: как школьники за 3 недели собрали модуль для офлайн-распознавания документов на Android

Привет, Хабр! Меня зовут Олег Милосердов, я руковожу проектами по компьютерному зрению в ВТБ. В июле мы с коллегами приняли участие в научно-технологической программе «Большие вызовы» от образовательного центра «Сириус» в качестве наставников. Мы предложили школьникам спроектировать и внедрить автономный модуль распознавания MRZ-зоны документов, удостоверяющих личность, прямо на мобильном устройстве под Android, которое работает без интернета, серверов и облака. В этой статье расскажу, как талантливые старшеклассники справились с задачей, какой опыт получили и какие выводы мы можем сделать как наставники.

https://habr.com/ru/companies/vtb/articles/947510/

#CV #ML #Сириус #Распознавание_текста #android #python

#cv #ml #сириус #распознавание_текста #android #python

Habr @[email protected] · 2025-07-03 · 19:32 UTC

Как мы научили нейросети читать паспорта: история борьбы с бликами, водяными знаками и кривыми фото

Привет, Хабр! Если вы когда-либо сталкивались с автоматическим распознаванием документов, то знаете, насколько сложно работать с документами удостоверяющими личность (ID-документами). Хотя, казалось бы, что может быть проще, чем распознать фото паспорта, но на практике это может вызывать сложности у OCR-алгоритмов. Ведь паспорта, водительские удостоверения и другие ID-формы часто содержат сложные фоны, голограммы, блики от ламинации и т.п. Раньше для распознавания ID-документов в наших продуктах мы использовали бинаризацию — метод, который упрощал изображение до черно-белого формата. Однако вместе с шумами при бинаризации «затирались» и полезные данные. А когда в кадр попадали пальцы или документ лежал под углом, результаты распознавания могли стать совсем непредсказуемыми. Под катом расскажем, как нам удалось повысить точность распознавания ID-документов на 40%, какие технологии за этим стоят и почему старые методы перестали справляться с современными вызовами. Узнать подробности

https://habr.com/ru/companies/contentai/articles/924660/

#распознавание_образов #распознавание_изображений #распознавание_текста #документы_удостоверяющие_личность #паспорта #паспорт #ocr #ocrтехнологии

#распознавание_образов #распознавание_изображений #распознавание_текста #документы_удостоверяющие_личность #паспорта #паспорт

Habr @[email protected] · 2025-07-03 · 19:32 UTC

Как мы научили нейросети читать паспорта: история борьбы с бликами, водяными знаками и кривыми фото

Привет, Хабр! Если вы когда-либо сталкивались с автоматическим распознаванием документов, то знаете, насколько сложно работать с документами удостоверяющими личность (ID-документами). Хотя, казалось бы, что может быть проще, чем распознать фото паспорта, но на практике это может вызывать сложности у OCR-алгоритмов. Ведь паспорта, водительские удостоверения и другие ID-формы часто содержат сложные фоны, голограммы, блики от ламинации и т.п. Раньше для распознавания ID-документов в наших продуктах мы использовали бинаризацию — метод, который упрощал изображение до черно-белого формата. Однако вместе с шумами при бинаризации «затирались» и полезные данные. А когда в кадр попадали пальцы или документ лежал под углом, результаты распознавания могли стать совсем непредсказуемыми. Под катом расскажем, как нам удалось повысить точность распознавания ID-документов на 40%, какие технологии за этим стоят и почему старые методы перестали справляться с современными вызовами. Узнать подробности

https://habr.com/ru/companies/contentai/articles/924660/

#распознавание_образов #распознавание_изображений #распознавание_текста #документы_удостоверяющие_личность #паспорта #паспорт #ocr #ocrтехнологии

#распознавание_образов #распознавание_изображений #распознавание_текста #документы_удостоверяющие_личность #паспорта #паспорт

Habr @[email protected] · 2025-07-03 · 19:32 UTC

Как мы научили нейросети читать паспорта: история борьбы с бликами, водяными знаками и кривыми фото

Привет, Хабр! Если вы когда-либо сталкивались с автоматическим распознаванием документов, то знаете, насколько сложно работать с документами удостоверяющими личность (ID-документами). Хотя, казалось бы, что может быть проще, чем распознать фото паспорта, но на практике это может вызывать сложности у OCR-алгоритмов. Ведь паспорта, водительские удостоверения и другие ID-формы часто содержат сложные фоны, голограммы, блики от ламинации и т.п. Раньше для распознавания ID-документов в наших продуктах мы использовали бинаризацию — метод, который упрощал изображение до черно-белого формата. Однако вместе с шумами при бинаризации «затирались» и полезные данные. А когда в кадр попадали пальцы или документ лежал под углом, результаты распознавания могли стать совсем непредсказуемыми. Под катом расскажем, как нам удалось повысить точность распознавания ID-документов на 40%, какие технологии за этим стоят и почему старые методы перестали справляться с современными вызовами. Узнать подробности

https://habr.com/ru/companies/contentai/articles/924660/

#распознавание_образов #распознавание_изображений #распознавание_текста #документы_удостоверяющие_личность #паспорта #паспорт #ocr #ocrтехнологии

#распознавание_образов #распознавание_изображений #распознавание_текста #документы_удостоверяющие_личность #паспорта #паспорт

Habr @[email protected] · 2025-07-03 · 19:32 UTC

Как мы научили нейросети читать паспорта: история борьбы с бликами, водяными знаками и кривыми фото

Привет, Хабр! Если вы когда-либо сталкивались с автоматическим распознаванием документов, то знаете, насколько сложно работать с документами удостоверяющими личность (ID-документами). Хотя, казалось бы, что может быть проще, чем распознать фото паспорта, но на практике это может вызывать сложности у OCR-алгоритмов. Ведь паспорта, водительские удостоверения и другие ID-формы часто содержат сложные фоны, голограммы, блики от ламинации и т.п. Раньше для распознавания ID-документов в наших продуктах мы использовали бинаризацию — метод, который упрощал изображение до черно-белого формата. Однако вместе с шумами при бинаризации «затирались» и полезные данные. А когда в кадр попадали пальцы или документ лежал под углом, результаты распознавания могли стать совсем непредсказуемыми. Под катом расскажем, как нам удалось повысить точность распознавания ID-документов на 40%, какие технологии за этим стоят и почему старые методы перестали справляться с современными вызовами. Узнать подробности

https://habr.com/ru/companies/contentai/articles/924660/

#распознавание_образов #распознавание_изображений #распознавание_текста #документы_удостоверяющие_личность #паспорта #паспорт #ocr #ocrтехнологии

#ocrтехнологии #ocr #паспорт #паспорта #документы_удостоверяющие_личность #распознавание_текста

Habr @[email protected] · 2025-05-19 · 09:22 UTC

Рукописный редактор на Python: инструкция для тех, кто хочет «рисовать» код

Привет, меня зовут Лёня! Я автор YouTube‑канала eleday о программировании на Python. Недавно в школе была проверочная работа и мне пришлось писать код на бумаге. Такой подход показался странным: все-таки программа может исполняться только на компьютере и логично набирать ее там же. Подобная цепочка рассуждений привела к интересной идее — редактору рукописного ввода. В этой статье расскажу о задумке и деталях ее реализации. Создадим виртуальный лист, на котором можно набросать код от руки — и он будет исполняться!

https://habr.com/ru/companies/selectel/articles/910602/

#selectel #python #javascript #распознавание_текста #ocr #ocrтехнологии #webпрограммирование

#webпрограммирование #ocrтехнологии #ocr #распознавание_текста #javascript #python

Habr @[email protected] · 2025-03-20 · 17:52 UTC

Технологии распознавания паспорта – 10 лет. Хабрология от Smart Engines

Десять лет назад, 17 марта 2015 года, мы опубликовали свой самый первый хабр . Тогда мы впервые представили городу и миру нашу технологию распознавания паспорта на мобильнике. Публика в комментах разделилась на два лагеря: одни сомневались в пользе решения, другие критиковали за недостаток возможностей и предлагали идеи по улучшению. Теперь, с высоты уже немалого времени докладываем: 1) идея себя оправдала и даже превзошла самые смелые ожидания; 2) работа по совершенствованию технологии была проделана; 3) работы было и будет очень много. Собрали для вас хайлайты этой увлекательной и яркой истории. Как это было?

https://habr.com/ru/companies/smartengines/articles/892420/

#ии #распознавание_образов #распознавание_изображений #распознавание_текста #распознавание_паспорта #документы #ocr #ocrтехнологии #компьютерное_зрение #программирование

#программирование #компьютерное_зрение #ocrтехнологии #ocr #документы #распознавание_паспорта

Habr @[email protected] · 2025-03-14 · 13:12 UTC

Решение задач распознавания на Flutter

Задачи распознавания изображений и звука имеют широкий спектр применений в различных приложениях. Используя Flutter, как мощный фреймворк для разработки кроссплатформенных мобильных приложений, вполне возможно реализовать функционал распознавания данных в несколько шагов. В этой статье мы рассмотрим некоторые из задач распознавания, такие как распознавание лиц, текста и звука, и приведем фрагменты кода и рекомендуемые библиотеки для их реализации на Flutter.

https://habr.com/ru/articles/890700/

#flutter #распознавание_речи #распознавание_лиц #распознавание_текста #google #ml_kit

#ml_kit #google #распознавание_текста #распознавание_лиц #распознавание_речи #flutter

Habr @[email protected] · 2025-03-14 · 13:12 UTC

Решение задач распознавания на Flutter

Задачи распознавания изображений и звука имеют широкий спектр применений в различных приложениях. Используя Flutter, как мощный фреймворк для разработки кроссплатформенных мобильных приложений, вполне возможно реализовать функционал распознавания данных в несколько шагов. В этой статье мы рассмотрим некоторые из задач распознавания, такие как распознавание лиц, текста и звука, и приведем фрагменты кода и рекомендуемые библиотеки для их реализации на Flutter.

https://habr.com/ru/articles/890700/

#flutter #распознавание_речи #распознавание_лиц #распознавание_текста #google #ml_kit

#ml_kit #google #распознавание_текста #распознавание_лиц #распознавание_речи #flutter

Habr @[email protected] · 2025-03-14 · 13:12 UTC

Решение задач распознавания на Flutter

Задачи распознавания изображений и звука имеют широкий спектр применений в различных приложениях. Используя Flutter, как мощный фреймворк для разработки кроссплатформенных мобильных приложений, вполне возможно реализовать функционал распознавания данных в несколько шагов. В этой статье мы рассмотрим некоторые из задач распознавания, такие как распознавание лиц, текста и звука, и приведем фрагменты кода и рекомендуемые библиотеки для их реализации на Flutter.

https://habr.com/ru/articles/890700/

#flutter #распознавание_речи #распознавание_лиц #распознавание_текста #google #ml_kit

#ml_kit #google #распознавание_текста #распознавание_лиц #распознавание_речи #flutter

Habr @[email protected] · 2025-03-14 · 13:12 UTC

Решение задач распознавания на Flutter

Задачи распознавания изображений и звука имеют широкий спектр применений в различных приложениях. Используя Flutter, как мощный фреймворк для разработки кроссплатформенных мобильных приложений, вполне возможно реализовать функционал распознавания данных в несколько шагов. В этой статье мы рассмотрим некоторые из задач распознавания, такие как распознавание лиц, текста и звука, и приведем фрагменты кода и рекомендуемые библиотеки для их реализации на Flutter.

https://habr.com/ru/articles/890700/

#flutter #распознавание_речи #распознавание_лиц #распознавание_текста #google #ml_kit

Habr @[email protected] · 2025-03-12 · 15:02 UTC

Модели T-lite и T-pro: training report

Привет! Я Дима Стоянов, MLE в команде разработки фундаментальных моделей. Мы продолжаем рассказывать о наших моделях T-lite и T-pro. Общие характеристики и результаты бенчмарков описывали в предыдущей публикации. В этой статье раскроем детали предобучения: от подготовки данных до финальных экспериментов, а совсем скоро поделимся особенностями этапа post-training.

https://habr.com/ru/companies/tbank/articles/890236/

#машинное_обучениe #распознавание_текста #llmмодели #языковые_модели

#языковые_модели #llmмодели #распознавание_текста #машинное_обучениe

Habr @[email protected] · 2025-03-01 · 06:32 UTC

Методы распознавания матерных (и не только) языков

Всем привет! Меня зовут Миша, я работаю Backend-разработчиком в Doubletapp . В одном из проектов появилась фича по добавлению тегов по интересам. Любой пользователь может создать интерес, и он будет виден всем остальным. Неожиданно (!!!) появились интересы с не очень хорошими словами, которые обычно называют матерными. Встала задача по распознаванию языка с матерными словами, чтобы исключить возможность добавления гадости в наш огород!

https://habr.com/ru/companies/doubletapp/articles/886832/

#распознавание_речи #распознавание_текста #фильтрация_спама #триграммы #нечеткий_поиск #chatgpt

#chatgpt #нечеткий_поиск #триграммы #фильтрация_спама #распознавание_текста #распознавание_речи

Habr @[email protected] · 2024-10-04 · 09:02 UTC

Адские условия: Самый суровый краш-тест технологии распознавания паспорта

Как вы знаете, в ситуациях, когда необходимо быстро и безопасно обработать данные паспорта и любых других документов, технологии распознавания Smart Engines творят настоящие чудеса. Качеству и надежности нашей технологии доверяют лидеры цифровой трансформации: госведомства, ведущие банки, аэропорты, промышленность и бизнес. Мы ценим доверие наших клиентов, а для вас, дорогие читатели, решили наглядно показать эффективность наших систем. Так сказать, лучше один раз увидеть, чем сто раз услышать. Летс гоу!

https://habr.com/ru/companies/smartengines/articles/848130/

#распознавание_образов #распознавание_изображений #распознавание_текста #распознавание_паспорта #документы #ocrтехнологии #ocr #компьютерное_зрение #тест #smart_engines

#smart_engines #тест #компьютерное_зрение #ocr #ocrтехнологии #документы

Habr @[email protected] · 2024-09-24 · 07:52 UTC

Зачем Густаву Таушеку понадобились свои собственные перфокарты

Перфокарточная система для бухгалтерского и статистического учёта, барабанная магнитная память и машина для распознавания текста — это ключевые изобретения Густава Таушека, самоучки без формального образования. В истории вычислительной техники вообще много недооценённых или позабытых персоналий. Схема магнитной барабанной памяти Таушека из американского патента US2080100A 1937 года Перфокарты в то время были делом совершенно рядовым, но Таушек решил разработать свой формат, потому что под кастомную машину для бухучёта были нужны кастомные перфокарты. Ну и ещё потому что мог.

https://habr.com/ru/companies/gazprombank/articles/845394/

#банк #перфокарточная_система #барабанная_магнитная_память #распознавание_текста #изобретение

#изобретение #распознавание_текста #барабанная_магнитная_память #перфокарточная_система #банк

Habr @[email protected] · 2024-09-19 · 14:22 UTC

Методы предпроцессинга в IDP-системе ITFB EasyDoc

Всем привет! На связи команда Data Science компании ITFB Group. У нашей компании есть собственная разработка ITFB EasyDoc — система распознавания и извлечения данных из любого типа документов. В современном мире автоматизация обработки документов стала неотъемлемой частью множества бизнес-процессов. Предобработка изображений документов является важным шагом для обеспечения точности и надежности дальнейшего распознавания атрибутов. В этой статье мы хотим рассказать о некоторых эффективных методах предпроцессинга документов, позволяющих увеличивать как качество OCR-систем (Optical Character Recognition), так и различные CV и NLP пайплайны. Всем, кому интересна эта тема, — добро пожаловать под кат.

https://habr.com/ru/companies/itfb/articles/844380/

#ocr #ocrтехнологии #распознавание #распознавание_изображений #распознавание_паспорта #распознавание_документов #распознавание_объектов #распознавание_номеров #распознавание_текста #idp

#idp #распознавание_текста #распознавание_номеров #распознавание_объектов #распознавание_документов #распознавание_паспорта

Habr @[email protected] · 2024-09-03 · 11:22 UTC

IDP и OCR в вопросах и ответах: Главное, что нужно знать

Когда мы готовили этот материал, долго спорили, с какими персонажами можно было бы для наглядности сравнить OCR и IDP. Предлагались братья Коэны, Тор и Локи, Цезарь и Брут и много кто еще. Как видите, к одному мнению на этот счет мы в Smart Engines так и не пришли. Зато абсолютное единство было достигнуто по другому вопросу - о природе OCR и IDP. И если с культурными сравнениями еще можно поспорить, то в технологическом аспекте мы знаем все по фактам. Опустим высокие метафоры и расскажем, что такое OCR и IDP и на чьей стороне правда. Узнать, где правда 🔍

https://habr.com/ru/companies/smartengines/articles/840524/

#распознавание #ocr #ии #распознавание_образов #распознавание_текста #распознавание_номеров #распознавание_объектов #распознавание_документов #распознавание_паспорта #технологии

#технологии #распознавание_паспорта #распознавание_документов #распознавание_объектов #распознавание_номеров #распознавание_текста

Habr @[email protected] · 2024-08-29 · 04:02 UTC

Создание искусственного датасета для обучения модели с использованием Paddle OCR

Привет, коллеги! Продолжаем тему разработки плагина для распознавания иврита с использованием Paddle OCR. В прошлый раз я забыла представиться, сделаю это в этом посте) Меня зовут Алексей, я руковожу компанией, которая занимается разработкой с применением ИИ-технологий. Сам я тоже погружен в разработку, но больше доверяю это своей команде – нам удалось собрать команду классных профи. Истории из нашей совместной работы я и планирую рассказывать в своем блоге. Вернемся к теме статьи. Сегодня остановимся подробнее на создании искусственного датасета для обучения модели с использованием Paddle OCR. Этим занимался мой коллега Александр – экспертв компьютерном зрении. Когда перед нами встала задача распознавания текста на иврите, стало ясно, что найти готовый датасет с нужными характеристиками практически невозможно. Это подтолкнуло нас к созданию собственного датасета, который оказался не только полезным, но и дал возможность потренироваться в генерации синтетических данных. В этом посте мы подробно расскажем, как именно подошли к этому процессу.

https://habr.com/ru/articles/839326/

#искусственный_интеллект #компьютерное_зрение #распознавание_текста #paddleocr #tesseract #датасет #аугментация_данных

#аугментация_данных #датасет #tesseract #paddleocr #распознавание_текста #компьютерное_зрение

Habr @[email protected] · 2024-08-26 · 12:12 UTC

Автоматизация распознавания и подсчёта транзакций с изображений

Большинство процессов в нашем современном мире стремится к автоматизации. Хотелось бы разместить здесь свою наработку. Надеюсь данный материал найдёт своего читателя. В данной статье рассмотрим автоматизацию введения ежедневных отчетов компании.

https://habr.com/ru/articles/838328/

#javascript #nodejs #финансы #транзакции #распознавание_текста

#распознавание_текста #транзакции #финансы #nodejs #javascript

Habr @[email protected] · 2024-08-17 · 14:32 UTC

Создание плагина для распознавания текста на иврите: мой опыт и решения

Всем привет! Хочу поделиться недавним проектом, в котором я разрабатывал плагин для распознавания текста на иврите. Задача была непростая, особенно учитывая, что клиент уже пытался использовать Tesseract OCR, но точность распознавания оставляла желать лучшего. В этой статье расскажу о том, с какими трудностями я столкнулся и как их преодолел.

https://habr.com/ru/articles/836714/

#искусственный_интеллект #ocrтехнологии #распознавание_текста #paddleocr #tesseract_ocr #python #датасет #аугментация #easyocr

#easyocr #аугментация #датасет #python #tesseract_ocr #paddleocr

Habr @[email protected] · 2024-07-23 · 10:12 UTC

Наш опыт применения AI-технологий для классификации документов для подачи в суд

Как мы создали, обучили и выпустили в свет сервис, использующий технологию машинного обучения для распознавания и классификации юридических документов? В этой статье мы расскажем об опыте разработки этого решения для автоматизации труда юристов и взыскателей, и о трудностях на этом пути.

https://habr.com/ru/articles/830796/

#OCR #NLP #cnn #ai #распознавание_текста #распознавание_паспорта #распознавание_документов #legaltech #legal_services #legal

#legal #legal_services #legaltech #распознавание_документов #распознавание_паспорта #распознавание_текста

Habr @[email protected] · 2023-12-08 · 08:52 UTC

Российской OCR – 30 лет. Вспоминаем, как появилась первая отечественная технология распознавания (Часть 1. OCR Tiger)

В 2023 году первой российской коммерческой технологии распознавания текста исполнилось ровно 30 лет . В честь этой знаковой даты мы решили подготовить серию материалов о том, когда появились и что из себя представляли первые отечественные OCR. Кто был главными участниками в гонке по созданию систем распознаванию? Как так вышло, что в середине 90-х OCR была признана второй по значимости софтовой разработкой после ОС? Как выглядела первая OCR-ка для Mac? Ответим на эти и многие другие вопросы, присаживайтесь поудобнее. Во время подготовки текстов мы побеседовали с директором по науке и душой нашей компании, доктором технических наук, профессором, членом-корреспондентом РАН Владимиром Львовичем Арлазаровым . Он – как, кстати, и еще несколько членов нашей команды Smart Engines – принимал непосредственное участие в создании первых систем автоматического ввода текста. Сегодня речь пойдет про OCR Tiger и про то, как эта система работает.

https://habr.com/ru/companies/smartengines/articles/779154/

#распознавание_текста #ocr #распознавание_образов #искусственный_интеллект #обработка_изображений

#обработка_изображений #искусственный_интеллект #распознавание_образов #ocr #распознавание_текста