home.social

#распознавание_текста — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #распознавание_текста, aggregated by home.social.

  1. Детекция чужого почерка в экзаменационных бланках без эталонного образца

    Один ученик писал экзаменационную работу, а кто-то чужой дописал часть за него. Как мы научили нейросеть распознавать это. Дано: государственная аттестация, бумажные бланки, никакого онлайн-контроля. Классический способ фальсификации: ученик начинает работу сам, потом часть дописывает кто-то другой: сосед, нанятый человек, преподаватель. Проверяющий смотрит на текст, но не оценивает почерк. Задача ИИ: поймать фальсификацию почерка без эталона: система не знает заранее, как пишет конкретный ученик. Единственное, от чего можно отталкиваться - начало бланка, мы предполагаем, что первые строки написал сам экзаменуемый. Цель: определить, написан ли весь бланк экзаменационной работы одним человеком. На входе - скан бланка, порой низкого качества. На выходе — координаты подозрительных фрагментов для ручной проверки. Все это в режиме потоковой обработки. Основной вызов: экзаменационный бланк — это смешанный документ. Рукописный текст соседствует с формулами, графиками, схемами, печатной подложкой бланка.

    habr.com/ru/articles/1037850/

    #ocr #ocrтехнологии #computer_vision #yolo #компьютерное_зрение #pytorch #распознавание_текста #распознавание_рукописного_текста

  2. Детекция чужого почерка в экзаменационных бланках без эталонного образца

    Один ученик писал экзаменационную работу, а кто-то чужой дописал часть за него. Как мы научили нейросеть распознавать это. Дано: государственная аттестация, бумажные бланки, никакого онлайн-контроля. Классический способ фальсификации: ученик начинает работу сам, потом часть дописывает кто-то другой: сосед, нанятый человек, преподаватель. Проверяющий смотрит на текст, но не оценивает почерк. Задача ИИ: поймать фальсификацию почерка без эталона: система не знает заранее, как пишет конкретный ученик. Единственное, от чего можно отталкиваться - начало бланка, мы предполагаем, что первые строки написал сам экзаменуемый. Цель: определить, написан ли весь бланк экзаменационной работы одним человеком. На входе - скан бланка, порой низкого качества. На выходе — координаты подозрительных фрагментов для ручной проверки. Все это в режиме потоковой обработки. Основной вызов: экзаменационный бланк — это смешанный документ. Рукописный текст соседствует с формулами, графиками, схемами, печатной подложкой бланка.

    habr.com/ru/articles/1037850/

    #ocr #ocrтехнологии #computer_vision #yolo #компьютерное_зрение #pytorch #распознавание_текста #распознавание_рукописного_текста

  3. Детекция чужого почерка в экзаменационных бланках без эталонного образца

    Один ученик писал экзаменационную работу, а кто-то чужой дописал часть за него. Как мы научили нейросеть распознавать это. Дано: государственная аттестация, бумажные бланки, никакого онлайн-контроля. Классический способ фальсификации: ученик начинает работу сам, потом часть дописывает кто-то другой: сосед, нанятый человек, преподаватель. Проверяющий смотрит на текст, но не оценивает почерк. Задача ИИ: поймать фальсификацию почерка без эталона: система не знает заранее, как пишет конкретный ученик. Единственное, от чего можно отталкиваться - начало бланка, мы предполагаем, что первые строки написал сам экзаменуемый. Цель: определить, написан ли весь бланк экзаменационной работы одним человеком. На входе - скан бланка, порой низкого качества. На выходе — координаты подозрительных фрагментов для ручной проверки. Все это в режиме потоковой обработки. Основной вызов: экзаменационный бланк — это смешанный документ. Рукописный текст соседствует с формулами, графиками, схемами, печатной подложкой бланка.

    habr.com/ru/articles/1037850/

    #ocr #ocrтехнологии #computer_vision #yolo #компьютерное_зрение #pytorch #распознавание_текста #распознавание_рукописного_текста

  4. Детекция чужого почерка в экзаменационных бланках без эталонного образца

    Один ученик писал экзаменационную работу, а кто-то чужой дописал часть за него. Как мы научили нейросеть распознавать это. Дано: государственная аттестация, бумажные бланки, никакого онлайн-контроля. Классический способ фальсификации: ученик начинает работу сам, потом часть дописывает кто-то другой: сосед, нанятый человек, преподаватель. Проверяющий смотрит на текст, но не оценивает почерк. Задача ИИ: поймать фальсификацию почерка без эталона: система не знает заранее, как пишет конкретный ученик. Единственное, от чего можно отталкиваться - начало бланка, мы предполагаем, что первые строки написал сам экзаменуемый. Цель: определить, написан ли весь бланк экзаменационной работы одним человеком. На входе - скан бланка, порой низкого качества. На выходе — координаты подозрительных фрагментов для ручной проверки. Все это в режиме потоковой обработки. Основной вызов: экзаменационный бланк — это смешанный документ. Рукописный текст соседствует с формулами, графиками, схемами, печатной подложкой бланка.

    habr.com/ru/articles/1037850/

    #ocr #ocrтехнологии #computer_vision #yolo #компьютерное_зрение #pytorch #распознавание_текста #распознавание_рукописного_текста

  5. Machine Unlearning. Как измерить и достичь «забывания»?

    Всем привет! Меня зовут Вадим, я — Data Scientist в компании Raft. Эта статья написана по мотивам моего выступления на конференции

    habr.com/ru/companies/oleg-bun

    #ai #ml #GenAI #perception #генерация #нейросеть #alighnment #RL #генерация_видео #распознавание_текста

  6. Machine Unlearning. Как измерить и достичь «забывания»?

    Всем привет! Меня зовут Вадим, я — Data Scientist в компании Raft. Эта статья написана по мотивам моего выступления на конференции

    habr.com/ru/companies/oleg-bun

    #ai #ml #GenAI #perception #генерация #нейросеть #alighnment #RL #генерация_видео #распознавание_текста

  7. Machine Unlearning. Как измерить и достичь «забывания»?

    Всем привет! Меня зовут Вадим, я — Data Scientist в компании Raft. Эта статья написана по мотивам моего выступления на конференции

    habr.com/ru/companies/oleg-bun

    #ai #ml #GenAI #perception #генерация #нейросеть #alighnment #RL #генерация_видео #распознавание_текста

  8. Machine Unlearning. Как измерить и достичь «забывания»?

    Всем привет! Меня зовут Вадим, я — Data Scientist в компании Raft. Эта статья написана по мотивам моего выступления на конференции

    habr.com/ru/companies/oleg-bun

    #ai #ml #GenAI #perception #генерация #нейросеть #alighnment #RL #генерация_видео #распознавание_текста

  9. OCR в кармане: как HunyuanOCR на 1B параметров потеснил гигантов в задачах парсинга документов

    Всем привет! Меня зовут Артем, я Data Scientist в компании Raft Digital Solutions . В этой статье расскажу про свой опыт работы с HunyuanOCR end-to-end моделью от Tencent для распознавания текста на 1B параметров. Несмотря на громкие заявления о «SOTA-результатах» и компактности, в публичных обзорах практически не описано, как эта модель ведет себя в реальных задачах: с чем приходится столкнуться при настройке окружения, почему она может уйти в бесконечное зацикливание и как заставить её эффективно парсить сложные таблицы на обычном «железе». Поделюсь результатами своих экспериментов, покажу боевые промпты и объясню, в каких сценариях этот OCR-инструмент реально помогает экономить время, а где лучше даже не пытаться его использовать.

    habr.com/ru/companies/raft/art

    #ocr #document #ocrтехнологии #ocr_распознавание_документов #document_parsing #распознавание_текста #обработка_документов #таблицы #сканы #imagetotext

  10. OCR в кармане: как HunyuanOCR на 1B параметров потеснил гигантов в задачах парсинга документов

    Всем привет! Меня зовут Артем, я Data Scientist в компании Raft Digital Solutions . В этой статье расскажу про свой опыт работы с HunyuanOCR end-to-end моделью от Tencent для распознавания текста на 1B параметров. Несмотря на громкие заявления о «SOTA-результатах» и компактности, в публичных обзорах практически не описано, как эта модель ведет себя в реальных задачах: с чем приходится столкнуться при настройке окружения, почему она может уйти в бесконечное зацикливание и как заставить её эффективно парсить сложные таблицы на обычном «железе». Поделюсь результатами своих экспериментов, покажу боевые промпты и объясню, в каких сценариях этот OCR-инструмент реально помогает экономить время, а где лучше даже не пытаться его использовать.

    habr.com/ru/companies/raft/art

    #ocr #document #ocrтехнологии #ocr_распознавание_документов #document_parsing #распознавание_текста #обработка_документов #таблицы #сканы #imagetotext

  11. OCR в кармане: как HunyuanOCR на 1B параметров потеснил гигантов в задачах парсинга документов

    Всем привет! Меня зовут Артем, я Data Scientist в компании Raft Digital Solutions . В этой статье расскажу про свой опыт работы с HunyuanOCR end-to-end моделью от Tencent для распознавания текста на 1B параметров. Несмотря на громкие заявления о «SOTA-результатах» и компактности, в публичных обзорах практически не описано, как эта модель ведет себя в реальных задачах: с чем приходится столкнуться при настройке окружения, почему она может уйти в бесконечное зацикливание и как заставить её эффективно парсить сложные таблицы на обычном «железе». Поделюсь результатами своих экспериментов, покажу боевые промпты и объясню, в каких сценариях этот OCR-инструмент реально помогает экономить время, а где лучше даже не пытаться его использовать.

    habr.com/ru/companies/raft/art

    #ocr #document #ocrтехнологии #ocr_распознавание_документов #document_parsing #распознавание_текста #обработка_документов #таблицы #сканы #imagetotext

  12. OCR в кармане: как HunyuanOCR на 1B параметров потеснил гигантов в задачах парсинга документов

    Всем привет! Меня зовут Артем, я Data Scientist в компании Raft Digital Solutions . В этой статье расскажу про свой опыт работы с HunyuanOCR end-to-end моделью от Tencent для распознавания текста на 1B параметров. Несмотря на громкие заявления о «SOTA-результатах» и компактности, в публичных обзорах практически не описано, как эта модель ведет себя в реальных задачах: с чем приходится столкнуться при настройке окружения, почему она может уйти в бесконечное зацикливание и как заставить её эффективно парсить сложные таблицы на обычном «железе». Поделюсь результатами своих экспериментов, покажу боевые промпты и объясню, в каких сценариях этот OCR-инструмент реально помогает экономить время, а где лучше даже не пытаться его использовать.

    habr.com/ru/companies/raft/art

    #ocr #document #ocrтехнологии #ocr_распознавание_документов #document_parsing #распознавание_текста #обработка_документов #таблицы #сканы #imagetotext

  13. Современные OCR для сложных документов: сравниваем 6 open-source моделей на реальном кошмаре инженера

    Привет, Хабр! Каждый, кто хоть раз пытался вытащить данные из скана акта или старого отчета, знает эту боль. Классические OCR-инструменты, вроде старого доброго Apache Tika, отлично справляются с простым печатным текстом, но пасуют перед реальными вызовами: таблицами со сложной вёрсткой, рукописными пометками, мелким курсивом и разными шрифтами в одном документе. Чтобы не быть голословными, давайте посмотрим на типичный «сложный» документ и что с ним делает Tika.

    habr.com/ru/articles/966846/

    #ocr #распознавание_текста #vlm #llm #мультимодальные_модели #qwen3 #gemma3 #paddleocr

  14. Эффект Даннинга — Крюгера в нейросети. OCR распознавание текста LLM: доверяй, но проверяй

    В череде серых офисных будней возникла насущная проблема. Есть сканы договоров, содержащие адреса пунктов (заправок) в табличной форме. Необходимо занести названия и адреса в базу, добавив геоданные. Можно сделать вручную, но это не наш метод. На дворе XXI век, автоматизация, да и простую лень никто не отменял. Бесплатные OCR распознаватели справляются плохо, особенно с таблицами, платные — не пробовал, жаба бухгалтер не позволяет. Что же делать? И тут Qwen спешит на помощь! Скормил лист — вроде неплохо, вот оно счастье! Ан нет, опять «эмпирический опыт». Давайте посмотрим, что получилось, и с какими «когнитивными искажениями» пришлось столкнуться.

    habr.com/ru/articles/962314/

    #ocr #llm #qwen #когнитивные_искажения #распознавание_текста

  15. «Манускрипт. Распознать нельзя забыть: как мы научили нейросеть читать рукописи XIX века»

    Manuscript OCR — открытая нейросеть для чтения рукописей XIX века Мы обучили свою OCR-модель распознавать дореформенную кириллицу, нестандартные почерки и сложные сканы. Всё — на собственных данных, с нуля. В статье — как мы это сделали и ссылки на репозиторий с кодом. Открыть рукопись

    habr.com/ru/articles/961062/

    #ocr #нейросеть #исторические_данные #разметка_данных #синтетические_данные #распознавание_текста

  16. «Манускрипт. Распознать нельзя забыть: как мы научили нейросеть читать рукописи XIX века»

    Manuscript OCR — открытая нейросеть для чтения рукописей XIX века Мы обучили свою OCR-модель распознавать дореформенную кириллицу, нестандартные почерки и сложные сканы. Всё — на собственных данных, с нуля. В статье — как мы это сделали и ссылки на репозиторий с кодом. Открыть рукопись

    habr.com/ru/articles/961062/

    #ocr #нейросеть #исторические_данные #разметка_данных #синтетические_данные #распознавание_текста

  17. «Манускрипт. Распознать нельзя забыть: как мы научили нейросеть читать рукописи XIX века»

    Manuscript OCR — открытая нейросеть для чтения рукописей XIX века Мы обучили свою OCR-модель распознавать дореформенную кириллицу, нестандартные почерки и сложные сканы. Всё — на собственных данных, с нуля. В статье — как мы это сделали и ссылки на репозиторий с кодом. Открыть рукопись

    habr.com/ru/articles/961062/

    #ocr #нейросеть #исторические_данные #разметка_данных #синтетические_данные #распознавание_текста

  18. «Манускрипт. Распознать нельзя забыть: как мы научили нейросеть читать рукописи XIX века»

    Manuscript OCR — открытая нейросеть для чтения рукописей XIX века Мы обучили свою OCR-модель распознавать дореформенную кириллицу, нестандартные почерки и сложные сканы. Всё — на собственных данных, с нуля. В статье — как мы это сделали и ссылки на репозиторий с кодом. Открыть рукопись

    habr.com/ru/articles/961062/

    #ocr #нейросеть #исторические_данные #разметка_данных #синтетические_данные #распознавание_текста

  19. «Большие вызовы»: как школьники за 3 недели собрали модуль для офлайн-распознавания документов на Android

    Привет, Хабр! Меня зовут Олег Милосердов, я руковожу проектами по компьютерному зрению в ВТБ. В июле мы с коллегами приняли участие в научно-технологической программе «Большие вызовы» от образовательного центра «Сириус» в качестве наставников. Мы предложили школьникам спроектировать и внедрить автономный модуль распознавания MRZ-зоны документов, удостоверяющих личность, прямо на мобильном устройстве под Android, которое работает без интернета, серверов и облака. В этой статье расскажу, как талантливые старшеклассники справились с задачей, какой опыт получили и какие выводы мы можем сделать как наставники.

    habr.com/ru/companies/vtb/arti

    #CV #ML #Сириус #Распознавание_текста #android #python

  20. Как мы научили нейросети читать паспорта: история борьбы с бликами, водяными знаками и кривыми фото

    Привет, Хабр! Если вы когда-либо сталкивались с автоматическим распознаванием документов, то знаете, насколько сложно работать с документами удостоверяющими личность (ID-документами). Хотя, казалось бы, что может быть проще, чем распознать фото паспорта, но на практике это может вызывать сложности у OCR-алгоритмов. Ведь паспорта, водительские удостоверения и другие ID-формы часто содержат сложные фоны, голограммы, блики от ламинации и т.п. Раньше для распознавания ID-документов в наших продуктах мы использовали бинаризацию — метод, который упрощал изображение до черно-белого формата. Однако вместе с шумами при бинаризации «затирались» и полезные данные. А когда в кадр попадали пальцы или документ лежал под углом, результаты распознавания могли стать совсем непредсказуемыми. Под катом расскажем, как нам удалось повысить точность распознавания ID-документов на 40%, какие технологии за этим стоят и почему старые методы перестали справляться с современными вызовами. Узнать подробности

    habr.com/ru/companies/contenta

    #распознавание_образов #распознавание_изображений #распознавание_текста #документы_удостоверяющие_личность #паспорта #паспорт #ocr #ocrтехнологии

  21. Как мы научили нейросети читать паспорта: история борьбы с бликами, водяными знаками и кривыми фото

    Привет, Хабр! Если вы когда-либо сталкивались с автоматическим распознаванием документов, то знаете, насколько сложно работать с документами удостоверяющими личность (ID-документами). Хотя, казалось бы, что может быть проще, чем распознать фото паспорта, но на практике это может вызывать сложности у OCR-алгоритмов. Ведь паспорта, водительские удостоверения и другие ID-формы часто содержат сложные фоны, голограммы, блики от ламинации и т.п. Раньше для распознавания ID-документов в наших продуктах мы использовали бинаризацию — метод, который упрощал изображение до черно-белого формата. Однако вместе с шумами при бинаризации «затирались» и полезные данные. А когда в кадр попадали пальцы или документ лежал под углом, результаты распознавания могли стать совсем непредсказуемыми. Под катом расскажем, как нам удалось повысить точность распознавания ID-документов на 40%, какие технологии за этим стоят и почему старые методы перестали справляться с современными вызовами. Узнать подробности

    habr.com/ru/companies/contenta

    #распознавание_образов #распознавание_изображений #распознавание_текста #документы_удостоверяющие_личность #паспорта #паспорт #ocr #ocrтехнологии

  22. Как мы научили нейросети читать паспорта: история борьбы с бликами, водяными знаками и кривыми фото

    Привет, Хабр! Если вы когда-либо сталкивались с автоматическим распознаванием документов, то знаете, насколько сложно работать с документами удостоверяющими личность (ID-документами). Хотя, казалось бы, что может быть проще, чем распознать фото паспорта, но на практике это может вызывать сложности у OCR-алгоритмов. Ведь паспорта, водительские удостоверения и другие ID-формы часто содержат сложные фоны, голограммы, блики от ламинации и т.п. Раньше для распознавания ID-документов в наших продуктах мы использовали бинаризацию — метод, который упрощал изображение до черно-белого формата. Однако вместе с шумами при бинаризации «затирались» и полезные данные. А когда в кадр попадали пальцы или документ лежал под углом, результаты распознавания могли стать совсем непредсказуемыми. Под катом расскажем, как нам удалось повысить точность распознавания ID-документов на 40%, какие технологии за этим стоят и почему старые методы перестали справляться с современными вызовами. Узнать подробности

    habr.com/ru/companies/contenta

    #распознавание_образов #распознавание_изображений #распознавание_текста #документы_удостоверяющие_личность #паспорта #паспорт #ocr #ocrтехнологии

  23. Как мы научили нейросети читать паспорта: история борьбы с бликами, водяными знаками и кривыми фото

    Привет, Хабр! Если вы когда-либо сталкивались с автоматическим распознаванием документов, то знаете, насколько сложно работать с документами удостоверяющими личность (ID-документами). Хотя, казалось бы, что может быть проще, чем распознать фото паспорта, но на практике это может вызывать сложности у OCR-алгоритмов. Ведь паспорта, водительские удостоверения и другие ID-формы часто содержат сложные фоны, голограммы, блики от ламинации и т.п. Раньше для распознавания ID-документов в наших продуктах мы использовали бинаризацию — метод, который упрощал изображение до черно-белого формата. Однако вместе с шумами при бинаризации «затирались» и полезные данные. А когда в кадр попадали пальцы или документ лежал под углом, результаты распознавания могли стать совсем непредсказуемыми. Под катом расскажем, как нам удалось повысить точность распознавания ID-документов на 40%, какие технологии за этим стоят и почему старые методы перестали справляться с современными вызовами. Узнать подробности

    habr.com/ru/companies/contenta

    #распознавание_образов #распознавание_изображений #распознавание_текста #документы_удостоверяющие_личность #паспорта #паспорт #ocr #ocrтехнологии

  24. Рукописный редактор на Python: инструкция для тех, кто хочет «рисовать» код

    Привет, меня зовут Лёня! Я автор YouTube‑канала eleday о программировании на Python. Недавно в школе была проверочная работа и мне пришлось писать код на бумаге. Такой подход показался странным: все-таки программа может исполняться только на компьютере и логично набирать ее там же. Подобная цепочка рассуждений привела к интересной идее — редактору рукописного ввода. В этой статье расскажу о задумке и деталях ее реализации. Создадим виртуальный лист, на котором можно набросать код от руки — и он будет исполняться!

    habr.com/ru/companies/selectel

    #selectel #python #javascript #распознавание_текста #ocr #ocrтехнологии #webпрограммирование

  25. Технологии распознавания паспорта – 10 лет. Хабрология от Smart Engines

    Десять лет назад, 17 марта 2015 года, мы опубликовали свой самый первый хабр . Тогда мы впервые представили городу и миру нашу технологию распознавания паспорта на мобильнике. Публика в комментах разделилась на два лагеря: одни сомневались в пользе решения, другие критиковали за недостаток возможностей и предлагали идеи по улучшению. Теперь, с высоты уже немалого времени докладываем: 1) идея себя оправдала и даже превзошла самые смелые ожидания; 2) работа по совершенствованию технологии была проделана; 3) работы было и будет очень много. Собрали для вас хайлайты этой увлекательной и яркой истории. Как это было?

    habr.com/ru/companies/smarteng

    #ии #распознавание_образов #распознавание_изображений #распознавание_текста #распознавание_паспорта #документы #ocr #ocrтехнологии #компьютерное_зрение #программирование

  26. Решение задач распознавания на Flutter

    Задачи распознавания изображений и звука имеют широкий спектр применений в различных приложениях. Используя Flutter, как мощный фреймворк для разработки кроссплатформенных мобильных приложений, вполне возможно реализовать функционал распознавания данных в несколько шагов. В этой статье мы рассмотрим некоторые из задач распознавания, такие как распознавание лиц, текста и звука, и приведем фрагменты кода и рекомендуемые библиотеки для их реализации на Flutter.

    habr.com/ru/articles/890700/

    #flutter #распознавание_речи #распознавание_лиц #распознавание_текста #google #ml_kit

  27. Решение задач распознавания на Flutter

    Задачи распознавания изображений и звука имеют широкий спектр применений в различных приложениях. Используя Flutter, как мощный фреймворк для разработки кроссплатформенных мобильных приложений, вполне возможно реализовать функционал распознавания данных в несколько шагов. В этой статье мы рассмотрим некоторые из задач распознавания, такие как распознавание лиц, текста и звука, и приведем фрагменты кода и рекомендуемые библиотеки для их реализации на Flutter.

    habr.com/ru/articles/890700/

    #flutter #распознавание_речи #распознавание_лиц #распознавание_текста #google #ml_kit

  28. Решение задач распознавания на Flutter

    Задачи распознавания изображений и звука имеют широкий спектр применений в различных приложениях. Используя Flutter, как мощный фреймворк для разработки кроссплатформенных мобильных приложений, вполне возможно реализовать функционал распознавания данных в несколько шагов. В этой статье мы рассмотрим некоторые из задач распознавания, такие как распознавание лиц, текста и звука, и приведем фрагменты кода и рекомендуемые библиотеки для их реализации на Flutter.

    habr.com/ru/articles/890700/

    #flutter #распознавание_речи #распознавание_лиц #распознавание_текста #google #ml_kit

  29. Решение задач распознавания на Flutter

    Задачи распознавания изображений и звука имеют широкий спектр применений в различных приложениях. Используя Flutter, как мощный фреймворк для разработки кроссплатформенных мобильных приложений, вполне возможно реализовать функционал распознавания данных в несколько шагов. В этой статье мы рассмотрим некоторые из задач распознавания, такие как распознавание лиц, текста и звука, и приведем фрагменты кода и рекомендуемые библиотеки для их реализации на Flutter.

    habr.com/ru/articles/890700/

    #flutter #распознавание_речи #распознавание_лиц #распознавание_текста #google #ml_kit

  30. Модели T-lite и T-pro: training report

    Привет! Я Дима Стоянов, MLE в команде разработки фундаментальных моделей. Мы продолжаем рассказывать о наших моделях T-lite и T-pro. Общие характеристики и результаты бенчмарков описывали в предыдущей публикации. В этой статье раскроем детали предобучения: от подготовки данных до финальных экспериментов, а совсем скоро поделимся особенностями этапа post-training.

    habr.com/ru/companies/tbank/ar

    #машинное_обучениe #распознавание_текста #llmмодели #языковые_модели

  31. Методы распознавания матерных (и не только) языков

    Всем привет! Меня зовут Миша, я работаю Backend-разработчиком в Doubletapp . В одном из проектов появилась фича по добавлению тегов по интересам. Любой пользователь может создать интерес, и он будет виден всем остальным. Неожиданно (!!!) появились интересы с не очень хорошими словами, которые обычно называют матерными. Встала задача по распознаванию языка с матерными словами, чтобы исключить возможность добавления гадости в наш огород!

    habr.com/ru/companies/doubleta

    #распознавание_речи #распознавание_текста #фильтрация_спама #триграммы #нечеткий_поиск #chatgpt

  32. Адские условия: Самый суровый краш-тест технологии распознавания паспорта

    Как вы знаете, в ситуациях, когда необходимо быстро и безопасно обработать данные паспорта и любых других документов, технологии распознавания Smart Engines творят настоящие чудеса. Качеству и надежности нашей технологии доверяют лидеры цифровой трансформации: госведомства, ведущие банки, аэропорты, промышленность и бизнес. Мы ценим доверие наших клиентов, а для вас, дорогие читатели, решили наглядно показать эффективность наших систем. Так сказать, лучше один раз увидеть, чем сто раз услышать. Летс гоу!

    habr.com/ru/companies/smarteng

    #распознавание_образов #распознавание_изображений #распознавание_текста #распознавание_паспорта #документы #ocrтехнологии #ocr #компьютерное_зрение #тест #smart_engines

  33. Зачем Густаву Таушеку понадобились свои собственные перфокарты

    Перфокарточная система для бухгалтерского и статистического учёта, барабанная магнитная память и машина для распознавания текста — это ключевые изобретения Густава Таушека, самоучки без формального образования. В истории вычислительной техники вообще много недооценённых или позабытых персоналий. Схема магнитной барабанной памяти Таушека из американского патента US2080100A 1937 года Перфокарты в то время были делом совершенно рядовым, но Таушек решил разработать свой формат, потому что под кастомную машину для бухучёта были нужны кастомные перфокарты. Ну и ещё потому что мог.

    habr.com/ru/companies/gazpromb

    #банк #перфокарточная_система #барабанная_магнитная_память #распознавание_текста #изобретение

  34. Методы предпроцессинга в IDP-системе ITFB EasyDoc

    Всем привет! На связи команда Data Science компании ITFB Group. У нашей компании есть собственная разработка ITFB EasyDoc — система распознавания и извлечения данных из любого типа документов. В современном мире автоматизация обработки документов стала неотъемлемой частью множества бизнес-процессов. Предобработка изображений документов является важным шагом для обеспечения точности и надежности дальнейшего распознавания атрибутов. В этой статье мы хотим рассказать о некоторых эффективных методах предпроцессинга документов, позволяющих увеличивать как качество OCR-систем (Optical Character Recognition), так и различные CV и NLP пайплайны. Всем, кому интересна эта тема, — добро пожаловать под кат.

    habr.com/ru/companies/itfb/art

    #ocr #ocrтехнологии #распознавание #распознавание_изображений #распознавание_паспорта #распознавание_документов #распознавание_объектов #распознавание_номеров #распознавание_текста #idp

  35. IDP и OCR в вопросах и ответах: Главное, что нужно знать

    Когда мы готовили этот материал, долго спорили, с какими персонажами можно было бы для наглядности сравнить OCR и IDP. Предлагались братья Коэны, Тор и Локи, Цезарь и Брут и много кто еще. Как видите, к одному мнению на этот счет мы в Smart Engines так и не пришли. Зато абсолютное единство было достигнуто по другому вопросу - о природе OCR и IDP. И если с культурными сравнениями еще можно поспорить, то в технологическом аспекте мы знаем все по фактам. Опустим высокие метафоры и расскажем, что такое OCR и IDP и на чьей стороне правда. Узнать, где правда 🔍

    habr.com/ru/companies/smarteng

    #распознавание #ocr #ии #распознавание_образов #распознавание_текста #распознавание_номеров #распознавание_объектов #распознавание_документов #распознавание_паспорта #технологии

  36. Создание искусственного датасета для обучения модели с использованием Paddle OCR

    Привет, коллеги! Продолжаем тему разработки плагина для распознавания иврита с использованием Paddle OCR. В прошлый раз я забыла представиться, сделаю это в этом посте) Меня зовут Алексей, я руковожу компанией, которая занимается разработкой с применением ИИ-технологий. Сам я тоже погружен в разработку, но больше доверяю это своей команде – нам удалось собрать команду классных профи. Истории из нашей совместной работы я и планирую рассказывать в своем блоге. Вернемся к теме статьи. Сегодня остановимся подробнее на создании искусственного датасета для обучения модели с использованием Paddle OCR. Этим занимался мой коллега Александр – экспертв компьютерном зрении. Когда перед нами встала задача распознавания текста на иврите, стало ясно, что найти готовый датасет с нужными характеристиками практически невозможно. Это подтолкнуло нас к созданию собственного датасета, который оказался не только полезным, но и дал возможность потренироваться в генерации синтетических данных. В этом посте мы подробно расскажем, как именно подошли к этому процессу.

    habr.com/ru/articles/839326/

    #искусственный_интеллект #компьютерное_зрение #распознавание_текста #paddleocr #tesseract #датасет #аугментация_данных

  37. Автоматизация распознавания и подсчёта транзакций с изображений

    Большинство процессов в нашем современном мире стремится к автоматизации. Хотелось бы разместить здесь свою наработку. Надеюсь данный материал найдёт своего читателя. В данной статье рассмотрим автоматизацию введения ежедневных отчетов компании.

    habr.com/ru/articles/838328/

    #javascript #nodejs #финансы #транзакции #распознавание_текста

  38. Создание плагина для распознавания текста на иврите: мой опыт и решения

    Всем привет! Хочу поделиться недавним проектом, в котором я разрабатывал плагин для распознавания текста на иврите. Задача была непростая, особенно учитывая, что клиент уже пытался использовать Tesseract OCR, но точность распознавания оставляла желать лучшего. В этой статье расскажу о том, с какими трудностями я столкнулся и как их преодолел.

    habr.com/ru/articles/836714/

    #искусственный_интеллект #ocrтехнологии #распознавание_текста #paddleocr #tesseract_ocr #python #датасет #аугментация #easyocr

  39. Наш опыт применения AI-технологий для классификации документов для подачи в суд

    Как мы создали, обучили и выпустили в свет сервис, использующий технологию машинного обучения для распознавания и классификации юридических документов? В этой статье мы расскажем об опыте разработки этого решения для автоматизации труда юристов и взыскателей, и о трудностях на этом пути.

    habr.com/ru/articles/830796/

    #OCR #NLP #cnn #ai #распознавание_текста #распознавание_паспорта #распознавание_документов #legaltech #legal_services #legal

  40. Российской OCR – 30 лет. Вспоминаем, как появилась первая отечественная технология распознавания (Часть 1. OCR Tiger)

    В 2023 году первой российской коммерческой технологии распознавания текста исполнилось ровно 30 лет . В честь этой знаковой даты мы решили подготовить серию материалов о том, когда появились и что из себя представляли первые отечественные OCR. Кто был главными участниками в гонке по созданию систем распознаванию? Как так вышло, что в середине 90-х OCR была признана второй по значимости софтовой разработкой после ОС? Как выглядела первая OCR-ка для Mac? Ответим на эти и многие другие вопросы, присаживайтесь поудобнее. Во время подготовки текстов мы побеседовали с директором по науке и душой нашей компании, доктором технических наук, профессором, членом-корреспондентом РАН Владимиром Львовичем Арлазаровым . Он – как, кстати, и еще несколько членов нашей команды Smart Engines – принимал непосредственное участие в создании первых систем автоматического ввода текста. Сегодня речь пойдет про OCR Tiger и про то, как эта система работает.

    habr.com/ru/companies/smarteng

    #распознавание_текста #ocr #распознавание_образов #искусственный_интеллект #обработка_изображений