#обработка_документов — Public Fediverse posts on home.social

Habr @[email protected] · 2026-05-05 · 12:02 UTC

OCR в кармане: как HunyuanOCR на 1B параметров потеснил гигантов в задачах парсинга документов

Всем привет! Меня зовут Артем, я Data Scientist в компании Raft Digital Solutions . В этой статье расскажу про свой опыт работы с HunyuanOCR end-to-end моделью от Tencent для распознавания текста на 1B параметров. Несмотря на громкие заявления о «SOTA-результатах» и компактности, в публичных обзорах практически не описано, как эта модель ведет себя в реальных задачах: с чем приходится столкнуться при настройке окружения, почему она может уйти в бесконечное зацикливание и как заставить её эффективно парсить сложные таблицы на обычном «железе». Поделюсь результатами своих экспериментов, покажу боевые промпты и объясню, в каких сценариях этот OCR-инструмент реально помогает экономить время, а где лучше даже не пытаться его использовать.

https://habr.com/ru/companies/raft/articles/1031684/

#ocr #document #ocrтехнологии #ocr_распознавание_документов #document_parsing #распознавание_текста #обработка_документов #таблицы #сканы #imagetotext

#imagetotext #сканы #таблицы #обработка_документов #распознавание_текста #document_parsing

Habr @[email protected] · 2026-05-05 · 12:02 UTC

OCR в кармане: как HunyuanOCR на 1B параметров потеснил гигантов в задачах парсинга документов

Всем привет! Меня зовут Артем, я Data Scientist в компании Raft Digital Solutions . В этой статье расскажу про свой опыт работы с HunyuanOCR end-to-end моделью от Tencent для распознавания текста на 1B параметров. Несмотря на громкие заявления о «SOTA-результатах» и компактности, в публичных обзорах практически не описано, как эта модель ведет себя в реальных задачах: с чем приходится столкнуться при настройке окружения, почему она может уйти в бесконечное зацикливание и как заставить её эффективно парсить сложные таблицы на обычном «железе». Поделюсь результатами своих экспериментов, покажу боевые промпты и объясню, в каких сценариях этот OCR-инструмент реально помогает экономить время, а где лучше даже не пытаться его использовать.

https://habr.com/ru/companies/raft/articles/1031684/

#ocr #document #ocrтехнологии #ocr_распознавание_документов #document_parsing #распознавание_текста #обработка_документов #таблицы #сканы #imagetotext

#imagetotext #сканы #таблицы #обработка_документов #распознавание_текста #document_parsing

Habr @[email protected] · 2026-05-05 · 12:02 UTC

OCR в кармане: как HunyuanOCR на 1B параметров потеснил гигантов в задачах парсинга документов

Всем привет! Меня зовут Артем, я Data Scientist в компании Raft Digital Solutions . В этой статье расскажу про свой опыт работы с HunyuanOCR end-to-end моделью от Tencent для распознавания текста на 1B параметров. Несмотря на громкие заявления о «SOTA-результатах» и компактности, в публичных обзорах практически не описано, как эта модель ведет себя в реальных задачах: с чем приходится столкнуться при настройке окружения, почему она может уйти в бесконечное зацикливание и как заставить её эффективно парсить сложные таблицы на обычном «железе». Поделюсь результатами своих экспериментов, покажу боевые промпты и объясню, в каких сценариях этот OCR-инструмент реально помогает экономить время, а где лучше даже не пытаться его использовать.

https://habr.com/ru/companies/raft/articles/1031684/

#ocr #document #ocrтехнологии #ocr_распознавание_документов #document_parsing #распознавание_текста #обработка_документов #таблицы #сканы #imagetotext

#imagetotext #сканы #таблицы #обработка_документов #распознавание_текста #document_parsing

Habr @[email protected] · 2026-05-05 · 12:02 UTC

OCR в кармане: как HunyuanOCR на 1B параметров потеснил гигантов в задачах парсинга документов

Всем привет! Меня зовут Артем, я Data Scientist в компании Raft Digital Solutions . В этой статье расскажу про свой опыт работы с HunyuanOCR end-to-end моделью от Tencent для распознавания текста на 1B параметров. Несмотря на громкие заявления о «SOTA-результатах» и компактности, в публичных обзорах практически не описано, как эта модель ведет себя в реальных задачах: с чем приходится столкнуться при настройке окружения, почему она может уйти в бесконечное зацикливание и как заставить её эффективно парсить сложные таблицы на обычном «железе». Поделюсь результатами своих экспериментов, покажу боевые промпты и объясню, в каких сценариях этот OCR-инструмент реально помогает экономить время, а где лучше даже не пытаться его использовать.

https://habr.com/ru/companies/raft/articles/1031684/

#ocr #document #ocrтехнологии #ocr_распознавание_документов #document_parsing #распознавание_текста #обработка_документов #таблицы #сканы #imagetotext

#ocr #document #ocrтехнологии #ocr_распознавание_документов #document_parsing #распознавание_текста

Habr @[email protected] · 2026-04-04 · 14:32 UTC

Отрицание, торг, Макс и ИИ

День как день, ничего особенного. Как обычно, после работы сбежал в гараж (мастерскую), чтобы отвлечься от проблем, требований и бесконечных указаний о том, когда и чем я должен заниматься. Сбежал в свой мир моделек, станков, стружки и эпоксидной смолы — мир сотни начатых и незаконченных идей.

https://habr.com/ru/articles/1019270/

#чпу #python #max #chatgpt #gemini #claude #гараж #станки #обработка_документов #персональный_помощник

#персональный_помощник #обработка_документов #станки #гараж #claude #gemini

Habr @[email protected] · 2026-04-04 · 14:32 UTC

Отрицание, торг, Макс и ИИ

День как день, ничего особенного. Как обычно, после работы сбежал в гараж (мастерскую), чтобы отвлечься от проблем, требований и бесконечных указаний о том, когда и чем я должен заниматься. Сбежал в свой мир моделек, станков, стружки и эпоксидной смолы — мир сотни начатых и незаконченных идей.

https://habr.com/ru/articles/1019270/

#чпу #python #max #chatgpt #gemini #claude #гараж #станки #обработка_документов #персональный_помощник

#персональный_помощник #обработка_документов #станки #гараж #claude #gemini

Habr @[email protected] · 2026-04-04 · 14:32 UTC

Отрицание, торг, Макс и ИИ

День как день, ничего особенного. Как обычно, после работы сбежал в гараж (мастерскую), чтобы отвлечься от проблем, требований и бесконечных указаний о том, когда и чем я должен заниматься. Сбежал в свой мир моделек, станков, стружки и эпоксидной смолы — мир сотни начатых и незаконченных идей.

https://habr.com/ru/articles/1019270/

#чпу #python #max #chatgpt #gemini #claude #гараж #станки #обработка_документов #персональный_помощник

#персональный_помощник #обработка_документов #станки #гараж #claude #gemini

Habr @[email protected] · 2026-04-04 · 14:32 UTC

Отрицание, торг, Макс и ИИ

День как день, ничего особенного. Как обычно, после работы сбежал в гараж (мастерскую), чтобы отвлечься от проблем, требований и бесконечных указаний о том, когда и чем я должен заниматься. Сбежал в свой мир моделек, станков, стружки и эпоксидной смолы — мир сотни начатых и незаконченных идей.

https://habr.com/ru/articles/1019270/

#чпу #python #max #chatgpt #gemini #claude #гараж #станки #обработка_документов #персональный_помощник

#чпу #python #max #chatgpt #gemini #claude

Habr @[email protected] · 2026-04-02 · 19:32 UTC

Как я научил ИИ читать советские ГОСТы и сократил подготовку карт контроля с 2 часов до 5 минут

Реальный кейс: как LLM заменяет трех технологов на металлургическом заводе - и почему универсальный подход не сработал. Как я научил ИИ читать советские ГОСТы и сократил подготовку карт контроля с 2 часов до 5 минут.

https://habr.com/ru/articles/1018692/

#металлургия #искусственный_интеллект #промышленность #промышленная_автоматизация #обработка_документов #оптимизация_производства

#оптимизация_производства #обработка_документов #промышленная_автоматизация #промышленность #искусственный_интеллект #металлургия

Habr @[email protected] · 2026-04-02 · 19:32 UTC

Как я научил ИИ читать советские ГОСТы и сократил подготовку карт контроля с 2 часов до 5 минут

Реальный кейс: как LLM заменяет трех технологов на металлургическом заводе - и почему универсальный подход не сработал. Как я научил ИИ читать советские ГОСТы и сократил подготовку карт контроля с 2 часов до 5 минут.

https://habr.com/ru/articles/1018692/

#металлургия #искусственный_интеллект #промышленность #промышленная_автоматизация #обработка_документов #оптимизация_производства

#оптимизация_производства #обработка_документов #промышленная_автоматизация #промышленность #искусственный_интеллект #металлургия

Habr @[email protected] · 2026-04-02 · 19:32 UTC

Как я научил ИИ читать советские ГОСТы и сократил подготовку карт контроля с 2 часов до 5 минут

Реальный кейс: как LLM заменяет трех технологов на металлургическом заводе - и почему универсальный подход не сработал. Как я научил ИИ читать советские ГОСТы и сократил подготовку карт контроля с 2 часов до 5 минут.

https://habr.com/ru/articles/1018692/

#металлургия #искусственный_интеллект #промышленность #промышленная_автоматизация #обработка_документов #оптимизация_производства

#оптимизация_производства #обработка_документов #промышленная_автоматизация #промышленность #искусственный_интеллект #металлургия

Habr @[email protected] · 2026-04-02 · 19:32 UTC

Как я научил ИИ читать советские ГОСТы и сократил подготовку карт контроля с 2 часов до 5 минут

Реальный кейс: как LLM заменяет трех технологов на металлургическом заводе - и почему универсальный подход не сработал. Как я научил ИИ читать советские ГОСТы и сократил подготовку карт контроля с 2 часов до 5 минут.

https://habr.com/ru/articles/1018692/

#металлургия #искусственный_интеллект #промышленность #промышленная_автоматизация #обработка_документов #оптимизация_производства

Habr @[email protected] · 2026-03-10 · 12:22 UTC

От OCR до ADE: как машины научились не просто читать, а понимать документы

Ещё 10 лет назад машина видела в документе просто набор пикселей. Сегодня она понимает структуру страницы, читает таблицы, графики и рукописи — и автоматически извлекает нужные данные. Разбираем как это работает под капотом и почему это меняет целые индустрии.

https://habr.com/ru/articles/1008610/

#OCR #машинное_обучение #обработка_документов #LLM #RAG #Python #компьютерное_зрение #computer_vision #aiагенты #vectorization

#vectorization #aiагенты #computer_vision #компьютерное_зрение #python #rag

Habr @[email protected] · 2026-03-10 · 12:22 UTC

От OCR до ADE: как машины научились не просто читать, а понимать документы

Ещё 10 лет назад машина видела в документе просто набор пикселей. Сегодня она понимает структуру страницы, читает таблицы, графики и рукописи — и автоматически извлекает нужные данные. Разбираем как это работает под капотом и почему это меняет целые индустрии.

https://habr.com/ru/articles/1008610/

#OCR #машинное_обучение #обработка_документов #LLM #RAG #Python #компьютерное_зрение #computer_vision #aiагенты #vectorization

#vectorization #aiагенты #computer_vision #компьютерное_зрение #python #rag

Habr @[email protected] · 2026-03-10 · 12:22 UTC

От OCR до ADE: как машины научились не просто читать, а понимать документы

Ещё 10 лет назад машина видела в документе просто набор пикселей. Сегодня она понимает структуру страницы, читает таблицы, графики и рукописи — и автоматически извлекает нужные данные. Разбираем как это работает под капотом и почему это меняет целые индустрии.

https://habr.com/ru/articles/1008610/

#OCR #машинное_обучение #обработка_документов #LLM #RAG #Python #компьютерное_зрение #computer_vision #aiагенты #vectorization

#vectorization #aiагенты #computer_vision #компьютерное_зрение #python #rag

Habr @[email protected] · 2026-03-10 · 12:22 UTC

От OCR до ADE: как машины научились не просто читать, а понимать документы

Ещё 10 лет назад машина видела в документе просто набор пикселей. Сегодня она понимает структуру страницы, читает таблицы, графики и рукописи — и автоматически извлекает нужные данные. Разбираем как это работает под капотом и почему это меняет целые индустрии.

https://habr.com/ru/articles/1008610/

#OCR #машинное_обучение #обработка_документов #LLM #RAG #Python #компьютерное_зрение #computer_vision #aiагенты #vectorization

#ocr #машинное_обучение #обработка_документов #llm #rag #python

Habr @[email protected] · 2026-02-17 · 06:42 UTC

Нанимаем ChatGPT на работу или автоматизация бизнес-процессов

AI (LLM) сейчас на пике популярности: новые модели выходят каждый месяц. Но чаще всего их используют как инструменты, постоянно требующие времени и внимания. А что, если сделать из них «сотрудников», которые сами автономно будут выполнять часть вашей работы? В этой статье мы шаг за шагом создадим такого «сотрудника» на чистом OpenAI API и добьёмся его полной автономности. Он будет сам получать новые задачи, выполнять их и обрабатывать результаты. Мы научим его вести логи и отчеты, предупреждать о сбоях. По пути разберёмся с Batch API и Structured Outputs. А в конце поговорим про RAG, Fine-Tuning и MCP. Статья написана на основании собственного опыта реализации и внедрения LLM в бизнес процессы. Будет полезна тем, кто хочет автоматизировать часть своей рабочей или личной рутины и базово владеет Python.

https://habr.com/ru/articles/985272/

#llm #chatgpt #искуственный_интеллект #нейросети #автоматизация #бизнеспроцессы #обработка_документов #ai

#ai #обработка_документов #бизнеспроцессы #автоматизация #нейросети #искуственный_интеллект

Habr @[email protected] · 2026-02-17 · 06:42 UTC

Нанимаем ChatGPT на работу или автоматизация бизнес-процессов

AI (LLM) сейчас на пике популярности: новые модели выходят каждый месяц. Но чаще всего их используют как инструменты, постоянно требующие времени и внимания. А что, если сделать из них «сотрудников», которые сами автономно будут выполнять часть вашей работы? В этой статье мы шаг за шагом создадим такого «сотрудника» на чистом OpenAI API и добьёмся его полной автономности. Он будет сам получать новые задачи, выполнять их и обрабатывать результаты. Мы научим его вести логи и отчеты, предупреждать о сбоях. По пути разберёмся с Batch API и Structured Outputs. А в конце поговорим про RAG, Fine-Tuning и MCP. Статья написана на основании собственного опыта реализации и внедрения LLM в бизнес процессы. Будет полезна тем, кто хочет автоматизировать часть своей рабочей или личной рутины и базово владеет Python.

https://habr.com/ru/articles/985272/

#llm #chatgpt #искуственный_интеллект #нейросети #автоматизация #бизнеспроцессы #обработка_документов #ai

#ai #обработка_документов #бизнеспроцессы #автоматизация #нейросети #искуственный_интеллект

Habr @[email protected] · 2026-02-17 · 06:42 UTC

Нанимаем ChatGPT на работу или автоматизация бизнес-процессов

AI (LLM) сейчас на пике популярности: новые модели выходят каждый месяц. Но чаще всего их используют как инструменты, постоянно требующие времени и внимания. А что, если сделать из них «сотрудников», которые сами автономно будут выполнять часть вашей работы? В этой статье мы шаг за шагом создадим такого «сотрудника» на чистом OpenAI API и добьёмся его полной автономности. Он будет сам получать новые задачи, выполнять их и обрабатывать результаты. Мы научим его вести логи и отчеты, предупреждать о сбоях. По пути разберёмся с Batch API и Structured Outputs. А в конце поговорим про RAG, Fine-Tuning и MCP. Статья написана на основании собственного опыта реализации и внедрения LLM в бизнес процессы. Будет полезна тем, кто хочет автоматизировать часть своей рабочей или личной рутины и базово владеет Python.

https://habr.com/ru/articles/985272/

#llm #chatgpt #искуственный_интеллект #нейросети #автоматизация #бизнеспроцессы #обработка_документов #ai

#ai #обработка_документов #бизнеспроцессы #автоматизация #нейросети #искуственный_интеллект

Habr @[email protected] · 2026-02-17 · 06:42 UTC

Нанимаем ChatGPT на работу или автоматизация бизнес-процессов

AI (LLM) сейчас на пике популярности: новые модели выходят каждый месяц. Но чаще всего их используют как инструменты, постоянно требующие времени и внимания. А что, если сделать из них «сотрудников», которые сами автономно будут выполнять часть вашей работы? В этой статье мы шаг за шагом создадим такого «сотрудника» на чистом OpenAI API и добьёмся его полной автономности. Он будет сам получать новые задачи, выполнять их и обрабатывать результаты. Мы научим его вести логи и отчеты, предупреждать о сбоях. По пути разберёмся с Batch API и Structured Outputs. А в конце поговорим про RAG, Fine-Tuning и MCP. Статья написана на основании собственного опыта реализации и внедрения LLM в бизнес процессы. Будет полезна тем, кто хочет автоматизировать часть своей рабочей или личной рутины и базово владеет Python.

https://habr.com/ru/articles/985272/

#llm #chatgpt #искуственный_интеллект #нейросети #автоматизация #бизнеспроцессы #обработка_документов #ai

#llm #chatgpt #искуственный_интеллект #нейросети #автоматизация #бизнеспроцессы

Habr @[email protected] · 2025-12-30 · 16:32 UTC

Как заработать на LLM, перестав писать «правильные промпты»

В этой статье я бросаю вызов общепринятому представлению о больших языковых моделях как о «тупых исполнителях», которые ничего не понимают, галлюционируют, но позволяют получить результат быстрее (нередко за счет качества). Подобные мифы активно распространяются в сети, а также на курсах, на которых обучают «правильно» писать промпты. Я на Хабре уже написал несколько статей, разоблачающих отсутствие мышления у LLM, но здесь я опишу способность больших языковых моделей решать задачи , людям недоступные . Из этой статьи вы узнаете, как на самом деле надо использовать нейронки, чтобы получать максимальную пользу от них.

https://habr.com/ru/articles/982008/

#llm #промптинжиниринг #автоматизация_процессов #обработка_документов #извлечение_данных #парсинг_pdf #python #скриптинг #кейс #вайбкодинг

#вайбкодинг #кейс #скриптинг #python #парсинг_pdf #извлечение_данных

Habr @[email protected] · 2025-12-30 · 16:32 UTC

Как заработать на LLM, перестав писать «правильные промпты»

В этой статье я бросаю вызов общепринятому представлению о больших языковых моделях как о «тупых исполнителях», которые ничего не понимают, галлюционируют, но позволяют получить результат быстрее (нередко за счет качества). Подобные мифы активно распространяются в сети, а также на курсах, на которых обучают «правильно» писать промпты. Я на Хабре уже написал несколько статей, разоблачающих отсутствие мышления у LLM, но здесь я опишу способность больших языковых моделей решать задачи , людям недоступные . Из этой статьи вы узнаете, как на самом деле надо использовать нейронки, чтобы получать максимальную пользу от них.

https://habr.com/ru/articles/982008/

#llm #промптинжиниринг #автоматизация_процессов #обработка_документов #извлечение_данных #парсинг_pdf #python #скриптинг #кейс #вайбкодинг

#вайбкодинг #кейс #скриптинг #python #парсинг_pdf #извлечение_данных

Habr @[email protected] · 2025-12-30 · 16:32 UTC

Как заработать на LLM, перестав писать «правильные промпты»

В этой статье я бросаю вызов общепринятому представлению о больших языковых моделях как о «тупых исполнителях», которые ничего не понимают, галлюционируют, но позволяют получить результат быстрее (нередко за счет качества). Подобные мифы активно распространяются в сети, а также на курсах, на которых обучают «правильно» писать промпты. Я на Хабре уже написал несколько статей, разоблачающих отсутствие мышления у LLM, но здесь я опишу способность больших языковых моделей решать задачи , людям недоступные . Из этой статьи вы узнаете, как на самом деле надо использовать нейронки, чтобы получать максимальную пользу от них.

https://habr.com/ru/articles/982008/

#llm #промптинжиниринг #автоматизация_процессов #обработка_документов #извлечение_данных #парсинг_pdf #python #скриптинг #кейс #вайбкодинг

#вайбкодинг #кейс #скриптинг #python #парсинг_pdf #извлечение_данных

Habr @[email protected] · 2025-12-30 · 16:32 UTC

Как заработать на LLM, перестав писать «правильные промпты»

В этой статье я бросаю вызов общепринятому представлению о больших языковых моделях как о «тупых исполнителях», которые ничего не понимают, галлюционируют, но позволяют получить результат быстрее (нередко за счет качества). Подобные мифы активно распространяются в сети, а также на курсах, на которых обучают «правильно» писать промпты. Я на Хабре уже написал несколько статей, разоблачающих отсутствие мышления у LLM, но здесь я опишу способность больших языковых моделей решать задачи , людям недоступные . Из этой статьи вы узнаете, как на самом деле надо использовать нейронки, чтобы получать максимальную пользу от них.

https://habr.com/ru/articles/982008/

#llm #промптинжиниринг #автоматизация_процессов #обработка_документов #извлечение_данных #парсинг_pdf #python #скриптинг #кейс #вайбкодинг

#llm #промптинжиниринг #автоматизация_процессов #обработка_документов #извлечение_данных #парсинг_pdf

Habr @[email protected] · 2025-11-13 · 09:32 UTC

LLM vs. почерк: практическое сравнение GPT-5, Gemini и Claude в задачах OCR

Распознавание рукописного текста — задача, которая остаётся болезненной даже в 2025 году. Именно это не позволяет оцифровать многие архивы и документы, а также является камнем преткновения в разной бизнес деятельности. Производители заявляют, что модели вроде GPT-5, Gemini 2.5 Pro и Claude Sonnet 4.5 способны не просто распознать почерк, но и догадаться, что автор имел в виду: исправить пунктуацию, восстановить сокращения, даже понять, что стоит за пометками на полях. Звучит красиво. Но работает ли это на реальных документах? Чтобы ответить, мы провели исследование и сравнили , как три топ-LLM обрабатывают рукописные и смешанные документы — с точки зрения точности, структурной консистентности и понимания контекста.

https://habr.com/ru/articles/966002/

#llmмодели #chatgpt5 #claude_sonnet #gemini_pro #языковые_модели #обработка_документов #почерк #почерк_врачей #gpt5 #обработка_изображений

#обработка_изображений #gpt5 #почерк_врачей #почерк #обработка_документов #языковые_модели

Habr @[email protected] · 2025-11-13 · 09:32 UTC

LLM vs. почерк: практическое сравнение GPT-5, Gemini и Claude в задачах OCR

Распознавание рукописного текста — задача, которая остаётся болезненной даже в 2025 году. Именно это не позволяет оцифровать многие архивы и документы, а также является камнем преткновения в разной бизнес деятельности. Производители заявляют, что модели вроде GPT-5, Gemini 2.5 Pro и Claude Sonnet 4.5 способны не просто распознать почерк, но и догадаться, что автор имел в виду: исправить пунктуацию, восстановить сокращения, даже понять, что стоит за пометками на полях. Звучит красиво. Но работает ли это на реальных документах? Чтобы ответить, мы провели исследование и сравнили , как три топ-LLM обрабатывают рукописные и смешанные документы — с точки зрения точности, структурной консистентности и понимания контекста.

https://habr.com/ru/articles/966002/

#llmмодели #chatgpt5 #claude_sonnet #gemini_pro #языковые_модели #обработка_документов #почерк #почерк_врачей #gpt5 #обработка_изображений

#обработка_изображений #gpt5 #почерк_врачей #почерк #обработка_документов #языковые_модели

Habr @[email protected] · 2025-11-13 · 09:32 UTC

LLM vs. почерк: практическое сравнение GPT-5, Gemini и Claude в задачах OCR

Распознавание рукописного текста — задача, которая остаётся болезненной даже в 2025 году. Именно это не позволяет оцифровать многие архивы и документы, а также является камнем преткновения в разной бизнес деятельности. Производители заявляют, что модели вроде GPT-5, Gemini 2.5 Pro и Claude Sonnet 4.5 способны не просто распознать почерк, но и догадаться, что автор имел в виду: исправить пунктуацию, восстановить сокращения, даже понять, что стоит за пометками на полях. Звучит красиво. Но работает ли это на реальных документах? Чтобы ответить, мы провели исследование и сравнили , как три топ-LLM обрабатывают рукописные и смешанные документы — с точки зрения точности, структурной консистентности и понимания контекста.

https://habr.com/ru/articles/966002/

#llmмодели #chatgpt5 #claude_sonnet #gemini_pro #языковые_модели #обработка_документов #почерк #почерк_врачей #gpt5 #обработка_изображений

#обработка_изображений #gpt5 #почерк_врачей #почерк #обработка_документов #языковые_модели

Habr @[email protected] · 2025-11-13 · 09:32 UTC

LLM vs. почерк: практическое сравнение GPT-5, Gemini и Claude в задачах OCR

Распознавание рукописного текста — задача, которая остаётся болезненной даже в 2025 году. Именно это не позволяет оцифровать многие архивы и документы, а также является камнем преткновения в разной бизнес деятельности. Производители заявляют, что модели вроде GPT-5, Gemini 2.5 Pro и Claude Sonnet 4.5 способны не просто распознать почерк, но и догадаться, что автор имел в виду: исправить пунктуацию, восстановить сокращения, даже понять, что стоит за пометками на полях. Звучит красиво. Но работает ли это на реальных документах? Чтобы ответить, мы провели исследование и сравнили , как три топ-LLM обрабатывают рукописные и смешанные документы — с точки зрения точности, структурной консистентности и понимания контекста.

https://habr.com/ru/articles/966002/

#llmмодели #chatgpt5 #claude_sonnet #gemini_pro #языковые_модели #обработка_документов #почерк #почерк_врачей #gpt5 #обработка_изображений

#llmмодели #chatgpt5 #claude_sonnet #gemini_pro #языковые_модели #обработка_документов

Habr @[email protected] · 2025-10-23 · 12:32 UTC