home.social

#обработка_документов — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #обработка_документов, aggregated by home.social.

  1. OCR в кармане: как HunyuanOCR на 1B параметров потеснил гигантов в задачах парсинга документов

    Всем привет! Меня зовут Артем, я Data Scientist в компании Raft Digital Solutions . В этой статье расскажу про свой опыт работы с HunyuanOCR end-to-end моделью от Tencent для распознавания текста на 1B параметров. Несмотря на громкие заявления о «SOTA-результатах» и компактности, в публичных обзорах практически не описано, как эта модель ведет себя в реальных задачах: с чем приходится столкнуться при настройке окружения, почему она может уйти в бесконечное зацикливание и как заставить её эффективно парсить сложные таблицы на обычном «железе». Поделюсь результатами своих экспериментов, покажу боевые промпты и объясню, в каких сценариях этот OCR-инструмент реально помогает экономить время, а где лучше даже не пытаться его использовать.

    habr.com/ru/companies/raft/art

    #ocr #document #ocrтехнологии #ocr_распознавание_документов #document_parsing #распознавание_текста #обработка_документов #таблицы #сканы #imagetotext

  2. OCR в кармане: как HunyuanOCR на 1B параметров потеснил гигантов в задачах парсинга документов

    Всем привет! Меня зовут Артем, я Data Scientist в компании Raft Digital Solutions . В этой статье расскажу про свой опыт работы с HunyuanOCR end-to-end моделью от Tencent для распознавания текста на 1B параметров. Несмотря на громкие заявления о «SOTA-результатах» и компактности, в публичных обзорах практически не описано, как эта модель ведет себя в реальных задачах: с чем приходится столкнуться при настройке окружения, почему она может уйти в бесконечное зацикливание и как заставить её эффективно парсить сложные таблицы на обычном «железе». Поделюсь результатами своих экспериментов, покажу боевые промпты и объясню, в каких сценариях этот OCR-инструмент реально помогает экономить время, а где лучше даже не пытаться его использовать.

    habr.com/ru/companies/raft/art

    #ocr #document #ocrтехнологии #ocr_распознавание_документов #document_parsing #распознавание_текста #обработка_документов #таблицы #сканы #imagetotext

  3. OCR в кармане: как HunyuanOCR на 1B параметров потеснил гигантов в задачах парсинга документов

    Всем привет! Меня зовут Артем, я Data Scientist в компании Raft Digital Solutions . В этой статье расскажу про свой опыт работы с HunyuanOCR end-to-end моделью от Tencent для распознавания текста на 1B параметров. Несмотря на громкие заявления о «SOTA-результатах» и компактности, в публичных обзорах практически не описано, как эта модель ведет себя в реальных задачах: с чем приходится столкнуться при настройке окружения, почему она может уйти в бесконечное зацикливание и как заставить её эффективно парсить сложные таблицы на обычном «железе». Поделюсь результатами своих экспериментов, покажу боевые промпты и объясню, в каких сценариях этот OCR-инструмент реально помогает экономить время, а где лучше даже не пытаться его использовать.

    habr.com/ru/companies/raft/art

    #ocr #document #ocrтехнологии #ocr_распознавание_документов #document_parsing #распознавание_текста #обработка_документов #таблицы #сканы #imagetotext

  4. OCR в кармане: как HunyuanOCR на 1B параметров потеснил гигантов в задачах парсинга документов

    Всем привет! Меня зовут Артем, я Data Scientist в компании Raft Digital Solutions . В этой статье расскажу про свой опыт работы с HunyuanOCR end-to-end моделью от Tencent для распознавания текста на 1B параметров. Несмотря на громкие заявления о «SOTA-результатах» и компактности, в публичных обзорах практически не описано, как эта модель ведет себя в реальных задачах: с чем приходится столкнуться при настройке окружения, почему она может уйти в бесконечное зацикливание и как заставить её эффективно парсить сложные таблицы на обычном «железе». Поделюсь результатами своих экспериментов, покажу боевые промпты и объясню, в каких сценариях этот OCR-инструмент реально помогает экономить время, а где лучше даже не пытаться его использовать.

    habr.com/ru/companies/raft/art

    #ocr #document #ocrтехнологии #ocr_распознавание_документов #document_parsing #распознавание_текста #обработка_документов #таблицы #сканы #imagetotext

  5. Отрицание, торг, Макс и ИИ

    День как день, ничего особенного. Как обычно, после работы сбежал в гараж (мастерскую), чтобы отвлечься от проблем, требований и бесконечных указаний о том, когда и чем я должен заниматься. Сбежал в свой мир моделек, станков, стружки и эпоксидной смолы — мир сотни начатых и незаконченных идей.

    habr.com/ru/articles/1019270/

    #чпу #python #max #chatgpt #gemini #claude #гараж #станки #обработка_документов #персональный_помощник

  6. Отрицание, торг, Макс и ИИ

    День как день, ничего особенного. Как обычно, после работы сбежал в гараж (мастерскую), чтобы отвлечься от проблем, требований и бесконечных указаний о том, когда и чем я должен заниматься. Сбежал в свой мир моделек, станков, стружки и эпоксидной смолы — мир сотни начатых и незаконченных идей.

    habr.com/ru/articles/1019270/

    #чпу #python #max #chatgpt #gemini #claude #гараж #станки #обработка_документов #персональный_помощник

  7. Отрицание, торг, Макс и ИИ

    День как день, ничего особенного. Как обычно, после работы сбежал в гараж (мастерскую), чтобы отвлечься от проблем, требований и бесконечных указаний о том, когда и чем я должен заниматься. Сбежал в свой мир моделек, станков, стружки и эпоксидной смолы — мир сотни начатых и незаконченных идей.

    habr.com/ru/articles/1019270/

    #чпу #python #max #chatgpt #gemini #claude #гараж #станки #обработка_документов #персональный_помощник

  8. Отрицание, торг, Макс и ИИ

    День как день, ничего особенного. Как обычно, после работы сбежал в гараж (мастерскую), чтобы отвлечься от проблем, требований и бесконечных указаний о том, когда и чем я должен заниматься. Сбежал в свой мир моделек, станков, стружки и эпоксидной смолы — мир сотни начатых и незаконченных идей.

    habr.com/ru/articles/1019270/

    #чпу #python #max #chatgpt #gemini #claude #гараж #станки #обработка_документов #персональный_помощник

  9. Как я научил ИИ читать советские ГОСТы и сократил подготовку карт контроля с 2 часов до 5 минут

    Реальный кейс: как LLM заменяет трех технологов на металлургическом заводе - и почему универсальный подход не сработал. Как я научил ИИ читать советские ГОСТы и сократил подготовку карт контроля с 2 часов до 5 минут.

    habr.com/ru/articles/1018692/

    #металлургия #искусственный_интеллект #промышленность #промышленная_автоматизация #обработка_документов #оптимизация_производства

  10. Как я научил ИИ читать советские ГОСТы и сократил подготовку карт контроля с 2 часов до 5 минут

    Реальный кейс: как LLM заменяет трех технологов на металлургическом заводе - и почему универсальный подход не сработал. Как я научил ИИ читать советские ГОСТы и сократил подготовку карт контроля с 2 часов до 5 минут.

    habr.com/ru/articles/1018692/

    #металлургия #искусственный_интеллект #промышленность #промышленная_автоматизация #обработка_документов #оптимизация_производства

  11. Как я научил ИИ читать советские ГОСТы и сократил подготовку карт контроля с 2 часов до 5 минут

    Реальный кейс: как LLM заменяет трех технологов на металлургическом заводе - и почему универсальный подход не сработал. Как я научил ИИ читать советские ГОСТы и сократил подготовку карт контроля с 2 часов до 5 минут.

    habr.com/ru/articles/1018692/

    #металлургия #искусственный_интеллект #промышленность #промышленная_автоматизация #обработка_документов #оптимизация_производства

  12. Как я научил ИИ читать советские ГОСТы и сократил подготовку карт контроля с 2 часов до 5 минут

    Реальный кейс: как LLM заменяет трех технологов на металлургическом заводе - и почему универсальный подход не сработал. Как я научил ИИ читать советские ГОСТы и сократил подготовку карт контроля с 2 часов до 5 минут.

    habr.com/ru/articles/1018692/

    #металлургия #искусственный_интеллект #промышленность #промышленная_автоматизация #обработка_документов #оптимизация_производства

  13. От OCR до ADE: как машины научились не просто читать, а понимать документы

    Ещё 10 лет назад машина видела в документе просто набор пикселей. Сегодня она понимает структуру страницы, читает таблицы, графики и рукописи — и автоматически извлекает нужные данные. Разбираем как это работает под капотом и почему это меняет целые индустрии.

    habr.com/ru/articles/1008610/

    #OCR #машинное_обучение #обработка_документов #LLM #RAG #Python #компьютерное_зрение #computer_vision #aiагенты #vectorization

  14. От OCR до ADE: как машины научились не просто читать, а понимать документы

    Ещё 10 лет назад машина видела в документе просто набор пикселей. Сегодня она понимает структуру страницы, читает таблицы, графики и рукописи — и автоматически извлекает нужные данные. Разбираем как это работает под капотом и почему это меняет целые индустрии.

    habr.com/ru/articles/1008610/

    #OCR #машинное_обучение #обработка_документов #LLM #RAG #Python #компьютерное_зрение #computer_vision #aiагенты #vectorization

  15. От OCR до ADE: как машины научились не просто читать, а понимать документы

    Ещё 10 лет назад машина видела в документе просто набор пикселей. Сегодня она понимает структуру страницы, читает таблицы, графики и рукописи — и автоматически извлекает нужные данные. Разбираем как это работает под капотом и почему это меняет целые индустрии.

    habr.com/ru/articles/1008610/

    #OCR #машинное_обучение #обработка_документов #LLM #RAG #Python #компьютерное_зрение #computer_vision #aiагенты #vectorization

  16. От OCR до ADE: как машины научились не просто читать, а понимать документы

    Ещё 10 лет назад машина видела в документе просто набор пикселей. Сегодня она понимает структуру страницы, читает таблицы, графики и рукописи — и автоматически извлекает нужные данные. Разбираем как это работает под капотом и почему это меняет целые индустрии.

    habr.com/ru/articles/1008610/

    #OCR #машинное_обучение #обработка_документов #LLM #RAG #Python #компьютерное_зрение #computer_vision #aiагенты #vectorization

  17. Нанимаем ChatGPT на работу или автоматизация бизнес-процессов

    AI (LLM) сейчас на пике популярности: новые модели выходят каждый месяц. Но чаще всего их используют как инструменты, постоянно требующие времени и внимания. А что, если сделать из них «сотрудников», которые сами автономно будут выполнять часть вашей работы? В этой статье мы шаг за шагом создадим такого «сотрудника» на чистом OpenAI API и добьёмся его полной автономности. Он будет сам получать новые задачи, выполнять их и обрабатывать результаты. Мы научим его вести логи и отчеты, предупреждать о сбоях. По пути разберёмся с Batch API и Structured Outputs. А в конце поговорим про RAG, Fine-Tuning и MCP. Статья написана на основании собственного опыта реализации и внедрения LLM в бизнес процессы. Будет полезна тем, кто хочет автоматизировать часть своей рабочей или личной рутины и базово владеет Python.

    habr.com/ru/articles/985272/

    #llm #chatgpt #искуственный_интеллект #нейросети #автоматизация #бизнеспроцессы #обработка_документов #ai

  18. Нанимаем ChatGPT на работу или автоматизация бизнес-процессов

    AI (LLM) сейчас на пике популярности: новые модели выходят каждый месяц. Но чаще всего их используют как инструменты, постоянно требующие времени и внимания. А что, если сделать из них «сотрудников», которые сами автономно будут выполнять часть вашей работы? В этой статье мы шаг за шагом создадим такого «сотрудника» на чистом OpenAI API и добьёмся его полной автономности. Он будет сам получать новые задачи, выполнять их и обрабатывать результаты. Мы научим его вести логи и отчеты, предупреждать о сбоях. По пути разберёмся с Batch API и Structured Outputs. А в конце поговорим про RAG, Fine-Tuning и MCP. Статья написана на основании собственного опыта реализации и внедрения LLM в бизнес процессы. Будет полезна тем, кто хочет автоматизировать часть своей рабочей или личной рутины и базово владеет Python.

    habr.com/ru/articles/985272/

    #llm #chatgpt #искуственный_интеллект #нейросети #автоматизация #бизнеспроцессы #обработка_документов #ai

  19. Нанимаем ChatGPT на работу или автоматизация бизнес-процессов

    AI (LLM) сейчас на пике популярности: новые модели выходят каждый месяц. Но чаще всего их используют как инструменты, постоянно требующие времени и внимания. А что, если сделать из них «сотрудников», которые сами автономно будут выполнять часть вашей работы? В этой статье мы шаг за шагом создадим такого «сотрудника» на чистом OpenAI API и добьёмся его полной автономности. Он будет сам получать новые задачи, выполнять их и обрабатывать результаты. Мы научим его вести логи и отчеты, предупреждать о сбоях. По пути разберёмся с Batch API и Structured Outputs. А в конце поговорим про RAG, Fine-Tuning и MCP. Статья написана на основании собственного опыта реализации и внедрения LLM в бизнес процессы. Будет полезна тем, кто хочет автоматизировать часть своей рабочей или личной рутины и базово владеет Python.

    habr.com/ru/articles/985272/

    #llm #chatgpt #искуственный_интеллект #нейросети #автоматизация #бизнеспроцессы #обработка_документов #ai

  20. Нанимаем ChatGPT на работу или автоматизация бизнес-процессов

    AI (LLM) сейчас на пике популярности: новые модели выходят каждый месяц. Но чаще всего их используют как инструменты, постоянно требующие времени и внимания. А что, если сделать из них «сотрудников», которые сами автономно будут выполнять часть вашей работы? В этой статье мы шаг за шагом создадим такого «сотрудника» на чистом OpenAI API и добьёмся его полной автономности. Он будет сам получать новые задачи, выполнять их и обрабатывать результаты. Мы научим его вести логи и отчеты, предупреждать о сбоях. По пути разберёмся с Batch API и Structured Outputs. А в конце поговорим про RAG, Fine-Tuning и MCP. Статья написана на основании собственного опыта реализации и внедрения LLM в бизнес процессы. Будет полезна тем, кто хочет автоматизировать часть своей рабочей или личной рутины и базово владеет Python.

    habr.com/ru/articles/985272/

    #llm #chatgpt #искуственный_интеллект #нейросети #автоматизация #бизнеспроцессы #обработка_документов #ai

  21. Как заработать на LLM, перестав писать «правильные промпты»

    В этой статье я бросаю вызов общепринятому представлению о больших языковых моделях как о «тупых исполнителях», которые ничего не понимают, галлюционируют, но позволяют получить результат быстрее (нередко за счет качества). Подобные мифы активно распространяются в сети, а также на курсах, на которых обучают «правильно» писать промпты. Я на Хабре уже написал несколько статей, разоблачающих отсутствие мышления у LLM, но здесь я опишу способность больших языковых моделей решать задачи , людям недоступные . Из этой статьи вы узнаете, как на самом деле надо использовать нейронки, чтобы получать максимальную пользу от них.

    habr.com/ru/articles/982008/

    #llm #промптинжиниринг #автоматизация_процессов #обработка_документов #извлечение_данных #парсинг_pdf #python #скриптинг #кейс #вайбкодинг

  22. Как заработать на LLM, перестав писать «правильные промпты»

    В этой статье я бросаю вызов общепринятому представлению о больших языковых моделях как о «тупых исполнителях», которые ничего не понимают, галлюционируют, но позволяют получить результат быстрее (нередко за счет качества). Подобные мифы активно распространяются в сети, а также на курсах, на которых обучают «правильно» писать промпты. Я на Хабре уже написал несколько статей, разоблачающих отсутствие мышления у LLM, но здесь я опишу способность больших языковых моделей решать задачи , людям недоступные . Из этой статьи вы узнаете, как на самом деле надо использовать нейронки, чтобы получать максимальную пользу от них.

    habr.com/ru/articles/982008/

    #llm #промптинжиниринг #автоматизация_процессов #обработка_документов #извлечение_данных #парсинг_pdf #python #скриптинг #кейс #вайбкодинг

  23. Как заработать на LLM, перестав писать «правильные промпты»

    В этой статье я бросаю вызов общепринятому представлению о больших языковых моделях как о «тупых исполнителях», которые ничего не понимают, галлюционируют, но позволяют получить результат быстрее (нередко за счет качества). Подобные мифы активно распространяются в сети, а также на курсах, на которых обучают «правильно» писать промпты. Я на Хабре уже написал несколько статей, разоблачающих отсутствие мышления у LLM, но здесь я опишу способность больших языковых моделей решать задачи , людям недоступные . Из этой статьи вы узнаете, как на самом деле надо использовать нейронки, чтобы получать максимальную пользу от них.

    habr.com/ru/articles/982008/

    #llm #промптинжиниринг #автоматизация_процессов #обработка_документов #извлечение_данных #парсинг_pdf #python #скриптинг #кейс #вайбкодинг

  24. Как заработать на LLM, перестав писать «правильные промпты»

    В этой статье я бросаю вызов общепринятому представлению о больших языковых моделях как о «тупых исполнителях», которые ничего не понимают, галлюционируют, но позволяют получить результат быстрее (нередко за счет качества). Подобные мифы активно распространяются в сети, а также на курсах, на которых обучают «правильно» писать промпты. Я на Хабре уже написал несколько статей, разоблачающих отсутствие мышления у LLM, но здесь я опишу способность больших языковых моделей решать задачи , людям недоступные . Из этой статьи вы узнаете, как на самом деле надо использовать нейронки, чтобы получать максимальную пользу от них.

    habr.com/ru/articles/982008/

    #llm #промптинжиниринг #автоматизация_процессов #обработка_документов #извлечение_данных #парсинг_pdf #python #скриптинг #кейс #вайбкодинг

  25. LLM vs. почерк: практическое сравнение GPT-5, Gemini и Claude в задачах OCR

    Распознавание рукописного текста — задача, которая остаётся болезненной даже в 2025 году. Именно это не позволяет оцифровать многие архивы и документы, а также является камнем преткновения в разной бизнес деятельности. Производители заявляют, что модели вроде GPT-5, Gemini 2.5 Pro и Claude Sonnet 4.5 способны не просто распознать почерк, но и догадаться, что автор имел в виду: исправить пунктуацию, восстановить сокращения, даже понять, что стоит за пометками на полях. Звучит красиво. Но работает ли это на реальных документах? Чтобы ответить, мы провели исследование и сравнили , как три топ-LLM обрабатывают рукописные и смешанные документы — с точки зрения точности, структурной консистентности и понимания контекста.

    habr.com/ru/articles/966002/

    #llmмодели #chatgpt5 #claude_sonnet #gemini_pro #языковые_модели #обработка_документов #почерк #почерк_врачей #gpt5 #обработка_изображений

  26. LLM vs. почерк: практическое сравнение GPT-5, Gemini и Claude в задачах OCR

    Распознавание рукописного текста — задача, которая остаётся болезненной даже в 2025 году. Именно это не позволяет оцифровать многие архивы и документы, а также является камнем преткновения в разной бизнес деятельности. Производители заявляют, что модели вроде GPT-5, Gemini 2.5 Pro и Claude Sonnet 4.5 способны не просто распознать почерк, но и догадаться, что автор имел в виду: исправить пунктуацию, восстановить сокращения, даже понять, что стоит за пометками на полях. Звучит красиво. Но работает ли это на реальных документах? Чтобы ответить, мы провели исследование и сравнили , как три топ-LLM обрабатывают рукописные и смешанные документы — с точки зрения точности, структурной консистентности и понимания контекста.

    habr.com/ru/articles/966002/

    #llmмодели #chatgpt5 #claude_sonnet #gemini_pro #языковые_модели #обработка_документов #почерк #почерк_врачей #gpt5 #обработка_изображений

  27. LLM vs. почерк: практическое сравнение GPT-5, Gemini и Claude в задачах OCR

    Распознавание рукописного текста — задача, которая остаётся болезненной даже в 2025 году. Именно это не позволяет оцифровать многие архивы и документы, а также является камнем преткновения в разной бизнес деятельности. Производители заявляют, что модели вроде GPT-5, Gemini 2.5 Pro и Claude Sonnet 4.5 способны не просто распознать почерк, но и догадаться, что автор имел в виду: исправить пунктуацию, восстановить сокращения, даже понять, что стоит за пометками на полях. Звучит красиво. Но работает ли это на реальных документах? Чтобы ответить, мы провели исследование и сравнили , как три топ-LLM обрабатывают рукописные и смешанные документы — с точки зрения точности, структурной консистентности и понимания контекста.

    habr.com/ru/articles/966002/

    #llmмодели #chatgpt5 #claude_sonnet #gemini_pro #языковые_модели #обработка_документов #почерк #почерк_врачей #gpt5 #обработка_изображений

  28. LLM vs. почерк: практическое сравнение GPT-5, Gemini и Claude в задачах OCR

    Распознавание рукописного текста — задача, которая остаётся болезненной даже в 2025 году. Именно это не позволяет оцифровать многие архивы и документы, а также является камнем преткновения в разной бизнес деятельности. Производители заявляют, что модели вроде GPT-5, Gemini 2.5 Pro и Claude Sonnet 4.5 способны не просто распознать почерк, но и догадаться, что автор имел в виду: исправить пунктуацию, восстановить сокращения, даже понять, что стоит за пометками на полях. Звучит красиво. Но работает ли это на реальных документах? Чтобы ответить, мы провели исследование и сравнили , как три топ-LLM обрабатывают рукописные и смешанные документы — с точки зрения точности, структурной консистентности и понимания контекста.

    habr.com/ru/articles/966002/

    #llmмодели #chatgpt5 #claude_sonnet #gemini_pro #языковые_модели #обработка_документов #почерк #почерк_врачей #gpt5 #обработка_изображений

  29. Как мы создали решение для автоматизации обработки документов с помощью искусственного интеллекта

    В современном бизнесе обработка больших объемов текстовой информации остается серьезным вызовом. В практике искусственного интеллекта и анализа данных компании «Технологии Доверия» мы регулярно сталкиваемся с запросами клиентов на оптимизацию процессов работы с документами. Сегодня мы хотим поделиться историей создания инновационного решения, которое помогло нашему бизнесу и бизнесу наших клиентов справиться с этой задачей.

    habr.com/ru/companies/tedotech

    #автоматизация #обработка_документов #технологии #искуственный_интеллект

  30. Как мы создали решение для автоматизации обработки документов с помощью искусственного интеллекта

    В современном бизнесе обработка больших объемов текстовой информации остается серьезным вызовом. В практике искусственного интеллекта и анализа данных компании «Технологии Доверия» мы регулярно сталкиваемся с запросами клиентов на оптимизацию процессов работы с документами. Сегодня мы хотим поделиться историей создания инновационного решения, которое помогло нашему бизнесу и бизнесу наших клиентов справиться с этой задачей.

    habr.com/ru/companies/tedotech

    #автоматизация #обработка_документов #технологии #искуственный_интеллект

  31. Как мы создали решение для автоматизации обработки документов с помощью искусственного интеллекта

    В современном бизнесе обработка больших объемов текстовой информации остается серьезным вызовом. В практике искусственного интеллекта и анализа данных компании «Технологии Доверия» мы регулярно сталкиваемся с запросами клиентов на оптимизацию процессов работы с документами. Сегодня мы хотим поделиться историей создания инновационного решения, которое помогло нашему бизнесу и бизнесу наших клиентов справиться с этой задачей.

    habr.com/ru/companies/tedotech

    #автоматизация #обработка_документов #технологии #искуственный_интеллект

  32. Как мы создали решение для автоматизации обработки документов с помощью искусственного интеллекта

    В современном бизнесе обработка больших объемов текстовой информации остается серьезным вызовом. В практике искусственного интеллекта и анализа данных компании «Технологии Доверия» мы регулярно сталкиваемся с запросами клиентов на оптимизацию процессов работы с документами. Сегодня мы хотим поделиться историей создания инновационного решения, которое помогло нашему бизнесу и бизнесу наших клиентов справиться с этой задачей.

    habr.com/ru/companies/tedotech

    #автоматизация #обработка_документов #технологии #искуственный_интеллект

  33. Как мы создали решение для автоматизации обработки документов с помощью искусственного интеллекта

    В современном бизнесе обработка больших объемов текстовой информации остается серьезным вызовом.В практике искусственного интеллекта и анализа данных компании «Технологии Доверия» мы регулярно сталкиваемся с запросами клиентов на оптимизацию процессов работы с документами.Сегодня мы хотим поделиться историей создания инновационного решения, которое помогло нашему бизнесу и бизнесу наших клиентов справиться с этой задачей.

    habr.com/ru/articles/959168/

    #автоматизация #обработка_документов #искусственный_интеллект #технологии

  34. Как мы создали решение для автоматизации обработки документов с помощью искусственного интеллекта

    В современном бизнесе обработка больших объемов текстовой информации остается серьезным вызовом.В практике искусственного интеллекта и анализа данных компании «Технологии Доверия» мы регулярно сталкиваемся с запросами клиентов на оптимизацию процессов работы с документами.Сегодня мы хотим поделиться историей создания инновационного решения, которое помогло нашему бизнесу и бизнесу наших клиентов справиться с этой задачей.

    habr.com/ru/articles/959168/

    #автоматизация #обработка_документов #искусственный_интеллект #технологии

  35. Как мы создали решение для автоматизации обработки документов с помощью искусственного интеллекта

    В современном бизнесе обработка больших объемов текстовой информации остается серьезным вызовом.В практике искусственного интеллекта и анализа данных компании «Технологии Доверия» мы регулярно сталкиваемся с запросами клиентов на оптимизацию процессов работы с документами.Сегодня мы хотим поделиться историей создания инновационного решения, которое помогло нашему бизнесу и бизнесу наших клиентов справиться с этой задачей.

    habr.com/ru/articles/959168/

    #автоматизация #обработка_документов #искусственный_интеллект #технологии

  36. Как мы создали решение для автоматизации обработки документов с помощью искусственного интеллекта

    В современном бизнесе обработка больших объемов текстовой информации остается серьезным вызовом.В практике искусственного интеллекта и анализа данных компании «Технологии Доверия» мы регулярно сталкиваемся с запросами клиентов на оптимизацию процессов работы с документами.Сегодня мы хотим поделиться историей создания инновационного решения, которое помогло нашему бизнесу и бизнесу наших клиентов справиться с этой задачей.

    habr.com/ru/articles/959168/

    #автоматизация #обработка_документов #искусственный_интеллект #технологии

  37. Как ContentCapture и LLM автоматизируют обработку судебных приказов, определений и постановлений ФССП

    Ранее мы уже делились опытом использования LLM для обработки юридических документов и доверенностей. Сегодня расскажем о другом подходе, который применил наш технологический партнер ООО «ЕСМ-Консалтинг» . При реализации нескольких показательных кейсов для крупных российских энергосбытовых компаний, автоматизировав в них обработку судебных документов с помощью платформы ContentCapture и больших языковых моделей (LLM). Изначально мы рассматривали два подхода к реализации подобных проектов. Первый – предполагал классическую работу с гибкими описаниями документов, когда правила извлечения информации задаются человеком. Второй вариант – комбинированный, с использованием больших языковых моделей (LLM). Наш опыт показал, что последний подход как минимум в три раза экономичнее, при работе с неструктурированными документами. Он обеспечивает хорошую скорость и высокое качество извлечения данных (более 95% правильно извлеченных данных), что позволяет нашим заказчикам масштабировать обработку документов без роста операционных расходов. Узнать подробности

    habr.com/ru/companies/contenta

    #llm #llmмодели #обработка_документов #юридические_документы #yandexgpt #llama #nlp

  38. Как ContentCapture и LLM автоматизируют обработку судебных приказов, определений и постановлений ФССП

    Ранее мы уже делились опытом использования LLM для обработки юридических документов и доверенностей. Сегодня расскажем о другом подходе, который применил наш технологический партнер ООО «ЕСМ-Консалтинг» . При реализации нескольких показательных кейсов для крупных российских энергосбытовых компаний, автоматизировав в них обработку судебных документов с помощью платформы ContentCapture и больших языковых моделей (LLM). Изначально мы рассматривали два подхода к реализации подобных проектов. Первый – предполагал классическую работу с гибкими описаниями документов, когда правила извлечения информации задаются человеком. Второй вариант – комбинированный, с использованием больших языковых моделей (LLM). Наш опыт показал, что последний подход как минимум в три раза экономичнее, при работе с неструктурированными документами. Он обеспечивает хорошую скорость и высокое качество извлечения данных (более 95% правильно извлеченных данных), что позволяет нашим заказчикам масштабировать обработку документов без роста операционных расходов. Узнать подробности

    habr.com/ru/companies/contenta

    #llm #llmмодели #обработка_документов #юридические_документы #yandexgpt #llama #nlp

  39. Как ContentCapture и LLM автоматизируют обработку судебных приказов, определений и постановлений ФССП

    Ранее мы уже делились опытом использования LLM для обработки юридических документов и доверенностей. Сегодня расскажем о другом подходе, который применил наш технологический партнер ООО «ЕСМ-Консалтинг» . При реализации нескольких показательных кейсов для крупных российских энергосбытовых компаний, автоматизировав в них обработку судебных документов с помощью платформы ContentCapture и больших языковых моделей (LLM). Изначально мы рассматривали два подхода к реализации подобных проектов. Первый – предполагал классическую работу с гибкими описаниями документов, когда правила извлечения информации задаются человеком. Второй вариант – комбинированный, с использованием больших языковых моделей (LLM). Наш опыт показал, что последний подход как минимум в три раза экономичнее, при работе с неструктурированными документами. Он обеспечивает хорошую скорость и высокое качество извлечения данных (более 95% правильно извлеченных данных), что позволяет нашим заказчикам масштабировать обработку документов без роста операционных расходов. Узнать подробности

    habr.com/ru/companies/contenta

    #llm #llmмодели #обработка_документов #юридические_документы #yandexgpt #llama #nlp

  40. Как ContentCapture и LLM автоматизируют обработку судебных приказов, определений и постановлений ФССП

    Ранее мы уже делились опытом использования LLM для обработки юридических документов и доверенностей. Сегодня расскажем о другом подходе, который применил наш технологический партнер ООО «ЕСМ-Консалтинг» . При реализации нескольких показательных кейсов для крупных российских энергосбытовых компаний, автоматизировав в них обработку судебных документов с помощью платформы ContentCapture и больших языковых моделей (LLM). Изначально мы рассматривали два подхода к реализации подобных проектов. Первый – предполагал классическую работу с гибкими описаниями документов, когда правила извлечения информации задаются человеком. Второй вариант – комбинированный, с использованием больших языковых моделей (LLM). Наш опыт показал, что последний подход как минимум в три раза экономичнее, при работе с неструктурированными документами. Он обеспечивает хорошую скорость и высокое качество извлечения данных (более 95% правильно извлеченных данных), что позволяет нашим заказчикам масштабировать обработку документов без роста операционных расходов. Узнать подробности

    habr.com/ru/companies/contenta

    #llm #llmмодели #обработка_документов #юридические_документы #yandexgpt #llama #nlp

  41. Эффективное использование LLM в командной строке

    ИИ уже стал привычным инструментом в ИТ. Мы используем LLM‑модели через веб-интерфейсы, API в коде, плагины и отдельные приложения. Но существует ещё один удобный способ взаимодействия с ними — командная строка.

    habr.com/ru/articles/938418/

    #llm #unix #bash #commandline #cli #искусственный_интеллект #обработка_документов

  42. Эффективное использование LLM в командной строке

    ИИ уже стал привычным инструментом в ИТ. Мы используем LLM‑модели через веб-интерфейсы, API в коде, плагины и отдельные приложения. Но существует ещё один удобный способ взаимодействия с ними — командная строка.

    habr.com/ru/articles/938418/

    #llm #unix #bash #commandline #cli #искусственный_интеллект #обработка_документов

  43. Эффективное использование LLM в командной строке

    ИИ уже стал привычным инструментом в ИТ. Мы используем LLM‑модели через веб-интерфейсы, API в коде, плагины и отдельные приложения. Но существует ещё один удобный способ взаимодействия с ними — командная строка.

    habr.com/ru/articles/938418/

    #llm #unix #bash #commandline #cli #искусственный_интеллект #обработка_документов

  44. Эффективное использование LLM в командной строке

    ИИ уже стал привычным инструментом в ИТ. Мы используем LLM‑модели через веб-интерфейсы, API в коде, плагины и отдельные приложения. Но существует ещё один удобный способ взаимодействия с ними — командная строка.

    habr.com/ru/articles/938418/

    #llm #unix #bash #commandline #cli #искусственный_интеллект #обработка_документов

  45. Сравнение сервисов для анализа документов AWS Textract, Azure Document Intelligence и Ripper Service от Технологики

    Бизнес все чаще и чаще предпочитают отдать искусственному интеллекту извлечение данных из документов: при таком подходе меньше ошибок и выше скорость обработки документов. И все чаще звучит вопрос — каким решением пользоваться и к какому подрядчику пойти за оказанием услуги? Поэтому мы сделали сравнительный обзор двух популярных решений от лидеров рынка по обработке документов — AWS Textract, Microsoft Azure Document Intelligence и собственного решения Ripper Service. Сравнивали решения по нескольким основаниям: по производительности, по результатам извлечения значений из форм, а также по стоимости. Надеемся, что данная статья будет полезна руководителям компаний, которые уже задумались о применении ИИ для массовой обработки документов.

    habr.com/ru/articles/822331/

    #aws #azure_ml #ocr #idp #обработка_документов #ии #машинное_обучение #textract #ripper_service #ai

  46. СontentCapture+LLM: как мы ускорили работу с неструктурированными документами

    В эпоху цифровой трансформации каждая минута работы с документами на вес золота. Юридические отделы, банки, госучреждения ежедневно обрабатывают сотни договоров, доверенностей и судебных приказов. Ручной ввод данных, поиск реквизитов и проверка сроков могут отнимать до 20 минут на документ — и это если сотрудник не отвлекся на кофе. В нашей линейке продуктов есть универсальная IDP-платформа ContentCapture . Она хорошо понимает структурированные документы, а вот при обработке неструктурированных данных раньше могли возникать сложности. Чтобы решить эту проблему, мы в новом релизе продукта настроили интеграцию с облачными большими языковыми моделями (LLM), такими как YandexGPT и GigaChat. Делимся подробностями и рассказываем, как оценивали качество работы LLM с разными типами документов.

    habr.com/ru/companies/contenta

    #contentcapture #llm #nlp #nlp_обработка_текста #обработка_документов

  47. Как мы заставили LLM понимать юридические документы лучше юристов: история создания универсального промта

    В прошлой статье мы говорили, что нашли быстрый и простой способ, как с помощью LLM вытаскивать данные из юридических документов и доверенностей. А сегодня расскажем, какой промт мы для этого использовали. Узнать подробности

    habr.com/ru/companies/contenta

    #обработка_документов #llm #ai #nlp #idp #автоматизация_документооборота #искусственный_интеллект

  48. Как мы заставили LLM понимать юридические документы лучше юристов: история создания универсального промта

    В прошлой статье мы говорили, что нашли быстрый и простой способ, как с помощью LLM вытаскивать данные из юридических документов и доверенностей. А сегодня расскажем, какой промт мы для этого использовали. Узнать подробности

    habr.com/ru/companies/contenta

    #обработка_документов #llm #ai #nlp #idp #автоматизация_документооборота #искусственный_интеллект

  49. Как мы заставили LLM понимать юридические документы лучше юристов: история создания универсального промта

    В прошлой статье мы говорили, что нашли быстрый и простой способ, как с помощью LLM вытаскивать данные из юридических документов и доверенностей. А сегодня расскажем, какой промт мы для этого использовали. Узнать подробности

    habr.com/ru/companies/contenta

    #обработка_документов #llm #ai #nlp #idp #автоматизация_документооборота #искусственный_интеллект

  50. Как мы заставили LLM понимать юридические документы лучше юристов: история создания универсального промта

    В прошлой статье мы говорили, что нашли быстрый и простой способ, как с помощью LLM вытаскивать данные из юридических документов и доверенностей. А сегодня расскажем, какой промт мы для этого использовали. Узнать подробности

    habr.com/ru/companies/contenta

    #обработка_документов #llm #ai #nlp #idp #автоматизация_документооборота #искусственный_интеллект