#сегментация_изображений — Public Fediverse posts on home.social

Habr @[email protected] · 2026-04-21 · 12:02 UTC

[Перевод] OCR всё прочитал, но ничего не понял: как мы научили систему разбирать транспортные накладные

Современные библиотеки компьютерного зрения позволяют получить результат буквально за несколько строк кода, но за этой простотой скрывается ряд практических ограничений и компромиссов. В статье разберём, как на самом деле работают модели «из коробки», где проходит граница их применимости и как из сырых выходов детекторов собрать осмысленную логику — от базового inference до сценариев видеоаналитики. Речь пойдёт о прикладном использовании инструментов вроде YOLO, OpenCV и Hugging Face в задачах, где важен не только сам факт распознавания, но и то, что с этим делать дальше.

https://habr.com/ru/companies/otus/articles/1026088/

#компьютерное_зрение #CV #YOLO #OpenCV #Hugging_Face #детекция_объектов #сегментация_изображений #видеоаналитика #анализ_изображений

#анализ_изображений #видеоаналитика #сегментация_изображений #детекция_объектов #hugging_face #opencv

Habr @[email protected] · 2026-04-09 · 18:02 UTC

TAPe‑дневник, день 8: сегментация по границам, 77% классификации и первые бенчмарки против YOLO

В этом посте продолжаем дневник TAPe‑детекции на COCO: добавляем сегментацию по контрастным патчам на границе объектов, дорабатываем классификацию, избавляемся от learning rate и смотрим, как ведёт себя YOLO на нашем маленьком датасете. А уже завтра покажем базовые и COCO‑бенчмарки, сравнения с YOLO и RF‑DETR по точности (mAP50/mAP50‑95), скорости, числу параметров и требованиям к данным, а заодно чуть подробнее поговорим про аннотацию и то, почему нам хватает десятков изображений на класс там, где другим нужны сотни тысяч. Вникнуть

https://habr.com/ru/articles/1021546/

#tape+ml #компьютерное_зрение #детекция_объектов #сегментация_изображений #COCO #selfsupervised #yolo #detr #learning_rate #embeddings

#embeddings #learning_rate #detr #yolo #selfsupervised #coco

Habr @[email protected] · 2026-04-09 · 18:02 UTC

TAPe‑дневник, день 8: сегментация по границам, 77% классификации и первые бенчмарки против YOLO

В этом посте продолжаем дневник TAPe‑детекции на COCO: добавляем сегментацию по контрастным патчам на границе объектов, дорабатываем классификацию, избавляемся от learning rate и смотрим, как ведёт себя YOLO на нашем маленьком датасете. А уже завтра покажем базовые и COCO‑бенчмарки, сравнения с YOLO и RF‑DETR по точности (mAP50/mAP50‑95), скорости, числу параметров и требованиям к данным, а заодно чуть подробнее поговорим про аннотацию и то, почему нам хватает десятков изображений на класс там, где другим нужны сотни тысяч. Вникнуть

https://habr.com/ru/articles/1021546/

#tape+ml #компьютерное_зрение #детекция_объектов #сегментация_изображений #COCO #selfsupervised #yolo #detr #learning_rate #embeddings

#embeddings #learning_rate #detr #yolo #selfsupervised #coco

Habr @[email protected] · 2026-04-09 · 18:02 UTC

TAPe‑дневник, день 8: сегментация по границам, 77% классификации и первые бенчмарки против YOLO

В этом посте продолжаем дневник TAPe‑детекции на COCO: добавляем сегментацию по контрастным патчам на границе объектов, дорабатываем классификацию, избавляемся от learning rate и смотрим, как ведёт себя YOLO на нашем маленьком датасете. А уже завтра покажем базовые и COCO‑бенчмарки, сравнения с YOLO и RF‑DETR по точности (mAP50/mAP50‑95), скорости, числу параметров и требованиям к данным, а заодно чуть подробнее поговорим про аннотацию и то, почему нам хватает десятков изображений на класс там, где другим нужны сотни тысяч. Вникнуть

https://habr.com/ru/articles/1021546/

#tape+ml #компьютерное_зрение #детекция_объектов #сегментация_изображений #COCO #selfsupervised #yolo #detr #learning_rate #embeddings

#embeddings #learning_rate #detr #yolo #selfsupervised #coco

Habr @[email protected] · 2026-04-09 · 18:02 UTC

TAPe‑дневник, день 8: сегментация по границам, 77% классификации и первые бенчмарки против YOLO

В этом посте продолжаем дневник TAPe‑детекции на COCO: добавляем сегментацию по контрастным патчам на границе объектов, дорабатываем классификацию, избавляемся от learning rate и смотрим, как ведёт себя YOLO на нашем маленьком датасете. А уже завтра покажем базовые и COCO‑бенчмарки, сравнения с YOLO и RF‑DETR по точности (mAP50/mAP50‑95), скорости, числу параметров и требованиям к данным, а заодно чуть подробнее поговорим про аннотацию и то, почему нам хватает десятков изображений на класс там, где другим нужны сотни тысяч. Вникнуть

https://habr.com/ru/articles/1021546/

#tape+ml #компьютерное_зрение #детекция_объектов #сегментация_изображений #COCO #selfsupervised #yolo #detr #learning_rate #embeddings

#tape #компьютерное_зрение #детекция_объектов #сегментация_изображений #coco #selfsupervised

Habr @[email protected] · 2026-03-19 · 12:02 UTC

Автоматизированное определение величины зерна стали по ASTM E112, ISO 643 и ГОСТ 5639 с использованием OpenCV

Оценка величины зерна является одной из базовых задач количественной металлографии, поскольку размер зерна напрямую связан с комплексом механических свойств металла: прочностью, пластичностью, ударной вязкостью, склонностью к хрупкому разрушению и стабильностью свойств после термической обработки. В промышленной практике для определения величины зерна широко применяются стандарты ASTM E112 , ISO 643 и ГОСТ 5639 . Несмотря на наличие формализованных методик, в реальной лабораторной практике анализ по-прежнему часто выполняется с опорой на визуальное сравнение микроструктуры с эталонными шкалами. Такой подход удобен и быстр, однако имеет ряд известных ограничений: высокая зависимость от квалификации эксперта, межоператорный разброс, чувствительность к качеству травления и освещения, а также трудности воспроизводимого документирования результата. В данной статье рассматривается практическая реализация системы автоматизированного анализа зеренной структуры стали на Python с использованием OpenCV . Цель разработки состояла не в замене стандартизованных методов их упрощённой цифровой имитацией, а в создании воспроизводимого инструмента, который позволяет приблизить лабораторный анализ к количественной обработке изображений и обеспечить прослеживаемость результата.

https://habr.com/ru/articles/1012280/

#компьютерное_зрение #обработка_изображений #сегментация_изображений #image_processing #OpenCV #Python_OpenCV #металлография #анализ_микроструктуры #морфологические_операции #выделение_границ

#выделение_границ #морфологические_операции #анализ_микроструктуры #металлография #python_opencv #opencv

Habr @[email protected] · 2026-03-19 · 12:02 UTC

Автоматизированное определение величины зерна стали по ASTM E112, ISO 643 и ГОСТ 5639 с использованием OpenCV

Оценка величины зерна является одной из базовых задач количественной металлографии, поскольку размер зерна напрямую связан с комплексом механических свойств металла: прочностью, пластичностью, ударной вязкостью, склонностью к хрупкому разрушению и стабильностью свойств после термической обработки. В промышленной практике для определения величины зерна широко применяются стандарты ASTM E112 , ISO 643 и ГОСТ 5639 . Несмотря на наличие формализованных методик, в реальной лабораторной практике анализ по-прежнему часто выполняется с опорой на визуальное сравнение микроструктуры с эталонными шкалами. Такой подход удобен и быстр, однако имеет ряд известных ограничений: высокая зависимость от квалификации эксперта, межоператорный разброс, чувствительность к качеству травления и освещения, а также трудности воспроизводимого документирования результата. В данной статье рассматривается практическая реализация системы автоматизированного анализа зеренной структуры стали на Python с использованием OpenCV . Цель разработки состояла не в замене стандартизованных методов их упрощённой цифровой имитацией, а в создании воспроизводимого инструмента, который позволяет приблизить лабораторный анализ к количественной обработке изображений и обеспечить прослеживаемость результата.

https://habr.com/ru/articles/1012280/

#компьютерное_зрение #обработка_изображений #сегментация_изображений #image_processing #OpenCV #Python_OpenCV #металлография #анализ_микроструктуры #морфологические_операции #выделение_границ

#выделение_границ #морфологические_операции #анализ_микроструктуры #металлография #python_opencv #opencv

Habr @[email protected] · 2026-03-19 · 12:02 UTC

Автоматизированное определение величины зерна стали по ASTM E112, ISO 643 и ГОСТ 5639 с использованием OpenCV

Оценка величины зерна является одной из базовых задач количественной металлографии, поскольку размер зерна напрямую связан с комплексом механических свойств металла: прочностью, пластичностью, ударной вязкостью, склонностью к хрупкому разрушению и стабильностью свойств после термической обработки. В промышленной практике для определения величины зерна широко применяются стандарты ASTM E112 , ISO 643 и ГОСТ 5639 . Несмотря на наличие формализованных методик, в реальной лабораторной практике анализ по-прежнему часто выполняется с опорой на визуальное сравнение микроструктуры с эталонными шкалами. Такой подход удобен и быстр, однако имеет ряд известных ограничений: высокая зависимость от квалификации эксперта, межоператорный разброс, чувствительность к качеству травления и освещения, а также трудности воспроизводимого документирования результата. В данной статье рассматривается практическая реализация системы автоматизированного анализа зеренной структуры стали на Python с использованием OpenCV . Цель разработки состояла не в замене стандартизованных методов их упрощённой цифровой имитацией, а в создании воспроизводимого инструмента, который позволяет приблизить лабораторный анализ к количественной обработке изображений и обеспечить прослеживаемость результата.

https://habr.com/ru/articles/1012280/

#компьютерное_зрение #обработка_изображений #сегментация_изображений #image_processing #OpenCV #Python_OpenCV #металлография #анализ_микроструктуры #морфологические_операции #выделение_границ

#выделение_границ #морфологические_операции #анализ_микроструктуры #металлография #python_opencv #opencv

Habr @[email protected] · 2026-03-19 · 12:02 UTC

Автоматизированное определение величины зерна стали по ASTM E112, ISO 643 и ГОСТ 5639 с использованием OpenCV

Оценка величины зерна является одной из базовых задач количественной металлографии, поскольку размер зерна напрямую связан с комплексом механических свойств металла: прочностью, пластичностью, ударной вязкостью, склонностью к хрупкому разрушению и стабильностью свойств после термической обработки. В промышленной практике для определения величины зерна широко применяются стандарты ASTM E112 , ISO 643 и ГОСТ 5639 . Несмотря на наличие формализованных методик, в реальной лабораторной практике анализ по-прежнему часто выполняется с опорой на визуальное сравнение микроструктуры с эталонными шкалами. Такой подход удобен и быстр, однако имеет ряд известных ограничений: высокая зависимость от квалификации эксперта, межоператорный разброс, чувствительность к качеству травления и освещения, а также трудности воспроизводимого документирования результата. В данной статье рассматривается практическая реализация системы автоматизированного анализа зеренной структуры стали на Python с использованием OpenCV . Цель разработки состояла не в замене стандартизованных методов их упрощённой цифровой имитацией, а в создании воспроизводимого инструмента, который позволяет приблизить лабораторный анализ к количественной обработке изображений и обеспечить прослеживаемость результата.

https://habr.com/ru/articles/1012280/

#компьютерное_зрение #обработка_изображений #сегментация_изображений #image_processing #OpenCV #Python_OpenCV #металлография #анализ_микроструктуры #морфологические_операции #выделение_границ

#компьютерное_зрение #обработка_изображений #сегментация_изображений #image_processing #opencv #python_opencv

Habr @[email protected] · 2025-12-23 · 18:02 UTC

Применение вариационного исчисления к задаче выделения границ: вывод уравнения Эйлера-Лагранжа

Представьте, что вам нужно обвести объект на картинке — не просто тыкая в пиксели, а проведя одну идеальную, плавную и уверенную линию. Та самая, которую набросал бы на бумаге художник. Как объяснить компьютеру, что значит «идеальная граница»? Как заставить его искать не среди груды точек, а в бесконечном море возможных кривых? Оказывается, на этот вопрос уже давно ответила математика, а именно — вариационное исчисление. Это тот самый инструмент, который стоит за знаменитыми алгоритмами вроде «активных контуров» (snakes) или «уровневых множеств». Часто в статьях показывают готовые формулы и код, а саму красивую логику оставляют за кадром. Давайте вместе разберем эту связь. Начнем с простого: как найти минимум у обычной функции. А потом — шаг за шагом — расширим эту идею до целых кривых. Ключевой момент на пути — уравнение Эйлера-Лагранжа. Мы не просто запишем его, а честно выведем: от замысла «энергии» контура до финального условия, используя лишь базовую лемму вариационного исчисления и интегрирование по частям. Самое интересное — это уравнение не просто абстракция. Оно описывает баланс, равновесие сил. Оптимальная граница — результат «борьбы»: с одной стороны, она хочет оставаться гладкой и аккуратной, с другой — стремится лечь точно на резкий перепад цвета или яркости на изображении. Как только вы это поймете, работа с алгоритмами сегментации перестает быть магией. Вы начинаете осмысленно настраивать параметры, предсказывать поведение и даже придумывать собственные критерии для «идеальной границы».

https://habr.com/ru/articles/979872/

#active_contours #сегментация_изображений #уравнение_Эйлера__Лангранжа #Matlab__реализация #вариационное_исчисление #компьютерное_зрение #snakes_алгоритм #градиентный_спуск #энергетический_функционал #анализ_границ

#анализ_границ #энергетический_функционал #градиентный_спуск #snakes_алгоритм #компьютерное_зрение #вариационное_исчисление

Habr @[email protected] · 2025-12-08 · 11:42 UTC

Реализуем компьютерное зрение на практике

На тему компьютерного зрения есть множество различных публикаций, которые в основном рассказывают о применении этой технологии в разных отраслях. Однако, зачастую публикации содержат лишь общую информацию о том, что реализовано и для каких задач, но при этом отсутствует описание того, как это можно сделать. В нашей статье мы поговорим о том, как можно реализовать на Python навигационную систему на основе машинного зрения для автономных транспортных средств, проанализировать медицинские изображения и выполнить генерацию новых изображений из набора данных уже существующих.

https://habr.com/ru/companies/otus/articles/968010/

#ai #computervision #ml #компьютерное_зрение #обработка_изображений #автономная_навигация #сегментация_изображений #генерация_изображений #нейронные_сети #глубокое_обучение

#ai #computervision #ml #компьютерное_зрение #обработка_изображений #автономная_навигация

Habr @[email protected] · 2025-08-26 · 06:42 UTC

Повышаем точность диагностики ДЦП у новорожденных с помощью нейросетей

МРТ головного мозга помогает диагностировать серьёзные патологии, от опухолей до нейродегенеративных заболеваний. Своевременная диагностика в младенческом возрасте позволяет заметить в развитии мозга негативную динамику, приводящую к заболеваниям наподобие ДЦП , и вовремя начать терапию. Но когда дело касается обследования таких пациентов, есть дополнительные риски: эту процедуру проводят под анестезией. Поэтому врачам важны решения, которые позволят сократить время диагностики, снизить риски и принять более информированные решения. Специалисты Санкт‑Петербургского государственного педиатрического медицинского университета (СПбГПМУ) совместно со Школой анализа данных (ШАД) и Центром технологий для общества Yandex Cloud разработали решение на базе нейросети, которое помогает оценить развитие мозга новорожденных по МРТ‑снимкам. При подозрении на ДЦП и другие болезни ЦНС решение работает как вспомогательный инструмент, который сокращает время расшифровки результатов МРТ до нескольких минут вместо нескольких дней. Меня зовут Юлия Бусыгина, я руковожу проектом со стороны Yandex Cloud, и в этой статье мы вместе с профессором Александром Поздняковым расскажем подробнее, как проектировали решение, обучали модель, как тестируем и оцениваем его эффективность.

https://habr.com/ru/companies/yandex/articles/940552/

#мрт #мрт_цнс #мрт_центральной_нервной_системы #unet #unet++ #сегментация_изображений #resnet #resnet50

#мрт #мрт_цнс #мрт_центральной_нервной_системы #unet #сегментация_изображений #resnet

Habr @[email protected] · 2025-06-25 · 15:42 UTC

Заставляем компьютер видеть цвета без нейросетей: сегментация изображений по старинке

Привет, Хабр! В предыдущей части мы рассматривали базовые методы цифровой обработки изображений для задачи сегментации спутникового снимка. В этой статье рассмотрим ещё парочку методов решения этой задачи, всё ещё «классических», то есть без применения машинного обучения или нейросетей. Помогут нам во всём разобраться, как и в прошлый раз, язык программирования Julia и среда технических расчётов Engee !

https://habr.com/ru/companies/etmc_exponenta/articles/921784/

#обработка_изображений #сегментация #сегментация_изображений #спутниковые_снимки #julia #engee #морфология #бинаризация #фильтрация_изображений

#обработка_изображений #сегментация #сегментация_изображений #спутниковые_снимки #julia #engee

Habr @[email protected] · 2025-06-25 · 15:42 UTC

Заставляем компьютер видеть цвета без нейросетей: сегментация изображений по старинке

Привет, Хабр! В предыдущей части мы рассматривали базовые методы цифровой обработки изображений для задачи сегментации спутникового снимка. В этой статье рассмотрим ещё парочку методов решения этой задачи, всё ещё «классических», то есть без применения машинного обучения или нейросетей. Помогут нам во всём разобраться, как и в прошлый раз, язык программирования Julia и среда технических расчётов Engee !

https://habr.com/ru/companies/etmc_exponenta/articles/921784/

#обработка_изображений #сегментация #сегментация_изображений #спутниковые_снимки #julia #engee #морфология #бинаризация #фильтрация_изображений

#обработка_изображений #сегментация #сегментация_изображений #спутниковые_снимки #julia #engee

Habr @[email protected] · 2025-06-25 · 15:42 UTC

Заставляем компьютер видеть цвета без нейросетей: сегментация изображений по старинке

Привет, Хабр! В предыдущей части мы рассматривали базовые методы цифровой обработки изображений для задачи сегментации спутникового снимка. В этой статье рассмотрим ещё парочку методов решения этой задачи, всё ещё «классических», то есть без применения машинного обучения или нейросетей. Помогут нам во всём разобраться, как и в прошлый раз, язык программирования Julia и среда технических расчётов Engee !

https://habr.com/ru/companies/etmc_exponenta/articles/921784/

#обработка_изображений #сегментация #сегментация_изображений #спутниковые_снимки #julia #engee #морфология #бинаризация #фильтрация_изображений

#обработка_изображений #сегментация #сегментация_изображений #спутниковые_снимки #julia #engee

Habr @[email protected] · 2025-06-25 · 15:42 UTC

Заставляем компьютер видеть цвета без нейросетей: сегментация изображений по старинке

Привет, Хабр! В предыдущей части мы рассматривали базовые методы цифровой обработки изображений для задачи сегментации спутникового снимка. В этой статье рассмотрим ещё парочку методов решения этой задачи, всё ещё «классических», то есть без применения машинного обучения или нейросетей. Помогут нам во всём разобраться, как и в прошлый раз, язык программирования Julia и среда технических расчётов Engee !

https://habr.com/ru/companies/etmc_exponenta/articles/921784/

#обработка_изображений #сегментация #сегментация_изображений #спутниковые_снимки #julia #engee #морфология #бинаризация #фильтрация_изображений

#фильтрация_изображений #бинаризация #морфология #engee #julia #спутниковые_снимки

Habr @[email protected] · 2024-06-21 · 09:42 UTC

Как устроены 4.6-битные сети: обучение

Мы уже писали о том, что предложили новую модель квантования нейронных сетей, позволяющую ускорить их на 40% на центральных процессорах, а также о том, как она устроена тут . Сегодня мы расскажем о том, как мы в Smart Engines обучали 4.6-битные сети.

https://habr.com/ru/companies/smartengines/articles/823366/

#нейронные_сети #методы_квантования #квантование #классификация_изображений #сегментация_изображений #оптимизация #машинное_обучение #искусственный_интеллект #распознавание_паспорта

#распознавание_паспорта #искусственный_интеллект #машинное_обучение #оптимизация #сегментация_изображений #классификация_изображений

Habr @[email protected] · 2024-12-12 · 15:32 UTC

Homo clickus. Как моделирование кликающих людей пригодится для сегментации изображений

Приветствую всех читающих! Меня зовут Антон Антонов, я инженер по искусственному интеллекту, работаю в Институте искусственного интеллекта AIRI в команде, которая занимается Embodied AI — областью, связывающей робототехнику, компьютерное зрение и большие языковые модели. Недавно наша группа получила приятное известие: нашу статью с описанием модели того, как люди кликают и тапают на картинки, приняли на грядущий NeurIPS! Она будет полезна, чтобы тестировать модели интерактивной сегментации, которые помогают автоматизировать и ускорить процесс разметки изображений человеком. Ниже я хотел бы подробнее рассказать о нашей разработке. Кликнуть

https://habr.com/ru/companies/airi/articles/864602/

#интерактивная_сегментация #сегментация_изображений #компьютерное_зрение #разметка_данных #обработка_изображений #искусственный_интеллект #глубокое_обучение

#интерактивная_сегментация #сегментация_изображений #компьютерное_зрение #разметка_данных #обработка_изображений #искусственный_интеллект

Habr @[email protected] · 2025-06-17 · 09:52 UTC

Способы цветовой сегментации в задачах детектирования дорожных знаков

Распознавание дорожных знаков основывается на анализе изображений, полученных с камер, установленных на автомобиле. Эффективность работы такой системы зависит от корректной предварительной обработки изображений, в частности – от точного выделения области, содержащей дорожный знак. Основой этой процедуры выступает цветовая сегментация, поскольку большинство дорожных знаков обладают характерной цветовой окраской (например, красный, синий, жёлтый), позволяющей отличить их от фона. На практике задача сегментации усложняется различиями в освещении, погодных условиях, наличием теней, бликов, а также загрязнением камеры. Это делает использование стандартного цветового пространства RGB неэффективным, поскольку оно неразрывно связано с яркостью. В связи с этим актуальной становится задача выбора более устойчивого цветового пространства – например, HSV, LAB или IHSL – для выделения дорожных знаков при помощи цветовой сегментации [1].

https://habr.com/ru/articles/919088/

#сегментация_изображений #цветовая_сегментация #адаптивная_цветовая_сегментация #сегментация_дорожных_знаков #дорожные_знаки #IHSL #HSV #LAB #распознавание_дорожных_знаков #цветовые_пространства

#сегментация_изображений #цветовая_сегментация #адаптивная_цветовая_сегментация #сегментация_дорожных_знаков #дорожные_знаки #ihsl

Habr @[email protected] · 2024-12-11 · 08:42 UTC

Эволюция архитектур нейросетей в компьютерном зрении: сегментация изображений

Всем привет. Сегодняшний материал — продолжение цикла статей про ключевые события в развитии архитектур нейросетей. В прошлый раз я рассказал о классификации изображений. Сегодня речь пойдет про сегментацию. Статья охватывает FCN, U‑Net, SegNet, DeepLab, PSPNet, Mask R‑CMM и HRNet. Сегментация изображений

https://habr.com/ru/companies/slsoft/articles/864994/

#машинное_обучение #ml #нейросети #сегментация_изображений

Habr @[email protected] · 2024-07-04 · 18:02 UTC

Повышаем надёжность промышленного оборудования с помощью компьютерного зрения

Привет, Хабр! Меня зовут Павел Криницин. Я работаю на крупном металлургическом предприятии по производству и переработке алюминиевой продукции, где слежу за работой оборудования. В этой статье я расскажу, как мы исследовали способы раннего диагностирования повреждений конвейерных лент с применением компьютерного зрения. Эта статья будет полезна широкому кругу специалистов, занятых в различных областях промышленности, где применяют конвейерные транспортные системы. Описанные в статье подходы делают диагностику оборудования и поиск дефектов более точными, а планирование ремонтных работ — более эффективным.

https://habr.com/ru/companies/netologyru/articles/826718/

#компьютерное_зрение #алгоритмы #алгоритмы_обработки_данных #промышленность #производственный_процесс #сегментация_изображений #датасет #обучение_алгоритма #визуализация_данных #модельдетектор

#модельдетектор #визуализация_данных #обучение_алгоритма #датасет #сегментация_изображений #производственный_процесс