#детекция — Public Fediverse posts on home.social

Habr @[email protected] · 2026-03-26 · 15:22 UTC

TAPe‑дневник, день 6: синтетика, эмбеддинги и первый уход от трансформеров

В этой статье продолжаем онлайн‑дневник экспериментов с TAPe‑подходом к компьютерному зрению на COCO. Здесь – про обучение эмбеддингов на полностью синтетических TAPe‑данных, 74% точности классификации на 5k val‑изображениях и первые выводы о том, почему стандартные трансформеры нам не подходят. Долой трансформеры

https://habr.com/ru/articles/1015514/

#машинное_обучение #трансформеры #детекция #эмбеддинги #синтетические_данные #классификация_изображений #компьютерное_зрение #selfsupervised #attention #tape+ml

#tape #attention #selfsupervised #компьютерное_зрение #классификация_изображений #синтетические_данные

Habr @[email protected] · 2026-03-26 · 15:22 UTC

TAPe‑дневник, день 6: синтетика, эмбеддинги и первый уход от трансформеров

В этой статье продолжаем онлайн‑дневник экспериментов с TAPe‑подходом к компьютерному зрению на COCO. Здесь – про обучение эмбеддингов на полностью синтетических TAPe‑данных, 74% точности классификации на 5k val‑изображениях и первые выводы о том, почему стандартные трансформеры нам не подходят. Долой трансформеры

https://habr.com/ru/articles/1015514/

#машинное_обучение #трансформеры #детекция #эмбеддинги #синтетические_данные #классификация_изображений #компьютерное_зрение #selfsupervised #attention #tape+ml

#tape #attention #selfsupervised #компьютерное_зрение #классификация_изображений #синтетические_данные

Habr @[email protected] · 2026-03-26 · 15:22 UTC

TAPe‑дневник, день 6: синтетика, эмбеддинги и первый уход от трансформеров

В этой статье продолжаем онлайн‑дневник экспериментов с TAPe‑подходом к компьютерному зрению на COCO. Здесь – про обучение эмбеддингов на полностью синтетических TAPe‑данных, 74% точности классификации на 5k val‑изображениях и первые выводы о том, почему стандартные трансформеры нам не подходят. Долой трансформеры

https://habr.com/ru/articles/1015514/

#машинное_обучение #трансформеры #детекция #эмбеддинги #синтетические_данные #классификация_изображений #компьютерное_зрение #selfsupervised #attention #tape+ml

#машинное_обучение #трансформеры #детекция #эмбеддинги #синтетические_данные #классификация_изображений

Habr @[email protected] · 2024-10-01 · 12:02 UTC

DETR: Бесконечная история

Всем привет, с вами команда Layer ! Мы рады сообщить, что совсем скоро выйдет наша новая исследовательская работа, посвященная поиску моментов в видео, релевантных пользовательскому запросу. Мы хотим сделать эту работу как можно более доступной для каждого, кто хочет глубже разобраться в теме. Поэтому мы решили написать этот небольшой туториал, посвященный семейству моделей DETR, так как они используются не только для детекции котиков на картинках, но и в таких необычных доменах, как детекция моментов в видео. Мы уверены, что среди читателей многие знакомы с основами DETR, однако подозреваем, что не все могли следить за её развитием. Всё‑таки по сравнению с YOLO, DETRу пиара явно не достает. В этой статье мы предлагаем краткий обзор эволюции модели, чтобы помочь вам лучше ориентироваться в новых исследованиях. Если же вы впервые слышите о DETR или хотите освежить свои знания, то бегом читать — тык , если после прочтения остались вопросы, то можно ознакомиться с этими видео — тык , тык . Давайте детальнее разберёмся, что ждёт вас в этом туториале. Сначала мы рассмотрим недостатки оригинальной версии DETR, а затем перейдём к архитектурным улучшениям, которые либо устранили эти проблемы, либо заметно их сгладили. Начнём с Deformable DETR — модели, которая оптимизировала вычисления. Затем обратим внимание на Conditional DETR и DAB DETR — архитектуры, которые существенно переосмыслили роль queries в модели. Далее мы погрузимся в особенности DN‑DETR, который стабилизирует one‑to‑one matching . После этого детально разберём DINO DETR — модель, которая объединяет и улучшает идеи DN‑DETR и DAB‑DETR, а также переизобретает RPN для детекционных трансформеров. И в завершение нашего путешествия мы познакомимся с CO‑DETR, который объединил классические детекторы, такие как ATSS, Faster RCNN, и модели типа DETR, установив новые SOTA метрики на COCO.

https://habr.com/ru/companies/sberdevices/articles/847324/

#detr #machine_learning #deep_learning #detection #tutorial #машинное_обучение #глубокое_обучение #нейронные_сети #детекция

#детекция #нейронные_сети #глубокое_обучение #машинное_обучение #tutorial #detection

Habr @[email protected] · 2024-04-26 · 15:52 UTC

ViT для новичков: как нейросети научились определять зависимости в изображениях

В этой статье мы попытаемся рассказать про трансформерную архитектуру VIT и предысторию его формирования. Сегодня не совсем понятно, почему этот "формат" нейронок настолько эффективен. Некоторые говорят механизм внимания, но некоторые практики делают больше ставок в области Computer Vision на MetaFormer. https://github.com/sail-sg/poolformer Нейросети остаются для нас “теневым” процессом, подобным черному ящику. И изучение Deep Learning уже напоминает больше не математику, а биологию, где мы следим за поведением нашего детища.

https://habr.com/ru/articles/810817/

#трансформеры #vit #компьютерное_зрение #computer_vision #классификация #детекция #сегментация #нейросети

#нейросети #сегментация #детекция #классификация #computer_vision #компьютерное_зрение

Habr @[email protected] · 2024-02-11 · 12:32 UTC

Детекция объектов. YOLO. Часть 2

Кто такой YOLO? 🤔 Когда пытаешься разобраться в работе YOLO по статьям в интернете, постоянно натыкаешься на примерно такое объяснение: «Алгоритм делит изображение сеткой SxS, где каждому элементу этой сетки соответствует N ббоксов с координатами, предсказаниями классов и тд...». Но лично мне становилось только непонятнее от такого высокоуровнего описания.. Ведь в исследованиях часто всё происходит примерно так: перебирают гипотезы, пока не получат приемлемый результат, а потом уже придумывают красивое описание. Поэтому для ясности хочется в данной статье рассказать, как вообще приходили к идеям, которые ложились в основу YOLOv1 и последующих версий.

https://habr.com/ru/articles/792926/

#yolo #yolov1 #yolov2 #yolov3 #детекция #компьютерное_зрение #detection

#detection #компьютерное_зрение #детекция #yolov3 #yolov2 #yolov1

Habr @[email protected] · 2023-12-19 · 09:27 UTC

[Перевод] Заблуждения о семантической сегментации

Семантическая сегментация — это задача компьютерного зрения, заключающаяся в помещении в один класс связанных элементов изображения. Семантическая сегментация состоит из трёх этапов: Классификация: обнаружение и классификация определённого объекта на изображении. Локализация: нахождение предмета и отрисовка вокруг него ограничивающего прямоугольника. Сегментация: процесс группировки пикселей в локализованном изображении при помощи маски сегментации. Существует множество подтипов семантической сегментации, но все они возникают вследствие выбора пары параметров из двух категорий: размерности данных и разрешения выходных аннотаций.

https://habr.com/ru/articles/740824/

#машинное_обучение #CV #разметка_данных #сегментация #детекция

#детекция #сегментация #разметка_данных #cv #машинное_обучение