#распознавание — Public Fediverse posts
Live and recent posts from across the Fediverse tagged #распознавание, aggregated by home.social.
-
Распознавание изображений локальными LLM
Читая HABR, наткнулся на статью про мышление больших моделей и их способности распознавания изображений. И у меня возникла идея небольшого теста одной имеющейся у меня модели LLM, которая умеет распозновать фото, а именно llama4:16x17b НО запущенной полностью локально. Весит эта модель 67 гигабайт, если интересно на чем она была запущена отвечу в комментариях. На написание статьи меня подвинул один из комментариев - "а как интересно нейросеть распознает разные типы животных"
https://habr.com/ru/articles/1001640/
#llm #llmмодели #llmархитектура #распознавание #распознавание_объектов #распознавание_изображений #распознавание_образов
-
Маскарад невидимок
Добрый день, уважаемые хаброжители !!! Случилось страшное… Нам надо серьезно поговорить и обсудить пару “скользких” моментиков ;)) Вернее так, говорить мы сегодня будем про “подмены” лица во всей красе или, как принято сейчас величать сие явление, дипфейки . Так вот, случилось нам давеча участвовать в хакатоне Kryptonite ML Challenge 2025 (Разработка модели распознавания, способная противостоять DeepFake атакам) от компании «Криптонит».
https://habr.com/ru/companies/fa/articles/945056/
#дипфейки #изображения #распознавание #искусственный_интеллект #хакатон #машинное+обучение
-
Пайплайн распознавания номеров транспортных средств: как это устроено
Привет, Хабр! Это Анастасия Белозерова, я возглавляю команду, которая занимается исследованиями в области транспорта в VisionLabs. В прошлый раз я писала о пайплайне распознавания ТС, а сегодня поговорим про распознавание номеров. Для нас это одно из ключевых направлений, ведь номер для машины — это уникальный идентификатор, фактически то же самое, что и лицо для человека. Распознавать его можно совершенно разными способами, это всегда интересная задача. Что ж, погнали!
https://habr.com/ru/companies/ru_mts/articles/902670/
#транспорт #машинное+обучение #искусственный_интеллект #aircrack #ии #распознавание
-
Ищем потерявшихся питомцев с помощью нейросетей
Представьте себе, ваш питомец вдруг сбежал отправился в увлекательное путешествие по соседским дворам. Паника, нервы, поиски, бумажные объявления... И хорошо, если ваш пушистик чипирован, но ведь о таком заботятся не все. Можно пойти шерстить порталы с потеряшками, но где искать? Как они работают? Тот еще квест! Хотелось бы автоматизировать этот поиск и здесь как нельзя кстати подойдут нейросети. Мы обучили сеточки для детектирования и распознавания мордочек, которые могут стать основой для удобного сервиса поиска потерявшихся животных. Мы запилили удобного демо-бота с этими сеточками, он называется FindPet . И теперь с удовольствием представляем его вам и рассказываем, как мы его создавали.
https://habr.com/ru/companies/ntechlab/articles/847994/
#ntechlab #поиск_питомцев #котики #пёсики #распознавание #распознавание_лиц #питомцы #детектирование #компьютерное_зрение #машинное+обучение
-
Ищем потерявшихся питомцев с помощью нейросетей
Представьте себе, ваш питомец вдруг сбежал отправился в увлекательное путешествие по соседским дворам. Паника, нервы, поиски, бумажные объявления... И хорошо, если ваш пушистик чипирован, но ведь о таком заботятся не все. Можно пойти шерстить порталы с потеряшками, но где искать? Как они работают? Тот еще квест! Хотелось бы автоматизировать этот поиск и здесь как нельзя кстати подойдут нейросети. Мы обучили сеточки для детектирования и распознавания мордочек, которые могут стать основой для удобного сервиса поиска потерявшихся животных. Мы запилили удобного демо-бота с этими сеточками, он называется FindPet . И теперь с удовольствием представляем его вам и рассказываем, как мы его создавали.
https://habr.com/ru/companies/ntechlab/articles/847994/
#ntechlab #поиск_питомцев #котики #пёсики #распознавание #распознавание_лиц #питомцы #детектирование #компьютерное_зрение #машинное+обучение
-
Ищем потерявшихся питомцев с помощью нейросетей
Представьте себе, ваш питомец вдруг сбежал отправился в увлекательное путешествие по соседским дворам. Паника, нервы, поиски, бумажные объявления... И хорошо, если ваш пушистик чипирован, но ведь о таком заботятся не все. Можно пойти шерстить порталы с потеряшками, но где искать? Как они работают? Тот еще квест! Хотелось бы автоматизировать этот поиск и здесь как нельзя кстати подойдут нейросети. Мы обучили сеточки для детектирования и распознавания мордочек, которые могут стать основой для удобного сервиса поиска потерявшихся животных. Мы запилили удобного демо-бота с этими сеточками, он называется FindPet . И теперь с удовольствием представляем его вам и рассказываем, как мы его создавали.
https://habr.com/ru/companies/ntechlab/articles/847994/
#ntechlab #поиск_питомцев #котики #пёсики #распознавание #распознавание_лиц #питомцы #детектирование #компьютерное_зрение #машинное+обучение
-
[Перевод] Как ChatGPT меняет наш стиль письма — и почему это может стать проблемой
Эта статья является переводом / сжатием текста Ритеша Чуга (доцента кафедры информационных и коммуникационных технологий, CQUniversity Australia), опубликованного на The Conversation. Вы замечали, как в текстах часто повторяются фразы вроде " delve into " или " navigate the landscape "? Эти выражения стали обычными не только в соцсетях, но и в новостях, научных публикациях и даже студенческих эссе. Причина этого — растущее использование генеративных ИИ-инструментов , таких как ChatGPT и другие языковые модели. Эти инструменты предлагают шаблонные фразы на основе огромных объемов текстов, на которых они обучены. Как это работает? ИИ-инструменты, такие как ChatGPT, обучаются на миллиардах слов и фраз из различных источников. В результате они выдают самые популярные выражения и стилистические обороты, которые встречаются в этих текстах. Это приводит к тому, что определенные слова и фразы начинают использоваться слишком часто. Например, слова вроде “delves”, “showcasing”, “underscores”, “pivotal”, “realm” и “meticulous” стали доминировать в научных работах после появления ChatGPT. Проблема стилистики...
-
Методы предпроцессинга в IDP-системе ITFB EasyDoc
Всем привет! На связи команда Data Science компании ITFB Group. У нашей компании есть собственная разработка ITFB EasyDoc — система распознавания и извлечения данных из любого типа документов. В современном мире автоматизация обработки документов стала неотъемлемой частью множества бизнес-процессов. Предобработка изображений документов является важным шагом для обеспечения точности и надежности дальнейшего распознавания атрибутов. В этой статье мы хотим рассказать о некоторых эффективных методах предпроцессинга документов, позволяющих увеличивать как качество OCR-систем (Optical Character Recognition), так и различные CV и NLP пайплайны. Всем, кому интересна эта тема, — добро пожаловать под кат.
https://habr.com/ru/companies/itfb/articles/844380/
#ocr #ocrтехнологии #распознавание #распознавание_изображений #распознавание_паспорта #распознавание_документов #распознавание_объектов #распознавание_номеров #распознавание_текста #idp
-
IDP и OCR в вопросах и ответах: Главное, что нужно знать
Когда мы готовили этот материал, долго спорили, с какими персонажами можно было бы для наглядности сравнить OCR и IDP. Предлагались братья Коэны, Тор и Локи, Цезарь и Брут и много кто еще. Как видите, к одному мнению на этот счет мы в Smart Engines так и не пришли. Зато абсолютное единство было достигнуто по другому вопросу - о природе OCR и IDP. И если с культурными сравнениями еще можно поспорить, то в технологическом аспекте мы знаем все по фактам. Опустим высокие метафоры и расскажем, что такое OCR и IDP и на чьей стороне правда. Узнать, где правда 🔍
https://habr.com/ru/companies/smartengines/articles/840524/
#распознавание #ocr #ии #распознавание_образов #распознавание_текста #распознавание_номеров #распознавание_объектов #распознавание_документов #распознавание_паспорта #технологии
-
Пайплайн распознавания транспортных средств: как это работает
Привет, Хабр! С вами Анастасия Белозерова, руководитель исследовательских проектов в области транспорта в VisionLabs. В прошлом посте я рассказала, какие задачи можно решить с помощью видеоаналитики . А сегодня объясню, как устроен наш пайплайн распознавания автомобилей. Чтобы решить поставленную задачу, иногда достаточно задетектировать и распознать только номер — например, в кейсе шлагбаума придомовой территории. Но я расскажу про пайплайн (многошаговый алгоритм), который анализирует транспортное средство целиком. Чтобы фиксировать и валидировать нарушения правил дорожного движения, назначать плату за проезд, разыскивать угнанные автомобили и в целом для большинства кейсов из предыдущего поста, нам мало одного номера и кадра, с которого он взят. Важна вся история перемещения транспортного средства, поэтому без пайплайна не обойтись. Описывать я буду те методы, которые мы уже внедрили в продукт. Все визуализации в этом посте — результаты работы моей команды. Приступим!
https://habr.com/ru/companies/ru_mts/articles/838098/
#искусственный_интеллект #транспорт #машинное_обучение #распознавание
-
Выбираем систему распознавания: 20 вопросов, которые нужно задать вендору перед внедрением
Сориентироваться на рынке технологий распознавания документов – задача непростая. А отнестись к выбору системы стоит, между тем, ответственно: от надежности разработчика ПО зависит, будет ли решение функционировать без сбоев и будет ли работать вообще. Чтобы в дальнейшем дорогостоящее IT-решение не разочаровало – мы, Smart Engines , подготовили универсальный чек-лист. Он поможет вам минимизировать риски (спойлер: их немало) при выборе разработчика системы оптического распознавания текста и подобрать оптимальное решение.
https://habr.com/ru/companies/smartengines/articles/837530/
#ии #как_выбрать #как_выбрать_компанию #распознавание #ocr #ocrтехнологии #ocrskd #распознавание_образов #технологии #бизнес
-
Ваше лицо кажется знакомым: разведка, анализ и методы атак на ML в системах распознавания лиц
Мы живем в мире, где системы распознавания лиц (далее — CРЛ) используются практически везде: от валидации возраста и биометрической идентификации в режиме онлайн до наблюдения и проведения оплаты в реальном мире. Технологические аспекты таких алгоритмов развиваются на наших глазах: начиная с простых систем, основанных на базовых алгоритмах, мы перешли к системам, использующим алгоритмы машинного обучения, однако и их развитие еще далеко от завершения. В предыдущих исследованиях мы затронули биометрическую идентификацию, и эта работа является логичным продолжением погружения в системы распознавания лиц и эксплуатацию их недостатков. Пораспознаем лица?
https://habr.com/ru/companies/pt/articles/837536/
#ml #Биометрия #распознавание #распознавание_лиц #машинное_обучениe #патчи
-
Ваше лицо кажется знакомым: разведка, анализ и методы атак на ML в системах распознавания лиц
Мы живем в мире, где системы распознавания лиц (далее — CРЛ) используются практически везде: от валидации возраста и биометрической идентификации в режиме онлайн до наблюдения и проведения оплаты в реальном мире. Технологические аспекты таких алгоритмов развиваются на наших глазах: начиная с простых систем, основанных на базовых алгоритмах, мы перешли к системам, использующим алгоритмы машинного обучения, однако и их развитие еще далеко от завершения. В предыдущих исследованиях мы затронули биометрическую идентификацию, и эта работа является логичным продолжением погружения в системы распознавания лиц и эксплуатацию их недостатков. Пораспознаем лица?
https://habr.com/ru/companies/pt/articles/837536/
#ml #Биометрия #распознавание #распознавание_лиц #машинное_обучениe #патчи
-
Ваше лицо кажется знакомым: разведка, анализ и методы атак на ML в системах распознавания лиц
Мы живем в мире, где системы распознавания лиц (далее — CРЛ) используются практически везде: от валидации возраста и биометрической идентификации в режиме онлайн до наблюдения и проведения оплаты в реальном мире. Технологические аспекты таких алгоритмов развиваются на наших глазах: начиная с простых систем, основанных на базовых алгоритмах, мы перешли к системам, использующим алгоритмы машинного обучения, однако и их развитие еще далеко от завершения. В предыдущих исследованиях мы затронули биометрическую идентификацию, и эта работа является логичным продолжением погружения в системы распознавания лиц и эксплуатацию их недостатков. Пораспознаем лица?
https://habr.com/ru/companies/pt/articles/837536/
#ml #Биометрия #распознавание #распознавание_лиц #машинное_обучениe #патчи
-
Атрибутивное распознавание документов
Многие компании, несмотря на переход на электронный документооборот, всё равно сталкиваются с задачами автоматизации ввода информации с бумажных документов. Все они хотят избавиться от этой рутинной операции, и внедряют системы атрибутивного распознавания. На практике, часто оказывается, что такие системы не всегда соответствуют ожиданиям. Сегодня хочу обсудить подходы к решению задачи атрибутивного распознавания, а также проблемы с которыми я сталкивался за 10 лет практики в этой области. Многие забывают, что само распознавание документов не является конечной целью. Главная задача - это сократить человеческие трудозатраты на ввод информации с бумажных документов. т.е. в теории, если производительность человека на ввод информации магическим образом вырастет, то и распознавать ничего не надо. Скорее всего, для этой магии нам конечно понадобится распознавание, но это лишь один из инструментов. Так как же сократить трудозатраты?
https://habr.com/ru/articles/824562/
#OCR #NLP #ML #Распознавание #Recognition #Abbyy #smartengines #искусственный_интеллект #я_пиарюсь
-
Локальная REST-служба, или как за 5 минут интегрировать Smart ID Engine
Сегодня мы расскажем, как встроить нашу систему распознавания документов, удостоверяющих личность, Smart ID Engine в виде локально работающей службы с интерфейсом REST API.
https://habr.com/ru/companies/smartengines/articles/810627/
#restful #rest_api #распознавание #ocrтехнологии #распознавание_паспорта
-
Невероятный уровень «галлюцинирования» и проявление эмпатии от ChatGPT
Я много раз слышал о том, что ChatGPT галлюцинирует, то есть придумывает то, чего в реальности нет, но никогда с этим не сталкивался. Были какие-то неточности, но я их списывал на неактуальность базы данных или не замечал. Или как-то попросил его исправить грамматические ошибки, он их исправил, только зачем-то еще и текст в 2 раза сократил. На днях дочке задали выучить слова. Текст был написан от руки, и ей было трудно читать. Я подумал, что надо бы сделать печатные быквы и распечатать, переписывать не хотелось, решил использовать ChatGPT.
https://habr.com/ru/articles/809979/
#chatgpt #распознавание #распознавание_изображений #галлюцинации
-
АЛГЕБРА МУЗЫКАЛЬНОГО ТЕКСТА
Пшеничников С.Б., Сотникова Т.В. Нотный текст можно представить с помощью правильной координатизации матричными единицами подобно описанию вербальных текстов и других знаковых последовательностей. В дальнейшем может стать возможным математическое распознавание и создание музыкального смысла с предметным обоснованием промежуточных вычислений (в отличие от AI). У звука имеется четыре свойства: высота, длительность, громкость и тембр. Тембр пока не рассматривается. Словарь алгебры музыкальных текстов строится на основе нотной раскладки для фортепиано и современной нотной нотации. Длительность здесь для краткости первого изложения учитывается как «абсолютная». «Относительная» не рассматривается, хотя интервалы очень хорошо изучены и их признаки потребуются для категоризации композиторов. Сложность музыкального текста для применения математики объясняется стремлением упростить чтение музыкантами нотных знаков на стане из пяти линий и минимизации использования нижних и верхних добавочных линий. Для применения алгебры текста к музыкальным знаковым последовательностям нет необходимости использования нотоносца из пяти линий. То, что полезно и привычно для музыкантов, - для применения алгебры невыносимо вредно. Целесообразным представляется использование нотоносца-«нитка» - это нотный стан из одной линии. В этом случае нотный текст становится похож на вербальный текст. Для решения задачи требуется найти преобразование канонического нотного текста в «нитку». И как всегда для нового применения алгебры необходима правильная координатизация предметной области. В данной случае каждому используемому нотному знаку и символу современной нотной нотации требуется поставить в соответствие свой порядковый номер (натуральное число).
https://habr.com/ru/articles/788482/
#алгебра #ноты #текст #музыка #смысл #плагиат #распознавание #звуки #контекст #делимость
-
АЛГЕБРА СМЫСЛА
Пшеничников С.Б. Знаковые последовательности (например, вербальные и нотные тексты) можно превратить в математические объекты. Слова и числа стали одной сущностью, представлением матричной единицы, которая является матричным обобщением целых чисел и гиперкомплексным числом. Матричная единица – это матрица в которой один элемент равен единице, а остальные – нули. Если слова текста представить такими матрицами, то конкатенация (объединение с сохранением порядка) слов и текстов становится операцией сложения матриц. С текстами можно совершать преобразования с помощью алгебраических операций, например делить с остатком один текст на другой. Математически распознавать смысл текста и вычислять контекст слов. При этом алгебра помогает интерпретировать все промежуточные этапы вычислений. Человек видит и слышит только то, что понимает (И. В. Гёте). Понимает то, чему придает смысл как значимости для него. Смысл субъективен и зависит от интересов, мотиваций и чувств. Л. С. Выготский различал понятия «смысл» и «значение»: «если «значение» слова является объективным отражением системы связей и отношений, то «смысл» – это привнесение субъективных аспектов значения соответственно данному моменту и ситуации». По Г. Фреге «значения» - это свойства, отношения объектов, «смысл» - это только часть этих свойств. При этом и «значения» и «смысл» именуются одним «знаком», например словом. Два человека могут из списка значений выбрать для одного слова два непересекающихся фрагмента (два смысла) для его толкования.
https://habr.com/ru/articles/788478/
#алгебра #текст #знак #контекст #распознавание #смысл #матрица #категории #разум #пересказ
-
Топ-18 наших самых крутых ИИ-разработок за 2023 год: рукописная прописка, UniversalPay и обрезанные QR. А что еще?
2023 год оказался для нашей компании, Smart Engines , крайне успешным со всех точек зрения – бизнес-результатов, научных достижений и, разумеется, технологий. И нашими успехами мы традиционно хотим поделиться с вами. Подведение итогов мы решили начать с обзора наших самых заметных разработок . Некоторыми из них, кстати, вы, сами того не подозревая, можете пользоваться каждый день. Это и технология для упрощения платежей UniversalPay, и распознавание рукописной прописки, и считывание неограниченного числа QR-кодов, и много-много чего еще. Мы собрали для себя и для вас топ-18 разработок Smart Engines за минувший год – приглашаем под кат, чтобы с ними познакомиться.
https://habr.com/ru/companies/smartengines/articles/783224/
#QR #распознавание #обработка_изображений #итоги_года #итоги_года_2023 #ии #OCR #smart_engines #искусственный_интеллект
-
Российской OCR – 30 лет. Как появилась технология, благодаря которой мы забыли про ручной ввод? (Часть 2. OCR CuneiForm)
В честь 30-летия OCR мы продолжаем вспоминать, как появились первые отечественные технологии распознавания текста. На прошлой неделе мы рассказали про самую первую такую программу – OCR Tiger , предназначавшуюся для оцифровки книг с целью их дальнейшего переиздания. Сегодня речь пойдёт про другую OCR-систему – CuneiForm . Она была более продвинутой и умела гораздо больше: распознавала символы различных алфавитов на основе латиницы и кириллицы для европейских языков и языков стран СНГ, работала со смешанными русско-английскими текстами. Самое главное – CuneiForm отличалась огромной по меркам того времени скоростью: 1 страницу она распознавала примерно за 10 секунд. Разберемся, какие алгоритмы использовались в OCR, где применялась CuneiForm и какое дальнейшее развитие получили системы распознавания.
https://habr.com/ru/companies/smartengines/articles/779836/
#ocr #распознавание #обработка_изображений #ии #искусственный_интеллект
-
Распознавание пользовательского интерфейса в медицине
В процессе тестирования пользовательского интерфейса мы распознаем его на скриншотах тестируемого устройства. Говоря о распознавании, часто имеют ввиду нейросети и другие алгоритмы машинного обучения. Однако, применительно к нашей задаче машинное обучение имеет недостатки. Поэтому мы с его помощью решаем лишь некоторые части задачи распознавания GUI. В остальном, мы разбираем изображение по правилам, написанным вручную.
https://habr.com/ru/companies/auriga/articles/776224/
#тестирование #автоматическое_тестирование #медицина #анализ_изображений #распознавание #testing #automation_testing #ui_testing #recognition #image_analysis
-
Распознавание пользовательского интерфейса в медицине
В процессе тестирования пользовательского интерфейса мы распознаем его на скриншотах тестируемого устройства. Говоря о распознавании, часто имеют ввиду нейросети и другие алгоритмы машинного обучения. Однако, применительно к нашей задаче машинное обучение имеет недостатки. Поэтому мы с его помощью решаем лишь некоторые части задачи распознавания GUI. В остальном, мы разбираем изображение по правилам, написанным вручную.
https://habr.com/ru/companies/auriga/articles/776224/
#тестирование #автоматическое_тестирование #медицина #анализ_изображений #распознавание #testing #automation_testing #ui_testing #recognition #image_analysis