home.social

#глубокое_обучение — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #глубокое_обучение, aggregated by home.social.

  1. Основы глубокого обучения. Часть 1

    Приветствую всех! Эта статья будет первой в серии статей про основы глубокого обучения. В этой части я расскажу про то, что такое модели, искусственный интеллект (ИИ), машинное (МО) и глубокое обучение (ГО), про виды этапа обучения моделей, что такое нейронные сети, градиентный спуск и обратное распространение. В конце затронем теорию свёрточных нейронных сетей.

    habr.com/ru/articles/1034392/

    #глубокое_обучение #ai #ии #машинное_обучение #python #numpy #pytorch

  2. Основы глубокого обучения. Часть 1

    Приветствую всех! Эта статья будет первой в серии статей про основы глубокого обучения. В этой части я расскажу про то, что такое модели, искусственный интеллект (ИИ), машинное (МО) и глубокое обучение (ГО), про виды этапа обучения моделей, что такое нейронные сети, градиентный спуск и обратное распространение. В конце затронем теорию свёрточных нейронных сетей.

    habr.com/ru/articles/1034392/

    #глубокое_обучение #ai #ии #машинное_обучение #python #numpy #pytorch

  3. Основы глубокого обучения. Часть 1

    Приветствую всех! Эта статья будет первой в серии статей про основы глубокого обучения. В этой части я расскажу про то, что такое модели, искусственный интеллект (ИИ), машинное (МО) и глубокое обучение (ГО), про виды этапа обучения моделей, что такое нейронные сети, градиентный спуск и обратное распространение. В конце затронем теорию свёрточных нейронных сетей.

    habr.com/ru/articles/1034392/

    #глубокое_обучение #ai #ии #машинное_обучение #python #numpy #pytorch

  4. Основы глубокого обучения. Часть 1

    Приветствую всех! Эта статья будет первой в серии статей про основы глубокого обучения. В этой части я расскажу про то, что такое модели, искусственный интеллект (ИИ), машинное (МО) и глубокое обучение (ГО), про виды этапа обучения моделей, что такое нейронные сети, градиентный спуск и обратное распространение. В конце затронем теорию свёрточных нейронных сетей.

    habr.com/ru/articles/1034392/

    #глубокое_обучение #ai #ии #машинное_обучение #python #numpy #pytorch

  5. Как я создал альтернативу трансформерам

    В этой статье я хочу остановиться на разборе предложенной мной архитектуры декодера и тех вариантов, с которыми я сравниваю её в исследовании, но сделать это проще и интуитивнее, чем в самой работе. На мой взгляд, существующие объяснения архитектур декодеров часто подаются разрозненно. Каждый подход описывают отдельно, без общей опоры. А ведь всё можно свести к одному фундаменту, и тогда становятся гораздо заметнее как сильные стороны каждого решения, так и их ограничения.

    habr.com/ru/articles/990704/

    #искусственный_интеллект #машинное+обучение #transformers #mamba #llm #глубокое_обучение #нейросети

  6. Как я создал альтернативу трансформерам

    В этой статье я хочу остановиться на разборе предложенной мной архитектуры декодера и тех вариантов, с которыми я сравниваю её в исследовании, но сделать это проще и интуитивнее, чем в самой работе. На мой взгляд, существующие объяснения архитектур декодеров часто подаются разрозненно. Каждый подход описывают отдельно, без общей опоры. А ведь всё можно свести к одному фундаменту, и тогда становятся гораздо заметнее как сильные стороны каждого решения, так и их ограничения.

    habr.com/ru/articles/990704/

    #искусственный_интеллект #машинное+обучение #transformers #mamba #llm #глубокое_обучение #нейросети

  7. Как я создал альтернативу трансформерам

    В этой статье я хочу остановиться на разборе предложенной мной архитектуры декодера и тех вариантов, с которыми я сравниваю её в исследовании, но сделать это проще и интуитивнее, чем в самой работе. На мой взгляд, существующие объяснения архитектур декодеров часто подаются разрозненно. Каждый подход описывают отдельно, без общей опоры. А ведь всё можно свести к одному фундаменту, и тогда становятся гораздо заметнее как сильные стороны каждого решения, так и их ограничения.

    habr.com/ru/articles/990704/

    #искусственный_интеллект #машинное+обучение #transformers #mamba #llm #глубокое_обучение #нейросети

  8. Как я создал альтернативу трансформерам

    В этой статье я хочу остановиться на разборе предложенной мной архитектуры декодера и тех вариантов, с которыми я сравниваю её в исследовании, но сделать это проще и интуитивнее, чем в самой работе. На мой взгляд, существующие объяснения архитектур декодеров часто подаются разрозненно. Каждый подход описывают отдельно, без общей опоры. А ведь всё можно свести к одному фундаменту, и тогда становятся гораздо заметнее как сильные стороны каждого решения, так и их ограничения.

    habr.com/ru/articles/990704/

    #искусственный_интеллект #машинное+обучение #transformers #mamba #llm #глубокое_обучение #нейросети

  9. Краткий справочник про внимания (self-attention, cross-attention, multi-head attention)

    Механизм внимания (Attention) - это метод в искусственном интеллекте, который позволяет нейросети динамически определять, какие части входных данных наиболее важны для текущей задачи. Он работает через вычисление весов важности для разных элементов входа: более важные элементы получают больший вес, а менее важные - меньший. Затем модель формирует взвешенную сумму представлений, создавая новый контекстный вектор. Self-attention, в свою очередь, помогает модели понимать, как разные элементы входных данных связаны между собой. Например, как разные части информации взаимодействуют и влияют друг на друга в общем контексте. Этот механизм обеспечивает логическую связность и целостное понимание всей структуры данных

    habr.com/ru/articles/1020624/

    #машинное_обучение #внимание #искуственный_интелект #attention #selfattention #глубокое_обучение #pytorch #transformer #beginner #математика

  10. Большие языковые модели на практике – международный бестселлер теперь на русском языке

    Книги про большие языковые модели сегодня выходят с той же скоростью, с какой сами эти модели генерируют текст. Зайдите в любой крупный книжный магазин — не важно, в оффлайновый или электронный — и вы увидите широчайший ассортимент названий, где присутствуют GPT, LLM и «искусственный интеллект» в различных сочетаниях. Одни издания — академические монографии для разработчиков, другие — лёгкое чтение для менеджеров, которые хотят «быть в теме». И те, и другие по-своему полезны, но среди них практически отсутствуют книги для практиков, желающих разобраться, как LLM устроены изнутри и как начать использовать их в реальных проектах уже сегодня. А вот эта книга - другое!

    habr.com/ru/companies/bhv_publ

    #AI #LLM #chatgpt #claude #искусственный_интеллект #gemini #copilot #языковые_модели #глубокое_обучение #нейросети

  11. YOLOE: детектим что угодно без дотренировок

    Всем привет! Представьте, сколько всего нужно сделать, чтобы дотренировать модель компьютерного зрения: Поиск и сборка датасетов. Хорошо, если есть открытые и с допустимой лицензией. Но часто приходится собирать «с миру по нитке», дополнять и балансировать данные самостоятельно. Разметка и аугментация. Качественный датасет — залог хороших метрик. Придётся корпеть над точными detection-боксами, перепроверять, думать над нестандартными ситуациями во входных данных. Обучение и валидация. Потратим мощности, время, деньги, протестируем. Хорошо, если с первых попыток удастся найти достойный баланс между точностью и временем тренировки. В реальности нужно хотя бы несколько итераций. Но есть и другой путь. Сегодня расскажу о YOLOE — это модель, которая помогает решить эти проблемы.

    habr.com/ru/articles/1018144/

    #видеоаналитика #производство #пищевая_промышленность #промышленная_автоматизация #yolo #глубокое_обучение #computervision #машинное_обучение

  12. Книга: «Интервью по машинному обучению. 151 вопрос от FAANG»

    Привет, Хаброжители! Хотите построить карьеру в области ML? Воспользуйтесь опытом и советами Пенга Шао, чтобы научиться тому, как успешно пройти собеседование по машинному обучению. Книга охватывает весь процесс подготовки к интервью: от базовых концепций ML и программирования до проектирования сложных систем и инфраструктуры. Практические примеры, стратегии ответов на типичные вопросы и советы по прохождению различных этапов интервью помогут вам уверенно справиться как с техническим телефонным скринингом, так и с углубленным обсуждением моделей и оценок. Независимо от уровня — новичок вы или опытный специалист — эта книга станет вашим надежным навигатором в мире ML-собеседований, сочетая теорию, практику и реальные инсайты от экспертов.

    habr.com/ru/companies/piter/ar

    #книги_по_программированию #глубокое_обучение #машинное_обучение #ML #system_design #Алекс_Сюй #faang #faang_собеседования

  13. FAQ по TAPe‑детекции объектов

    Этот текст не претендует на «академический» обзор TAPe и не заменяет будущие формальные бенчмарки на COCO‑подобных датасетах. Скорее это рабочие ответы на самые частые вопросы инженеров и исследователей, которые всерьёз присматриваются к проекту. О чем речь Мы делаем TAPe‑модель (вот здесь понятней, о чем речь: тыц , другой тыц ) под задачи детекции объектов на COCO‑подобных данных, с возможностью добавлять свои классы и кастомизировать под конкретного заказчика. TAPe работает не с пикселями и не с жёсткой N×N‑сеткой, как YOLO, а с осмысленными регионами (патчами) в TAPe‑представлении. В экспериментах стремимся к тому, чтобы за один «ход» модель отсекала точно неинтересные области и выделяла кандидатов, где вообще есть смысл что‑то детектировать.​ На маленьком датасете из 4 классов и 1256 изображений с частично шумной разметкой пилотный TAPe‑детектор с ≈115k параметров даёт 98.94% попаданий по объектам по прикладной метрике «центроид бокса в 32 пикселя от центра разметки», причём без аугментаций и с обучением на CPU.​ В роли baseline’а брали YOLO11s (линейка Ultralytics/YOLOv8‑s): на том же датасете она плохо сходилась, давала низкую детекцию и много ложных срабатываний. Впрочем, выводы пока делать рано.​ TAPe‑архитектура за несколько итераций ушла от громоздкого (для нас) dictionary‑подхода с 100k+ параметров к более компактной схеме без классического градиентного спуска: описания классов собираются из TAPe‑векторов и сжимаются через k‑means, а не обучаются как отдельная нейросеть.​ На подмножестве COCO (около 2% датасета, ~2400 изображений) эта же компактная модель без спецоптимизаций даёт 60.59% попаданий по центрам объектов — для такого размера детектора это неожиданно много и хороший аргумент в пользу того, что TAPe‑данные позволяют «маленьким» моделям сходиться там, где стандартные подходы ожидаемо захлёбываются. Очень интересно

    habr.com/ru/articles/1011406/

    #компьютерное_зрение #машинное_обучение #разметка_датасета #пилотный_проект #детекция_объектов #instance_segmentation #глубокое_обучение #yolo #TAPe_ML #нейросети

  14. FAQ по TAPe‑детекции объектов

    Этот текст не претендует на «академический» обзор TAPe и не заменяет будущие формальные бенчмарки на COCO‑подобных датасетах. Скорее это рабочие ответы на самые частые вопросы инженеров и исследователей, которые всерьёз присматриваются к проекту. О чем речь Мы делаем TAPe‑модель (вот здесь понятней, о чем речь: тыц , другой тыц ) под задачи детекции объектов на COCO‑подобных данных, с возможностью добавлять свои классы и кастомизировать под конкретного заказчика. TAPe работает не с пикселями и не с жёсткой N×N‑сеткой, как YOLO, а с осмысленными регионами (патчами) в TAPe‑представлении. В экспериментах стремимся к тому, чтобы за один «ход» модель отсекала точно неинтересные области и выделяла кандидатов, где вообще есть смысл что‑то детектировать.​ На маленьком датасете из 4 классов и 1256 изображений с частично шумной разметкой пилотный TAPe‑детектор с ≈115k параметров даёт 98.94% попаданий по объектам по прикладной метрике «центроид бокса в 32 пикселя от центра разметки», причём без аугментаций и с обучением на CPU.​ В роли baseline’а брали YOLO11s (линейка Ultralytics/YOLOv8‑s): на том же датасете она плохо сходилась, давала низкую детекцию и много ложных срабатываний. Впрочем, выводы пока делать рано.​ TAPe‑архитектура за несколько итераций ушла от громоздкого (для нас) dictionary‑подхода с 100k+ параметров к более компактной схеме без классического градиентного спуска: описания классов собираются из TAPe‑векторов и сжимаются через k‑means, а не обучаются как отдельная нейросеть.​ На подмножестве COCO (около 2% датасета, ~2400 изображений) эта же компактная модель без спецоптимизаций даёт 60.59% попаданий по центрам объектов — для такого размера детектора это неожиданно много и хороший аргумент в пользу того, что TAPe‑данные позволяют «маленьким» моделям сходиться там, где стандартные подходы ожидаемо захлёбываются. Очень интересно

    habr.com/ru/articles/1011406/

    #компьютерное_зрение #машинное_обучение #разметка_датасета #пилотный_проект #детекция_объектов #instance_segmentation #глубокое_обучение #yolo #TAPe_ML #нейросети

  15. FAQ по TAPe‑детекции объектов

    Этот текст не претендует на «академический» обзор TAPe и не заменяет будущие формальные бенчмарки на COCO‑подобных датасетах. Скорее это рабочие ответы на самые частые вопросы инженеров и исследователей, которые всерьёз присматриваются к проекту. О чем речь Мы делаем TAPe‑модель (вот здесь понятней, о чем речь: тыц , другой тыц ) под задачи детекции объектов на COCO‑подобных данных, с возможностью добавлять свои классы и кастомизировать под конкретного заказчика. TAPe работает не с пикселями и не с жёсткой N×N‑сеткой, как YOLO, а с осмысленными регионами (патчами) в TAPe‑представлении. В экспериментах стремимся к тому, чтобы за один «ход» модель отсекала точно неинтересные области и выделяла кандидатов, где вообще есть смысл что‑то детектировать.​ На маленьком датасете из 4 классов и 1256 изображений с частично шумной разметкой пилотный TAPe‑детектор с ≈115k параметров даёт 98.94% попаданий по объектам по прикладной метрике «центроид бокса в 32 пикселя от центра разметки», причём без аугментаций и с обучением на CPU.​ В роли baseline’а брали YOLO11s (линейка Ultralytics/YOLOv8‑s): на том же датасете она плохо сходилась, давала низкую детекцию и много ложных срабатываний. Впрочем, выводы пока делать рано.​ TAPe‑архитектура за несколько итераций ушла от громоздкого (для нас) dictionary‑подхода с 100k+ параметров к более компактной схеме без классического градиентного спуска: описания классов собираются из TAPe‑векторов и сжимаются через k‑means, а не обучаются как отдельная нейросеть.​ На подмножестве COCO (около 2% датасета, ~2400 изображений) эта же компактная модель без спецоптимизаций даёт 60.59% попаданий по центрам объектов — для такого размера детектора это неожиданно много и хороший аргумент в пользу того, что TAPe‑данные позволяют «маленьким» моделям сходиться там, где стандартные подходы ожидаемо захлёбываются. Очень интересно

    habr.com/ru/articles/1011406/

    #компьютерное_зрение #машинное_обучение #разметка_датасета #пилотный_проект #детекция_объектов #instance_segmentation #глубокое_обучение #yolo #TAPe_ML #нейросети

  16. FAQ по TAPe‑детекции объектов

    Этот текст не претендует на «академический» обзор TAPe и не заменяет будущие формальные бенчмарки на COCO‑подобных датасетах. Скорее это рабочие ответы на самые частые вопросы инженеров и исследователей, которые всерьёз присматриваются к проекту. О чем речь Мы делаем TAPe‑модель (вот здесь понятней, о чем речь: тыц , другой тыц ) под задачи детекции объектов на COCO‑подобных данных, с возможностью добавлять свои классы и кастомизировать под конкретного заказчика. TAPe работает не с пикселями и не с жёсткой N×N‑сеткой, как YOLO, а с осмысленными регионами (патчами) в TAPe‑представлении. В экспериментах стремимся к тому, чтобы за один «ход» модель отсекала точно неинтересные области и выделяла кандидатов, где вообще есть смысл что‑то детектировать.​ На маленьком датасете из 4 классов и 1256 изображений с частично шумной разметкой пилотный TAPe‑детектор с ≈115k параметров даёт 98.94% попаданий по объектам по прикладной метрике «центроид бокса в 32 пикселя от центра разметки», причём без аугментаций и с обучением на CPU.​ В роли baseline’а брали YOLO11s (линейка Ultralytics/YOLOv8‑s): на том же датасете она плохо сходилась, давала низкую детекцию и много ложных срабатываний. Впрочем, выводы пока делать рано.​ TAPe‑архитектура за несколько итераций ушла от громоздкого (для нас) dictionary‑подхода с 100k+ параметров к более компактной схеме без классического градиентного спуска: описания классов собираются из TAPe‑векторов и сжимаются через k‑means, а не обучаются как отдельная нейросеть.​ На подмножестве COCO (около 2% датасета, ~2400 изображений) эта же компактная модель без спецоптимизаций даёт 60.59% попаданий по центрам объектов — для такого размера детектора это неожиданно много и хороший аргумент в пользу того, что TAPe‑данные позволяют «маленьким» моделям сходиться там, где стандартные подходы ожидаемо захлёбываются. Очень интересно

    habr.com/ru/articles/1011406/

    #компьютерное_зрение #машинное_обучение #разметка_датасета #пилотный_проект #детекция_объектов #instance_segmentation #глубокое_обучение #yolo #TAPe_ML #нейросети

  17. Производство теряло деньги каждую смену. До внедрения видеоаналитики с ИИ никто не знал где

    Привет! На связи Олег Чебулаев, CEO Mad Brains. Хочу поделиться историей из практики — как обучить модель YOLO, запустить видеомониторинг на пищевом производстве и через неделю обнаружить кое-что, о чём на заводе предпочитали не говорить вслух.

    habr.com/ru/articles/1010108/

    #видеоаналитика #производство #пищевая_промышленность #промышленная_автоматизация #yolo #машинное_обучение #глубокое_обучение #computervision

  18. [Перевод] Путь к автономному машинному интеллекту

    Как машины могут учиться так же эффективно, как люди и животные? Как машины могут научиться рассуждать и планировать? Как машины могут изучать представления восприятий и планов действий на нескольких уровнях абстракции, что позволит им рассуждать, предсказывать и планировать на различных временных горизонтах? В этой позиционной статье предлагается архитектура и парадигмы обучения для построения автономных интеллектуальных агентов. Она объединяет такие концепции, как конфигурируемая предсказательная модель мира, поведение, движимое внутренней мотивацией, и иерархические архитектуры совместного вложения, обучаемые с помощью самоконтролируемого обучения. Этот документ не является технической или научной статьей в традиционном смысле, а представляет собой позиционную работу, выражающую мое видение пути к интеллектуальным машинам, которые учатся больше похожим на животных и людей образом, способны рассуждать и планировать, и чье поведение определяется внутренними целями, а не жестко запрограммированными инструкциями, внешним контролем или внешними вознаграждениями. Многие идеи, описанные в этой статье (почти все из них), были сформулированы многими авторами в различных контекстах и в различной форме. Настоящая работа не претендует на приоритет в какой-либо из них, но представляет собой предложение о том, как собрать их в единое целое. В частности, в работе выявляются предстоящие трудности. Также перечисляется ряд направлений, которые, вероятно, будут успешными или неуспешными. Текст написан с минимальным использованием жаргона и с использованием минимальных предварительных математических знаний, чтобы быть понятным читателям с самым разным образованием, включая нейробиологию, когнитивистику и философию, а также машинное обучение, робототехнику и другие инженерные дисциплины. Я надеюсь, что этот материал поможет лучше понять контекст некоторых исследований в области ИИ, чья значимость иногда неочевидна.

    habr.com/ru/articles/1005044/

    #Искусственный_интеллект #Машинный_здравый_смысл #Когнитивная_архитектура #Глубокое_обучение #Самоконтролируемое_обучение #Энергетическая_модель #Модели_мира #Архитектура_совместного_вложения #Внутренняя_мотивация

  19. [Перевод] Путь к автономному машинному интеллекту

    Как машины могут учиться так же эффективно, как люди и животные? Как машины могут научиться рассуждать и планировать? Как машины могут изучать представления восприятий и планов действий на нескольких уровнях абстракции, что позволит им рассуждать, предсказывать и планировать на различных временных горизонтах? В этой позиционной статье предлагается архитектура и парадигмы обучения для построения автономных интеллектуальных агентов. Она объединяет такие концепции, как конфигурируемая предсказательная модель мира, поведение, движимое внутренней мотивацией, и иерархические архитектуры совместного вложения, обучаемые с помощью самоконтролируемого обучения. Этот документ не является технической или научной статьей в традиционном смысле, а представляет собой позиционную работу, выражающую мое видение пути к интеллектуальным машинам, которые учатся больше похожим на животных и людей образом, способны рассуждать и планировать, и чье поведение определяется внутренними целями, а не жестко запрограммированными инструкциями, внешним контролем или внешними вознаграждениями. Многие идеи, описанные в этой статье (почти все из них), были сформулированы многими авторами в различных контекстах и в различной форме. Настоящая работа не претендует на приоритет в какой-либо из них, но представляет собой предложение о том, как собрать их в единое целое. В частности, в работе выявляются предстоящие трудности. Также перечисляется ряд направлений, которые, вероятно, будут успешными или неуспешными. Текст написан с минимальным использованием жаргона и с использованием минимальных предварительных математических знаний, чтобы быть понятным читателям с самым разным образованием, включая нейробиологию, когнитивистику и философию, а также машинное обучение, робототехнику и другие инженерные дисциплины. Я надеюсь, что этот материал поможет лучше понять контекст некоторых исследований в области ИИ, чья значимость иногда неочевидна.

    habr.com/ru/articles/1005044/

    #Искусственный_интеллект #Машинный_здравый_смысл #Когнитивная_архитектура #Глубокое_обучение #Самоконтролируемое_обучение #Энергетическая_модель #Модели_мира #Архитектура_совместного_вложения #Внутренняя_мотивация

  20. [Перевод] Путь к автономному машинному интеллекту

    Как машины могут учиться так же эффективно, как люди и животные? Как машины могут научиться рассуждать и планировать? Как машины могут изучать представления восприятий и планов действий на нескольких уровнях абстракции, что позволит им рассуждать, предсказывать и планировать на различных временных горизонтах? В этой позиционной статье предлагается архитектура и парадигмы обучения для построения автономных интеллектуальных агентов. Она объединяет такие концепции, как конфигурируемая предсказательная модель мира, поведение, движимое внутренней мотивацией, и иерархические архитектуры совместного вложения, обучаемые с помощью самоконтролируемого обучения. Этот документ не является технической или научной статьей в традиционном смысле, а представляет собой позиционную работу, выражающую мое видение пути к интеллектуальным машинам, которые учатся больше похожим на животных и людей образом, способны рассуждать и планировать, и чье поведение определяется внутренними целями, а не жестко запрограммированными инструкциями, внешним контролем или внешними вознаграждениями. Многие идеи, описанные в этой статье (почти все из них), были сформулированы многими авторами в различных контекстах и в различной форме. Настоящая работа не претендует на приоритет в какой-либо из них, но представляет собой предложение о том, как собрать их в единое целое. В частности, в работе выявляются предстоящие трудности. Также перечисляется ряд направлений, которые, вероятно, будут успешными или неуспешными. Текст написан с минимальным использованием жаргона и с использованием минимальных предварительных математических знаний, чтобы быть понятным читателям с самым разным образованием, включая нейробиологию, когнитивистику и философию, а также машинное обучение, робототехнику и другие инженерные дисциплины. Я надеюсь, что этот материал поможет лучше понять контекст некоторых исследований в области ИИ, чья значимость иногда неочевидна.

    habr.com/ru/articles/1005044/

    #Искусственный_интеллект #Машинный_здравый_смысл #Когнитивная_архитектура #Глубокое_обучение #Самоконтролируемое_обучение #Энергетическая_модель #Модели_мира #Архитектура_совместного_вложения #Внутренняя_мотивация

  21. [Перевод] Путь к автономному машинному интеллекту

    Как машины могут учиться так же эффективно, как люди и животные? Как машины могут научиться рассуждать и планировать? Как машины могут изучать представления восприятий и планов действий на нескольких уровнях абстракции, что позволит им рассуждать, предсказывать и планировать на различных временных горизонтах? В этой позиционной статье предлагается архитектура и парадигмы обучения для построения автономных интеллектуальных агентов. Она объединяет такие концепции, как конфигурируемая предсказательная модель мира, поведение, движимое внутренней мотивацией, и иерархические архитектуры совместного вложения, обучаемые с помощью самоконтролируемого обучения. Этот документ не является технической или научной статьей в традиционном смысле, а представляет собой позиционную работу, выражающую мое видение пути к интеллектуальным машинам, которые учатся больше похожим на животных и людей образом, способны рассуждать и планировать, и чье поведение определяется внутренними целями, а не жестко запрограммированными инструкциями, внешним контролем или внешними вознаграждениями. Многие идеи, описанные в этой статье (почти все из них), были сформулированы многими авторами в различных контекстах и в различной форме. Настоящая работа не претендует на приоритет в какой-либо из них, но представляет собой предложение о том, как собрать их в единое целое. В частности, в работе выявляются предстоящие трудности. Также перечисляется ряд направлений, которые, вероятно, будут успешными или неуспешными. Текст написан с минимальным использованием жаргона и с использованием минимальных предварительных математических знаний, чтобы быть понятным читателям с самым разным образованием, включая нейробиологию, когнитивистику и философию, а также машинное обучение, робототехнику и другие инженерные дисциплины. Я надеюсь, что этот материал поможет лучше понять контекст некоторых исследований в области ИИ, чья значимость иногда неочевидна.

    habr.com/ru/articles/1005044/

    #Искусственный_интеллект #Машинный_здравый_смысл #Когнитивная_архитектура #Глубокое_обучение #Самоконтролируемое_обучение #Энергетическая_модель #Модели_мира #Архитектура_совместного_вложения #Внутренняя_мотивация

  22. 45 000 лет на обучение Dota 2: Почему современный AI — это просто эффективная зубрежка

    OpenAI Five потратила 45 000 лет в симуляции, чтобы научиться играть в Dota 2. Это не интеллект, а просто зубрёжка. Почему скоро перестанет помогать простое масштабирование и какие современные архитектуры есть, которые в перспективе будут намного лучше трансформеров и других методов.

    habr.com/ru/articles/1004890/

    #ML #AI #Искусственный_интеллект #Машинное_обучение #Глубокое_обучение #Неэффективность #Тупость_AI

  23. Искусственный интеллект: 70 лет провалов, надежд и революций

    Статья без лишних эмоций о том, как развивался искусственный интеллект. Это попытка проследить паттерны в развитии ИИ, понять, почему прогнозы лидеров отрасли систематически не сбываются, и оценить, где мы находимся сегодня. В тексте акцент сделан на трёх составляющих - технических решениях, финансовых результатах и исторических взаимосвязях.

    habr.com/ru/articles/1001536/

    #искусственный_интеллект #история_ИИ #ИИзима #LLM #ChatGPT #трансформеры #глубокое_обучение #венчурные_инвестиции #AGI

  24. Искусственный интеллект: 70 лет провалов, надежд и революций

    Статья без лишних эмоций о том, как развивался искусственный интеллект. Это попытка проследить паттерны в развитии ИИ, понять, почему прогнозы лидеров отрасли систематически не сбываются, и оценить, где мы находимся сегодня. В тексте акцент сделан на трёх составляющих - технических решениях, финансовых результатах и исторических взаимосвязях.

    habr.com/ru/articles/1001536/

    #искусственный_интеллект #история_ИИ #ИИзима #LLM #ChatGPT #трансформеры #глубокое_обучение #венчурные_инвестиции #AGI

  25. Искусственный интеллект: 70 лет провалов, надежд и революций

    Статья без лишних эмоций о том, как развивался искусственный интеллект. Это попытка проследить паттерны в развитии ИИ, понять, почему прогнозы лидеров отрасли систематически не сбываются, и оценить, где мы находимся сегодня. В тексте акцент сделан на трёх составляющих - технических решениях, финансовых результатах и исторических взаимосвязях.

    habr.com/ru/articles/1001536/

    #искусственный_интеллект #история_ИИ #ИИзима #LLM #ChatGPT #трансформеры #глубокое_обучение #венчурные_инвестиции #AGI

  26. Искусственный интеллект: 70 лет провалов, надежд и революций

    Статья без лишних эмоций о том, как развивался искусственный интеллект. Это попытка проследить паттерны в развитии ИИ, понять, почему прогнозы лидеров отрасли систематически не сбываются, и оценить, где мы находимся сегодня. В тексте акцент сделан на трёх составляющих - технических решениях, финансовых результатах и исторических взаимосвязях.

    habr.com/ru/articles/1001536/

    #искусственный_интеллект #история_ИИ #ИИзима #LLM #ChatGPT #трансформеры #глубокое_обучение #венчурные_инвестиции #AGI

  27. PyTorch vs TensorFlow: что выбрать для deep learning в 2026 году

    Выбор фреймворка для глубокого обучения — это стратегическое решение, влияющее на скорость разработки, стоимость и масштабируемость. Правило «PyTorch — для исследований, TensorFlow — для продакшена» больше не работает. К 2026 году оба фреймворка активно заимствуют лучшее друг у друга: PyTorch наращивает промышленные возможности (TorchServe, ExecuTorch), а TensorFlow с Keras 3 становится гибче для исследований. Согласно опросу Stack Overflow Developer Survey 2024 , PyTorch (10,6%) и TensorFlow (10,1%) находились примерно на одной отметке по частоте использования у разработчиков, а в исследовательских и AI-first-компаниях уверенно лидирует PyTorch . Но есть нюансы. Разобраться в особенностях фреймворков →

    habr.com/ru/companies/netology

    #pytorch #tensorflow #глубокое_обучение #установка_окружения #MNIST #keras #тензоры #deep_learning #цикл_обучения #нейронные_сети

  28. PyTorch vs TensorFlow: что выбрать для deep learning в 2026 году

    Выбор фреймворка для глубокого обучения — это стратегическое решение, влияющее на скорость разработки, стоимость и масштабируемость. Правило «PyTorch — для исследований, TensorFlow — для продакшена» больше не работает. К 2026 году оба фреймворка активно заимствуют лучшее друг у друга: PyTorch наращивает промышленные возможности (TorchServe, ExecuTorch), а TensorFlow с Keras 3 становится гибче для исследований. Согласно опросу Stack Overflow Developer Survey 2024 , PyTorch (10,6%) и TensorFlow (10,1%) находились примерно на одной отметке по частоте использования у разработчиков, а в исследовательских и AI-first-компаниях уверенно лидирует PyTorch . Но есть нюансы. Разобраться в особенностях фреймворков →

    habr.com/ru/companies/netology

    #pytorch #tensorflow #глубокое_обучение #установка_окружения #MNIST #keras #тензоры #deep_learning #цикл_обучения #нейронные_сети

  29. PyTorch vs TensorFlow: что выбрать для deep learning в 2026 году

    Выбор фреймворка для глубокого обучения — это стратегическое решение, влияющее на скорость разработки, стоимость и масштабируемость. Правило «PyTorch — для исследований, TensorFlow — для продакшена» больше не работает. К 2026 году оба фреймворка активно заимствуют лучшее друг у друга: PyTorch наращивает промышленные возможности (TorchServe, ExecuTorch), а TensorFlow с Keras 3 становится гибче для исследований. Согласно опросу Stack Overflow Developer Survey 2024 , PyTorch (10,6%) и TensorFlow (10,1%) находились примерно на одной отметке по частоте использования у разработчиков, а в исследовательских и AI-first-компаниях уверенно лидирует PyTorch . Но есть нюансы. Разобраться в особенностях фреймворков →

    habr.com/ru/companies/netology

    #pytorch #tensorflow #глубокое_обучение #установка_окружения #MNIST #keras #тензоры #deep_learning #цикл_обучения #нейронные_сети

  30. PyTorch vs TensorFlow: что выбрать для deep learning в 2026 году

    Выбор фреймворка для глубокого обучения — это стратегическое решение, влияющее на скорость разработки, стоимость и масштабируемость. Правило «PyTorch — для исследований, TensorFlow — для продакшена» больше не работает. К 2026 году оба фреймворка активно заимствуют лучшее друг у друга: PyTorch наращивает промышленные возможности (TorchServe, ExecuTorch), а TensorFlow с Keras 3 становится гибче для исследований. Согласно опросу Stack Overflow Developer Survey 2024 , PyTorch (10,6%) и TensorFlow (10,1%) находились примерно на одной отметке по частоте использования у разработчиков, а в исследовательских и AI-first-компаниях уверенно лидирует PyTorch . Но есть нюансы. Разобраться в особенностях фреймворков →

    habr.com/ru/companies/netology

    #pytorch #tensorflow #глубокое_обучение #установка_окружения #MNIST #keras #тензоры #deep_learning #цикл_обучения #нейронные_сети

  31. [Перевод] Поговорим об основах машинного обучения

    Машинное обучение давно вышло за пределы модного термина, но за этим словосочетанием до сих пор скрывается путаница: где заканчивается «обычное» программирование, чем ML отличается от AI и почему одни задачи требуют размеченных данных, а другие — нет. В этой статье разбираем базовую логику машинного обучения без упрощений и мистики: какие подходы существуют, из каких элементов складывается модель и как всё это применяется на практике — от классических алгоритмов до нейросетей. Основы ML

    habr.com/ru/companies/otus/art

    #ml #ai #машинное_обучение #основы_ML #нейронные_сети #глубокое_обучение

  32. Топ вопросов с NLP собеседований: трансформеры и внимание до малейших деталей

    Архитектура трансформера и его сердце механизм внимания уже давно стали базой собесов на NLP, LLM и даже CV. В работе трансформеры тоже доминируют. Именно поэтому очень важно до деталей разбираться в том, как они устрены, из каких частей состоят, как работают и где применяются на практике. Разберем архитектуру по слоям с примерами кода и большим количеством картинок и схем.

    habr.com/ru/articles/972178/

    #transformers #attention #llms #natural_language_processing #nlp #нлп #механизм_внимания #трансформеры #глубокое_обучение #машинное_обучение

  33. Топ вопросов с NLP собеседований: трансформеры и внимание до малейших деталей

    Архитектура трансформера и его сердце механизм внимания уже давно стали базой собесов на NLP, LLM и даже CV. В работе трансформеры тоже доминируют. Именно поэтому очень важно до деталей разбираться в том, как они устрены, из каких частей состоят, как работают и где применяются на практике. Разберем архитектуру по слоям с примерами кода и большим количеством картинок и схем.

    habr.com/ru/articles/972178/

    #transformers #attention #llms #natural_language_processing #nlp #нлп #механизм_внимания #трансформеры #глубокое_обучение #машинное_обучение

  34. Топ вопросов с NLP собеседований: трансформеры и внимание до малейших деталей

    Архитектура трансформера и его сердце механизм внимания уже давно стали базой собесов на NLP, LLM и даже CV. В работе трансформеры тоже доминируют. Именно поэтому очень важно до деталей разбираться в том, как они устрены, из каких частей состоят, как работают и где применяются на практике. Разберем архитектуру по слоям с примерами кода и большим количеством картинок и схем.

    habr.com/ru/articles/972178/

    #transformers #attention #llms #natural_language_processing #nlp #нлп #механизм_внимания #трансформеры #глубокое_обучение #машинное_обучение

  35. Топ вопросов с NLP собеседований: трансформеры и внимание до малейших деталей

    Архитектура трансформера и его сердце механизм внимания уже давно стали базой собесов на NLP, LLM и даже CV. В работе трансформеры тоже доминируют. Именно поэтому очень важно до деталей разбираться в том, как они устрены, из каких частей состоят, как работают и где применяются на практике. Разберем архитектуру по слоям с примерами кода и большим количеством картинок и схем.

    habr.com/ru/articles/972178/

    #transformers #attention #llms #natural_language_processing #nlp #нлп #механизм_внимания #трансформеры #глубокое_обучение #машинное_обучение

  36. Реализуем компьютерное зрение на практике

    На тему компьютерного зрения есть множество различных публикаций, которые в основном рассказывают о применении этой технологии в разных отраслях. Однако, зачастую публикации содержат лишь общую информацию о том, что реализовано и для каких задач, но при этом отсутствует описание того, как это можно сделать. В нашей статье мы поговорим о том, как можно реализовать на Python навигационную систему на основе машинного зрения для автономных транспортных средств, проанализировать медицинские изображения и выполнить генерацию новых изображений из набора данных уже существующих.

    habr.com/ru/companies/otus/art

    #ai #computervision #ml #компьютерное_зрение #обработка_изображений #автономная_навигация #сегментация_изображений #генерация_изображений #нейронные_сети #глубокое_обучение

  37. Ученые выяснили, как стабилизируется обучение нейросетей при увеличении объема данных

    Исследователи из МФТИ впервые систематически изучили, как изменяется и стабилизируется процесс обучения нейронных сетей по мере добавления новых данных. Их работа, сочетающая теоретический анализ и обширные эксперименты, показывает, что так называемый «ландшафт функции потерь» нейросети сходится к определенной форме при увеличении размера выборки, что имеет важные последствия для понимания глубинного обучения и разработки методов определения необходимого объема данных. Исследование опубликовано в Doklady Mathematics.

    habr.com/ru/articles/961694/

    #ландшафт_функции_потерь #глобальная_оптимизация #матрица_Гессе #классификация_изображений #глубокое_обучение

  38. Книга: «Математика и архитектура глубокого обучения»

    Привет, Хаброжители! Узнайте, что происходит внутри черного ящика! Для использования глубокого обучения вам придется подготовить данные, выбрать правильную модель, обучить ее, оценить качество и точность и предусмотреть обработку неопределенности и изменчивости в выходных данных развернутого решения. Эта книга шаг за шагом знакомит с основными математическими концепциями, которые пригодятся вам как специалисту по данным, – с векторным исчислением, линейной алгеброй и байесовским выводом, представляя их с точки зрения глубокого обучения.

    habr.com/ru/companies/piter/ar

    #книга #глубокое_обучение #проектирование_и_рефакторинг

  39. Как выбрать облачный GPU-инстанс для развертывания ИИ-моделей: практическое руководство

    Развертывание ИИ-моделей в облаке — стандартная задача для современных специалистов по машинному обучению. Но выбор подходящего инстанса GPU часто превращается в «лотерею»: переплата за избыточные ресурсы или, наоборот, «торможение» из-за недостаточной мощности. В этой статье мы расскажем, как не ошибиться с выбором облачного GPU, сохранив баланс между производительностью и бюджетом. Акцент сделаем на реальных кейсах — от обучения нейросетей до инференса в продакшене.

    habr.com/ru/articles/948052/

    #облачные_вычисления #машинное_обучение #глубокое_обучение #nvidia #cuda #нейросети #обучение_нейросетей #aws_ec2

  40. Мир после GPT-5: как одна презентация обрушила веру в технологическое чудо

    Презентация GPT-5, ожидавшаяся как революция, обернулась разочарованием. Это событие вызвало споры о пределах возможностей LLM. В статье анализируется, почему технология, названная Ноамом Хомским «Т9 на стероидах», пока не способна на научные открытия. Что ждет индустрию дальше? Рассматриваются технические барьеры, гонка за вычислительными мощностями и фундаментальные вопросы о будущем ИИ. Создаем ли мы помощника или цифрового бога в надежде решить все проблемы человечества.

    habr.com/ru/articles/944124/

    #искусственный_интеллект #машинное_обучение #chatgpt #нейросети #llm #openai #gpt5 #глубокое_обучение

  41. Вебинары трека Наука о данных Летней цифровой школы Сбера

    Привет, коллеги ML инженеры, Data scientist'ы и все, кто интересуется искусственным интеллектом, созданием нейросетей, машинным обучением и анализом данных! Принёс вам пачку вебинаров с интенсива трека Наука о данных курсов повышения квалификации Летней цифровой школы Сбера.

    habr.com/ru/articles/935564/

    #машинное_обучениe #искусственный_интеллект #data_science #data_analysis #ai #artificial_intelligence #ии #нейросети #нейронные_сети #глубокое_обучение

  42. Галлюцинации и многообразия. Зачем искусственному интеллекту многомерные миры

    Сейчас на Хабре много пишут о галлюцинировании нейронных сетей и больших языковых моделей в частности. Хорошим введением в эту тему, написанным с философских позиций, мне представляется текст уважаемого Дэна Рычковского @DZRobo « Когда ИИ закрывает глаза: путешествие между воображением и галлюцинациями ». Базовое техническое погружение в тему вы найдёте в статье уважаемой @toppal « Причины возникновения галлюцинаций LLM », это перевод академической статьи специалистов Харбинского технологического института, опубликованной в конце 2024 года. Действительно, в большинстве источников галлюцинации ИИ рассматривают либо в негативном ключе, либо как неизбежный побочный эффект, связанный с попытками «вшить» синтетический аналог воображения в вычислительную сеть. Я же хочу остановиться на менее известном аспекте работы нейронок, в котором галлюцинации могут восприниматься как положительная и даже необходимая часть работы алгоритма. Речь пойдёт об искусственном повышении размерности данных, подаваемых на вход в нейросеть, и о том, к чему такая практика может приводить. Наиболее известное проявление такого эффекта известно в англоязычных источниках под названием « проклятие размерности » (curse of dimensionality).

    habr.com/ru/articles/929134/

    #биоинформатика #искусственный_интеллект #галлюцинации #многообразия #глубокое_обучение

  43. «Скайнет» наоборот: как вырастить и обучить ИИ с помощью Дарвин-Гёдель машины для улучшения человеческой демографии

    Разрабатываем и растим «цифрового губера» - консультанта по вопросам государственного политического управления, демографии и миграции. Решаем задачу оптимизации экономики и миграционной политики для устойчивого демографического роста в 89 регионах с помощью взаимодействующих друг с другом и обменивающихся опытом ИИ-агентов , на основе мутаций, скрещивания и эволюции. Мультиагентное обучение, Multi-Agent Deep Deterministic Policy Gradient и Darwin Gödel Machine .

    habr.com/ru/articles/921774/

    #agi #reinforcementlearning #MADDPG #ДарвинГёдель_машина #обучение_с_подкреплением #мультиагентные_системы #глубокое_обучение #демография #миграция #искуственный_интеллект

  44. Это камень? Это ветка? Это нос! Разбираем подходы, помогающие ИИ распознавать лица на картинках с низким разрешением

    Привет, Хабр! Мы – Даниил Соловьев и Михаил Никитин из команды направления распознавания лиц. Сегодня фокусируемся на задаче распознавания лиц на изображениях низкого разрешения (low resolution face recognition, low-res FR). Она актуальна в первую очередь при анализе данных видеонаблюдения, так что если перед вами сейчас стоит подобная задача (или просто интересно, как она решается) — статья для вас. Расскажем про проблемы и сложности распознавания лиц низкого разрешения, подходы к решению задачи, в том числе свежий PETALface с конференции WACV 2025 . Также поделимся ссылками на исследования, которые подробнее освещают каждый подход.

    habr.com/ru/companies/tevian/a

    #низкое_качество #низкое_разрешение #распознавание_лиц #глубокое_обучение #компьютерное_зрение #машинное_обучение #обработка_изображений #deep_learning #computer_vision #face_recognition

  45. Это камень? Это ветка? Это нос! Разбираем подходы, помогающие ИИ распознавать лица на картинках с низким разрешением

    Привет, Хабр! Мы – Даниил Соловьев и Михаил Никитин из команды направления распознавания лиц. Сегодня фокусируемся на задаче распознавания лиц на изображениях низкого разрешения (low resolution face recognition, low-res FR). Она актуальна в первую очередь при анализе данных видеонаблюдения, так что если перед вами сейчас стоит подобная задача (или просто интересно, как она решается) — статья для вас. Расскажем про проблемы и сложности распознавания лиц низкого разрешения, подходы к решению задачи, в том числе свежий PETALface с конференции WACV 2025 . Также поделимся ссылками на исследования, которые подробнее освещают каждый подход.

    habr.com/ru/companies/tevian/a

    #низкое_качество #низкое_разрешение #распознавание_лиц #глубокое_обучение #компьютерное_зрение #машинное_обучение #обработка_изображений #deep_learning #computer_vision #face_recognition

  46. Это камень? Это ветка? Это нос! Разбираем подходы, помогающие ИИ распознавать лица на картинках с низким разрешением

    Привет, Хабр! Мы – Даниил Соловьев и Михаил Никитин из команды направления распознавания лиц. Сегодня фокусируемся на задаче распознавания лиц на изображениях низкого разрешения (low resolution face recognition, low-res FR). Она актуальна в первую очередь при анализе данных видеонаблюдения, так что если перед вами сейчас стоит подобная задача (или просто интересно, как она решается) — статья для вас. Расскажем про проблемы и сложности распознавания лиц низкого разрешения, подходы к решению задачи, в том числе свежий PETALface с конференции WACV 2025 . Также поделимся ссылками на исследования, которые подробнее освещают каждый подход.

    habr.com/ru/companies/tevian/a

    #низкое_качество #низкое_разрешение #распознавание_лиц #глубокое_обучение #компьютерное_зрение #машинное_обучение #обработка_изображений #deep_learning #computer_vision #face_recognition

  47. Это камень? Это ветка? Это нос! Разбираем подходы, помогающие ИИ распознавать лица на картинках с низким разрешением

    Привет, Хабр! Мы – Даниил Соловьев и Михаил Никитин из команды направления распознавания лиц. Сегодня фокусируемся на задаче распознавания лиц на изображениях низкого разрешения (low resolution face recognition, low-res FR). Она актуальна в первую очередь при анализе данных видеонаблюдения, так что если перед вами сейчас стоит подобная задача (или просто интересно, как она решается) — статья для вас. Расскажем про проблемы и сложности распознавания лиц низкого разрешения, подходы к решению задачи, в том числе свежий PETALface с конференции WACV 2025 . Также поделимся ссылками на исследования, которые подробнее освещают каждый подход.

    habr.com/ru/companies/tevian/a

    #низкое_качество #низкое_разрешение #распознавание_лиц #глубокое_обучение #компьютерное_зрение #машинное_обучение #обработка_изображений #deep_learning #computer_vision #face_recognition

  48. HandReader и Znaki — лучшая архитектура и самый большой набор данных для распознавания русского дактиля

    Всем привет! Ранее мы уже писали о нашем наборе данных Bukva — первом наборе данных для распознавания русского дактильного языка в изоляции, который содержит более 3 700 видеороликов, разделённых на 33 класса, каждый из которых соответствует одной букве русского алфавита. Эта статья посвящена распознаванию непрерывного дактильного языка. Мы расскажем о наших моделях, которые добиваются наилучших результатов на наборах данных непрерывного американского дактильного языка ChicagoFSWild и ChicagoFSWild+ , а также о нашем новом наборе данных Znaki — первом открытом наборе данных непрерывного русского дактильного языка, содержащем более 37 000 видео.

    habr.com/ru/companies/sberbank

    #распознавание_изображений #машинное+обучение #глубокое_обучение #жестовый_язык

  49. Агенты. Деньги. Бизнес и Работа

    По материалам Fast Company, Venture Beat, CIO, NY Times, New Scientist, Wired, McKinsey и других ресурсов. Минимум булшита, максимум инсайтов. Решается судьба будущего интернета: станет ли он открытым пространством для всех или превратится в сеть закрытых экосистем, контролируемых Big Tech... ChatGPT на пике растет со скоростью 1 000 000 пользователей за пару часов...

    habr.com/ru/articles/917796/

    #ииассистент #ииагенты #искусственный_интеллект #будущее #агентная_экономика #дайджест #глубокое_обучение #информационная_безопасность #криптография #интересное

  50. Как устроено глубокое обучение нейросетей

    Глубокое обучение - Способ обучения моделей на большом количестве данных, используя множество слоёв. Каждый слой сети обрабатывает информацию, "взвешивая" её при помощи параметров ( весов и смещений ), оставляя признаки или отбрасывая, посредством функций активации. Обучение происходит через итеративную ( повторяющуюся ) корректировку весов: сначала вычисляются градиенты ошибки с помощью обратного распространения ( backpropagation ), а затем веса обновляются при помощи оптимизаторов ( SGD, Adam и др. ). Эта статья не ответит на все вопросы, но мы пробежимся по всем основам глубокого машинного обучения, что бы создать примерную начальную картину без сильного углубления в детали.

    habr.com/ru/articles/918188/

    #искусственный_интеллект #ии #глубокое_обучение #машинное_обучение #ai #роботы