#reinforecement_learning — Public Fediverse posts on home.social

Habr @[email protected] · 2025-12-31 · 10:32 UTC

[AI ⊂ TM] Машина Тьюринга и искусственный интеллект

Почему машина Тьюринга ( TM ) сегодня в теме про искусственный интеллект ( AI ) ? Ведь AI сегодня это все больше про машинное обучение ( ML ), искусственные нейронные сети ( ANN ), LLM, вычисления на CUDA и т. п. Причина в том, что никакой AI, с точки зрения математики, не превосходит по возможностям TM.

https://habr.com/ru/articles/982124/

#Turing_machine #машина_тьюринга #генетическое_программирование #генетические_алгоритмы #qlearning #reinforcementlearning #reinforecement_learning #нейронная_сеть #neural_network

#neural_network #нейронная_сеть #reinforecement_learning #reinforcementlearning #qlearning #генетические_алгоритмы

Habr @[email protected] · 2025-11-19 · 23:02 UTC

Reinforcement Learning: Model-free & Deep RL

Продолжаю погружаться в Reinforcement Learning. Здесь продолжение статьи Intro Reinforcement Learning . Если предыдущая часть помогла вам понять, что такое среда, агент, награды и функции ценности, то здесь мы сделаем шаг дальше: мы переходим к model-free алгоритмам и Deep Reinforcement Learning , где агент учится оптимальной стратегии, не имея прямого доступа к модели среды.

https://habr.com/ru/articles/956890/

#Modelfree_RL #dql #sarsa #qlearning #rl #reinforcementlearning #reinforecement_learning #bellman_equation

#modelfree_rl #dql #sarsa #qlearning #rl #reinforcementlearning

Habr @[email protected] · 2024-04-12 · 07:12 UTC

Российские роботы выполняют задачи на естественном языке. Зимний ROS Meetup 2024 — как это было и как это будет?

Всем привет! Сегодня мы отправимся в прошлое и вспомним, как проходил зимний ROS Meetup 3 февраля 2024 года: какие темы по LLM , Deep Learning и антропоморфным роботам были раскрыты и что нас ждет дальше?

https://habr.com/ru/companies/sberbank/articles/807119/

#робототехника #ros #robot_operating_system #deep_learning #reinforecement_learning #machine_learning #искусственный_интеллект #программирование #python #с++

#с #python #программирование #искусственный_интеллект #machine_learning #reinforecement_learning