home.social

#reinforecement_learning — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #reinforecement_learning, aggregated by home.social.

  1. [AI ⊂ TM] Машина Тьюринга и искусственный интеллект

    Почему машина Тьюринга ( TM ) сегодня в теме про искусственный интеллект ( AI ) ? Ведь AI сегодня это все больше про машинное обучение ( ML ), искусственные нейронные сети ( ANN ), LLM, вычисления на CUDA и т. п. Причина в том, что никакой AI, с точки зрения математики, не превосходит по возможностям TM.

    habr.com/ru/articles/982124/

    #Turing_machine #машина_тьюринга #генетическое_программирование #генетические_алгоритмы #qlearning #reinforcementlearning #reinforecement_learning #нейронная_сеть #neural_network

  2. Reinforcement Learning: Model-free & Deep RL

    Продолжаю погружаться в Reinforcement Learning. Здесь продолжение статьи Intro Reinforcement Learning . Если предыдущая часть помогла вам понять, что такое среда, агент, награды и функции ценности, то здесь мы сделаем шаг дальше: мы переходим к model-free алгоритмам и Deep Reinforcement Learning , где агент учится оптимальной стратегии, не имея прямого доступа к модели среды.

    habr.com/ru/articles/956890/

    #Modelfree_RL #dql #sarsa #qlearning #rl #reinforcementlearning #reinforecement_learning #bellman_equation

  3. Российские роботы выполняют задачи на естественном языке. Зимний ROS Meetup 2024 — как это было и как это будет?

    Всем привет! Сегодня мы отправимся в прошлое и вспомним, как проходил зимний ROS Meetup 3 февраля 2024 года: какие темы по LLM , Deep Learning и антропоморфным роботам были раскрыты и что нас ждет дальше?

    habr.com/ru/companies/sberbank

    #робототехника #ros #robot_operating_system #deep_learning #reinforecement_learning #machine_learning #искусственный_интеллект #программирование #python #с++