home.social

#trpo — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #trpo, aggregated by home.social.

  1. Продвинутые RL алгоритмы: Normal Policy, TRPO, PPO

    Большой конспект по продвинутым RL алгоритмам: TRPO и PPO. Автор слегка упоролся в формулах, но это из любви к прозрачности алгоритмов.

    habr.com/ru/articles/991622/

    #Policy_gradient_methods #ActorCritic #reinforcementlearning #ppo #trpo