Ошибка дискретизации: от обучения с подкреплением к непрерывному управлению
Новое исследование строго анализирует погрешность, возникающую при приближении задач оптимального управления в непрерывном времени с помощью дискретных алгоритмов обучения с подкреплением.


