Ошибка дискретизации: от обучения с подкреплением к непрерывному управлению
Новое исследование углубленно анализирует погрешности, возникающие при использовании дискретных алгоритмов обучения с подкреплением для решения задач непрерывного стохастического оптимального управления.


