Управление рисками в обучении с подкреплением: новый подход к CVaR

В статье представлена инновационная методика перераспределения наград для обучения с подкреплением, позволяющая эффективно управлять рисками и обеспечивать стабильность в условиях неопределенности.

Неизвестность в решениях: динамическое программирование и оценка рисков

Новое исследование объединяет методы динамического программирования для работы с неопределенностью в задачах принятия решений, показывая ограничения на применимость различных мер риска.