Обучение с подкреплением для опционного хеджирования: новый подход к управлению рисками

В статье представлено применение методов обучения с подкреплением для оптимизации стратегий опционного хеджирования с учетом транзакционных издержек и минимизации риска убытков.


![Сходимость стохастического метода управления при оптимизации функции Xin-She Yang 4 демонстрирует линейную зависимость между ошибкой и [latex] -\varepsilon\ln(\varepsilon) [/latex], что подтверждается меньшей среднеквадратичной ошибкой (RMSE) и согласуется с теоретической скоростью сходимости, установленной в теореме 2.6.](https://arxiv.org/html/2601.01248v1/VF_1DXSY4_Eps_rate.png)