Укрощение Немарковских Процессов: Адаптивное Обучение для Оптимального Управления
![В исследовании изучалась зависимость эмпирической дисперсии прибыли и убытков [latex]VarP\&L[/latex] от уровня дискретизации в модели Rough SV с математическим ожиданием [latex]\mathbb{E}[V\_{T}]=0.2[/latex] при периоде обучения [latex]r\_{\text{train}}=0.5[/latex], что позволило выявить влияние численной реализации на оценку рисков.](https://arxiv.org/html/2604.13147v1/x2.png)
Новый подход к динамическому программированию, основанный на адаптивном обучении и важностной выборке, позволяет эффективно решать задачи оптимального управления в условиях немарковских динамик и шероховатой волатильности.
![Исследование демонстрирует эффективность метода STR-P в задаче подгонки к ортогональному подпространству при синтетических данных с выбросами ([latex]d=100[/latex], [latex]k=5[/latex], [latex]n=500[/latex]), превосходя аналогичные подходы, такие как спроецированный стохастический градиентный спуск, римановский градиентный спуск и стохастическая расширенная лагранжева функция.](https://arxiv.org/html/2604.14017v1/images/PCA.jpg)

![Наблюдается эволюция целевой функции [latex]f(\theta(t))[/latex] и нормы состояния [latex]\|\theta(t)\|[/latex] во времени, представленная в логарифмическом масштабе для функции (32), что демонстрирует динамику оптимизационного процесса и изменения в пространстве параметров.](https://arxiv.org/html/2604.12751v1/x4.png)