Интеллектуальное управление портфелем: новый подход к оптимизации инвестиций

Исследование предлагает инновационную систему оптимизации инвестиционных портфелей, способную адаптироваться к меняющимся рыночным условиям и ограниченности данных.

Исследование предлагает инновационную систему оптимизации инвестиционных портфелей, способную адаптироваться к меняющимся рыночным условиям и ограниченности данных.
Новая платформа оптимизации на основе байесовских методов позволяет эффективно исследовать пространство последовательностей антител, находя оптимальный баланс между различными характеристиками.
![Траектория метода БПМ при [latex] t=2\pi [/latex], стартующая из точки [latex] x_0 = 20 [/latex], демонстрирует поведение функции [latex] f(x) = |x| + 10\sin(x) [/latex], что иллюстрирует динамику исследуемой системы (пример 1).](https://arxiv.org/html/2604.13483v1/nonconv.png)
В статье представлен инновационный метод, позволяющий находить глобальные решения в задачах невыпуклой оптимизации, преодолевая ограничения традиционных подходов.
В статье представлен инновационный метод оптимизации, позволяющий эффективно решать сложные задачи в условиях многоступенчатой неопределенности и рисков.
![Обучение с использованием TPO приводит к самозатуханию градиента, что выражается в снижении норм L2 градиентов в процессе тренировки, тогда как в GRPO градиент сохраняет свою силу (H=8H{=}8, V=2V{=}2, K=32K{=}32), при этом успешные кандидаты в TPO демонстрируют меньшую целевую массу [latex]q_i[/latex], в то время как в GRPO - меньшую норму весов [latex]|A_i||A|_i[/latex].](https://arxiv.org/html/2604.06159v1/x10.png)
В статье представлена методика Target Policy Optimization, позволяющая эффективно обучать агентов в условиях редкого вознаграждения и при использовании больших языковых моделей.