Динамическая оптимизация: обучение с подкреплением для поиска оптимальных стратегий

Исследование предлагает автоматизированный подбор операторов для алгоритмов многокритериальной оптимизации на основе глубокого обучения с подкреплением, где агент DDPG, состоящий из сети актора и сети критика, анализирует характеристики текущей популяции [latex] \text{States} [/latex] и рекомендует оптимальную схему набора операторов [latex] \text{Action} [/latex], позволяя динамически адаптировать процесс оптимизации к изменяющимся условиям.

Новый подход использует глубокое обучение с подкреплением для автоматического выбора набора операторов, улучшая эффективность решения многокритериальных задач с ограничениями.

За горизонтом точности: оптимизация прогнозирования для эффективной цепочки поставок

Новое исследование показывает, как современные методы прогнозирования позволяют существенно снизить издержки и повысить уровень обслуживания в многоуровневых системах снабжения.

Баланс интересов: Моделирование ликвидности в DeFi с помощью теории игр

Новое исследование применяет инструменты теории средних игровых полей для анализа поведения участников децентрализованных ликвидных пулов, учитывая транзакционные издержки.

Динамика рисков на финансовых рынках: новый взгляд на анализ временных рядов

Оценка условного среднего, квантилей, волатильности и риска во времени демонстрирует динамику изменений этих показателей, раскрывая их взаимосвязь и позволяя выявить закономерности, определяющие поведение системы.

Исследование предлагает единый непараметрический подход к изучению многомерных временных рядов, позволяющий оценивать влияние геополитических рисков на поведение финансовых активов.