Оптимальная остановка: новый подход к ценообразованию американских опционов

Исследование предлагает инновационный алгоритм, основанный на энтропийной регуляризации и обучении с подкреплением, для эффективного решения задач стохастического управления и ценообразования производных финансовых инструментов.

Координация через диффузию: Новый подход к обучению взаимодействующих агентов

Алгоритм OMAD демонстрирует стабильное и скоординированное поведение агентов в четырех различных задачах MAMuJoCo, о чем свидетельствуют последовательные снимки их состояний в моменты времени [latex]t \in \{1, 100, 250, 500\}[/latex] и мгновенная скорость, подтверждающие эффективность подхода.

Исследователи предлагают инновационный метод обучения нескольких агентов, основанный на диффузионных моделях, позволяющий добиться эффективной координации в сложных задачах.