Оптимальное приближение случайных величин: роль лог-вогнутых распределений

Новое исследование показывает, как свойства лог-вогнутых и слабо-симметричных распределений позволяют точно определить порог для двухшагового приближения случайных величин при измерении рисков.

Цена децентрализации: Управление сложными системами с помощью обучения с подкреплением

В многокомпонентных системах совместное пространство состояний, действий и наблюдений экспоненциально увеличивается с ростом числа компонентов, что делает подходы, основанные на одном агенте, непрактичными; децентрализованные частично наблюдаемые марковские процессы принятия решений (Dec-POMDP) решают эту проблему размерности, децентрализуя управление и часто используя методы многоагентного обучения с подкреплением, при этом, в отличие от централизованных подходов, используемых в обучении с одним агентом, многоагентные методы, такие как CTDE, допускают обмен информацией между агентами в процессе обучения, но требуют от них самостоятельного выполнения действий при эксплуатации.

Новое исследование показывает, как распределенное обучение агентов влияет на надежность инфраструктурных систем и где кроются компромиссы между масштабируемостью и оптимальностью.