Управление безопасностью в рое: новый подход к многоагентным системам

В статье представлен метод обеспечения безопасности больших групп агентов, использующий концепцию управления плотностью для предотвращения столкновений и нарушений ограничений.

В статье представлен метод обеспечения безопасности больших групп агентов, использующий концепцию управления плотностью для предотвращения столкновений и нарушений ограничений.
Исследователи разработали универсальный алгоритм, который эффективно определяет оптимальную стратегию выбора в условиях как случайных, так и непредсказуемых предпочтений пользователей.

Новое исследование показывает, как неуверенность в корреляции между страховыми и финансовыми рисками влияет на ценообразование, андеррайтинг и инвестиционные стратегии страховщиков.

Новый подход к непараметрической регрессии позволяет эффективно работать с данными высокой размерности, используя методы снижения размерности.
![Полицейский градиент (REINFORCE) продемонстрировал быстрое улучшение ожидаемой выгоды (EV) по мере увеличения числа сыгранных раздач, став единственным оптимизатором, преодолевшим пороги сближения в 95% и 99% относительно оптимальной EV, равной [-0.00161, 0.00161].](https://arxiv.org/html/2603.18642v1/convergence.png)
Новое исследование строго оценивает эффективность алгоритмов обучения с подкреплением в упрощенной среде Блэкджека, выявляя ограничения существующих подходов к оптимальной стратегии.