Управление безопасностью в рое: новый подход к многоагентным системам

В исследовании демонстрируется, что применение стратегии MF-CBF эффективно ограничивает проникновение агентов в опасные зоны, что подтверждается анализом временной динамики доли агентов, оказывающихся в этих зонах в ходе 50 симуляций, а также сравнением начальной и финальной пространственной конфигурации популяции.

В статье представлен метод обеспечения безопасности больших групп агентов, использующий концепцию управления плотностью для предотвращения столкновений и нарушений ограничений.

Оптимальный Выбор в Неопределенности: Новый Алгоритм для Обучения с Подкреплением

Исследователи разработали универсальный алгоритм, который эффективно определяет оптимальную стратегию выбора в условиях как случайных, так и непредсказуемых предпочтений пользователей.

Неопределенность на рынках: как страховые компании адаптируются к рискам

Статистическая калибровка радиуса неоднозначности демонстрирует зависимость от корреляции опорных данных, позволяя оценить и оптимизировать точность определения местоположения в условиях неопределенности.

Новое исследование показывает, как неуверенность в корреляции между страховыми и финансовыми рисками влияет на ценообразование, андеррайтинг и инвестиционные стратегии страховщиков.

Искусственный интеллект за столом: проверка алгоритмов обучения на примере Блэкджека

Полицейский градиент (REINFORCE) продемонстрировал быстрое улучшение ожидаемой выгоды (EV) по мере увеличения числа сыгранных раздач, став единственным оптимизатором, преодолевшим пороги сближения в 95% и 99% относительно оптимальной EV, равной [-0.00161, 0.00161].

Новое исследование строго оценивает эффективность алгоритмов обучения с подкреплением в упрощенной среде Блэкджека, выявляя ограничения существующих подходов к оптимальной стратегии.