Наука — Страница 56

Управление безопасностью в рое: новый подход к многоагентным системам

20.03.2026 от Денис Аветисян

В исследовании демонстрируется, что применение стратегии MF-CBF эффективно ограничивает проникновение агентов в опасные зоны, что подтверждается анализом временной динамики доли агентов, оказывающихся в этих зонах в ходе 50 симуляций, а также сравнением начальной и финальной пространственной конфигурации популяции.

В статье представлен метод обеспечения безопасности больших групп агентов, использующий концепцию управления плотностью для предотвращения столкновений и нарушений ограничений.

Оптимальный Выбор в Неопределенности: Новый Алгоритм для Обучения с Подкреплением

20.03.2026 от Денис Аветисян

Исследователи разработали универсальный алгоритм, который эффективно определяет оптимальную стратегию выбора в условиях как случайных, так и непредсказуемых предпочтений пользователей.

Неопределенность на рынках: как страховые компании адаптируются к рискам

20.03.2026 от Денис Аветисян

Статистическая калибровка радиуса неоднозначности демонстрирует зависимость от корреляции опорных данных, позволяя оценить и оптимизировать точность определения местоположения в условиях неопределенности.

Новое исследование показывает, как неуверенность в корреляции между страховыми и финансовыми рисками влияет на ценообразование, андеррайтинг и инвестиционные стратегии страховщиков.

Адаптивная оценка в мире больших данных

20.03.2026 от Денис Аветисян

Оценка влияния параметров регуляризации на подгонку модели демонстрирует, что выбор оптимального значения λ определяется точкой пересечения кривой эмпирической средней кривой эффективного влияния (EIC) с порогом τ, установленным для предотвращения недосглаживания и обеспечения стабильности оценки.

Новый подход к непараметрической регрессии позволяет эффективно работать с данными высокой размерности, используя методы снижения размерности.

Искусственный интеллект за столом: проверка алгоритмов обучения на примере Блэкджека

20.03.2026 от Денис Аветисян

Полицейский градиент (REINFORCE) продемонстрировал быстрое улучшение ожидаемой выгоды (EV) по мере увеличения числа сыгранных раздач, став единственным оптимизатором, преодолевшим пороги сближения в 95% и 99% относительно оптимальной EV, равной [-0.00161, 0.00161].

Новое исследование строго оценивает эффективность алгоритмов обучения с подкреплением в упрощенной среде Блэкджека, выявляя ограничения существующих подходов к оптимальной стратегии.