Политики с энтропией: Новый подход к обучению с подкреплением

Исследователи предложили инновационный метод, позволяющий создавать более стабильные и предсказуемые стратегии обучения с подкреплением за счет регуляризации кинетической энергией.

Обучение агентов в риске: новая стратегия для многоагентного обучения с подкреплением

Исследователи предлагают оригинальный подход к обучению нескольких агентов, учитывающий фактор риска, и доказывают сходимость разработанного алгоритма к стабильным решениям.

В поисках оптимального баланса: удача множества вариантов в многокритериальных задачах

Новое исследование показывает, что наличие нескольких перспективных решений может упростить процесс принятия решений в сложных задачах, где необходимо учитывать несколько целей одновременно.