Наука — Страница 79

Обучение без примеров: новый подход к универсальному управлению

09.02.2026 от Денис Аветисян

Предлагается алгоритм Soft FB - модификация алгоритма Forward-Backward, решающая задачи обучения с максимальной энтропией, позволяющая получить более широкий спектр стохастических стратегий и оптимизировать общую полезность на этапе тестирования.

Исследователи предлагают алгоритм, позволяющий агентам осваивать новые задачи без предварительного обучения, используя гибкое представление о возможных стратегиях.

Оптимизация обменов: Новый подход к минимизации сожалений

09.02.2026 от Денис Аветисян

Исследователи разработали алгоритм, позволяющий эффективно снижать потери при принятии решений в динамических системах, основанный на анализе восприимчивости к изменениям.

Искусственный интеллект настраивает правила игры

09.02.2026 от Денис Аветисян

Многоагентные большие языковые модели, используя исключительно свод правил и параметризованные наборы правил, способны к самообучению в асимметричных стратегических играх и других системах, управляемых правилами, автоматически оптимизируя их производительность.

Новая система RuleSmith использует возможности больших языковых моделей для автоматической балансировки асимметричных стратегий, открывая новые горизонты в дизайне игровых правил.

Обучение с подкреплением без данных: новый подход к дискретным действиям

09.02.2026 от Денис Аветисян

Изучение многоцелевой оптимизации демонстрирует, что обученная дискретная динамическая система способна поддерживать множественные режимы поведения, избегая ловушечных состояний даже при сбалансированных предпочтениях ω, и обеспечивая контролируемый переход между режимами в зависимости от вектора предпочтений ω, что свидетельствует о её способности к адаптивному управлению и устойчивости.

Исследователи предлагают инновационную методику для обучения агентов в задачах с дискретными действиями, используя данные, собранные ранее, без необходимости интерактивного взаимодействия со средой.

Предсказание в условиях манипуляций: новый подход к устойчивости моделей

09.02.2026 от Денис Аветисян

В статье представлен инновационный метод прогнозирования, обеспечивающий стабильность и надежность моделей в динамичных средах, подверженных стратегическим манипуляциям со стороны участников.