Наука — Страница 160

Искусственный интеллект настраивает правила игры

09.02.2026 от Денис Аветисян

Многоагентные большие языковые модели, используя исключительно свод правил и параметризованные наборы правил, способны к самообучению в асимметричных стратегических играх и других системах, управляемых правилами, автоматически оптимизируя их производительность.

Новая система RuleSmith использует возможности больших языковых моделей для автоматической балансировки асимметричных стратегий, открывая новые горизонты в дизайне игровых правил.

Обучение с подкреплением без данных: новый подход к дискретным действиям

09.02.2026 от Денис Аветисян

Изучение многоцелевой оптимизации демонстрирует, что обученная дискретная динамическая система способна поддерживать множественные режимы поведения, избегая ловушечных состояний даже при сбалансированных предпочтениях ω, и обеспечивая контролируемый переход между режимами в зависимости от вектора предпочтений ω, что свидетельствует о её способности к адаптивному управлению и устойчивости.

Исследователи предлагают инновационную методику для обучения агентов в задачах с дискретными действиями, используя данные, собранные ранее, без необходимости интерактивного взаимодействия со средой.

Предсказание в условиях манипуляций: новый подход к устойчивости моделей

09.02.2026 от Денис Аветисян

В статье представлен инновационный метод прогнозирования, обеспечивающий стабильность и надежность моделей в динамичных средах, подверженных стратегическим манипуляциям со стороны участников.

Игры разума с искусственным интеллектом: как направить поведение языковых моделей

09.02.2026 от Денис Аветисян

$В рамках анализа равновесий Нэша для больших языковых моделей установлено, что при определенных соотношениях гиперпараметров, определяющих стимулы - [latex]\beta^{(A)}[/latex], [latex]\beta^{(I)}[/latex] и [latex]\beta^{(D)}[/latex] - возможно достижение равновесия, в котором вес подгруппы населения, определяющий ее влияние, стремится к нулю, что свидетельствует о потенциальном политическом исключении, однако данное явление ограничено дискретными областями в пространстве гиперпараметров и не влияет на общую математическую корректность модели при прочих равных.$

Новое исследование предлагает использовать принципы теории игр для управления сложными системами искусственного интеллекта и обеспечения их соответствия человеческим целям.

Риски в многомерном пространстве: новый аналитический подход

09.02.2026 от Денис Аветисян

$Зависимость математического ожидания [latex] \mathbb{E}\left[x\_{11,t}\mid x\_{11,t}>x\_{\<i>}\right] [/latex] от величины [latex] x\_{\</i>} [/latex] демонстрирует, что при увеличении порогового значения, ожидаемое значение переменной [latex] x\_{11,t} [/latex] также возрастает, что указывает на прямую зависимость между порогом и ожидаемым результатом.$

Исследование предлагает гибкий инструмент для количественной оценки рисков, особенно в условиях сложной взаимосвязи между различными факторами.