Наука — Страница 165

Оптимизация онлайн: снижение сложности стохастических методов Ньютона

07.02.2026 от Денис Аветисян

Новый алгоритм позволяет существенно сократить вычислительные затраты при онлайн-оптимизации, приближаясь по эффективности к методам первого порядка.

Прогноз на миллиарды: Согласование и масштабирование

07.02.2026 от Денис Аветисян

Наблюдения за крупным сегментом данных выявили, что сопоставление единиц измерения с течением месяцев позволяет оценить процентное расхождение от фактических значений, демонстрируя динамику отклонений во времени.

Новые алгоритмы позволяют эффективно решать задачи согласования прогнозов в условиях огромных объемов данных, типичных для современной розничной торговли.

Игры разума: новый подход к планированию в мультиагентных системах

07.02.2026 от Денис Аветисян

$В процессе обучения многослойный перцептрон (MLP) формирует стратегию [latex]\pi_{\theta}[/latex] посредством минимизации трех различных функций потерь, после чего, на основе полученной стратегии и динамики системы игрока 2, аппроксимируется наилучший ответ [latex]\widehat{\mathcal{B}}_{2}[/latex], что позволяет решить предложенное упрощенное условие Каруша-Куна-Таккера (KKT) с использованием суррогата этого ответа.$

Исследователи предлагают метод разложения динамических игр, позволяющий оптимизировать стратегии для роботов в условиях асимметричной информации.

Обучение с ограничениями: новый взгляд на групповую относительную оптимизацию

07.02.2026 от Денис Аветисян

В статье представлена методика, позволяющая эффективно накладывать ограничения на поведение агента в процессе обучения с подкреплением, сохраняя при этом баланс между различными ограничениями.

Поймать хвост: Гибкое моделирование экстремальных значений

07.02.2026 от Денис Аветисян

Влияние выбросов на оценку порогового значения [latex]uu[/latex] проявляется в последующем искажении оценок параметров масштаба σ и формы ξ обобщенного распределения Парето, что демонстрирует чувствительность модели к качеству исходных данных и необходимость предварительной обработки для исключения нерепрезентативных наблюдений.

Новая модель позволяет точнее оценивать риски, учитывая влияние обычных данных на анализ редких, но критически важных событий.