Наука — Страница 124

Геометрия Ошибок: Как Устроен Рельеф Функций Потерь

23.02.2026 от Денис Аветисян

$В исследовании проблемы восстановления фазы, при [latex]a=0.01[/latex], [latex]q=0.0[/latex] и [latex]\alpha=6.5[/latex], предсказанное аннелированным методом Каца-Райса распределение гессиана для типичных энергетических минимумов демонстрирует положительную сложность [latex]{\widetilde{\Sigma}}\_{0}(q)\sim eq 7.10^{-3}>0[/latex], а также указывает на положение отрицательной аномалии “BBP” в спектре, характерной для минимумов с положительной сложностью, что подтверждается результатами численного моделирования с использованием метода градиентного спуска.$

Новое исследование раскрывает топологические особенности высокоразмерных пространств функций потерь, что позволяет предсказывать поведение алгоритмов оптимизации.

Полиномиальные политики: Новый подход к обучению с подкреплением

23.02.2026 от Денис Аветисян

Исследователи предлагают MePoly — инновационную параметризацию политик, основанную на полиномиальных распределениях, для повышения эффективности обучения с подкреплением и имитационного обучения.

Навигация в Неопределенности: Оптимизация Траекторий для Межпланетных Миссий

23.02.2026 от Денис Аветисян

Оптимизация траектории в условиях неопределённости предполагает фундаментальный подход к статистической обработке, позволяющий учитывать вероятностные факторы и формировать устойчивые решения даже при неполной информации о внешней среде.

Новый подход позволяет разрабатывать надежные траектории для космических аппаратов, учитывая различные источники неопределенности и ограничения по риску.

Оптимизация инвестиционного портфеля во времени: новый подход

23.02.2026 от Денис Аветисян

В статье представлена методика построения портфельных стратегий, учитывающих изменения предпочтений инвестора во времени и нестабильные ставки дисконтирования.

Мерцающие бандиты: Изучение алгоритмов принятия решений

23.02.2026 от Денис Аветисян

$В рассматриваемой задаче многорукого бандита с четырьмя рычагами ([latex]FMAB[/latex]), система переходит от состояния [latex]a_{s-1} = 1[/latex] к последовательности действий [latex]a_{s} = 3[/latex], [latex]a_{s+1} = 4[/latex], [latex]a_{s+2} = 2[/latex], демонстрируя способность агента к исследованию доступных вариантов и адаптации стратегии в динамичной среде, где доступность рычагов (синим и белым цветом) определяет возможности для взаимодействия.$

В статье представлен всесторонний анализ моделей и алгоритмов, используемых в задачах принятия решений в условиях неопределенности.