Обратное моделирование: новый подход к решению сложных задач

Предлагаемая байесовская структура для решения обратных задач объединяет оптимизацию на основе байесовской оптимизации (BO) и байесовский вывод (BI), где итеративное уточнение суррогатной GP-модели посредством BO, управляемое стратегией UCB, позволяет, достигнув сходимости, выполнить параметрическую инференцию посредством минимизации методом наименьших квадратов (LS) и получить оценку максимальной апостериорной вероятности (MAP) и апостериорное распределение с использованием формулировки отрицательных наименьших квадратов (NLS).

В статье представлен эффективный байесовский фреймворк, сочетающий суррогатное моделирование и байесовское обратное моделирование для повышения точности и скорости решения обратных задач.

Устойчивое обучение с подкреплением от обратной связи: новый подход к стабилизации

Обучаемый агент SAFE поддерживает необходимый уровень энтропии в процессе работы, динамически регулируя величину расхождения Кулбака-Лейблера и обеспечивая стабильное обучение, что отражается в траектории вознаграждения, снижении потерь и контролируемой длине завершения.

Исследователи разработали метод, повышающий стабильность обучения моделей, управляемых обратной связью от человека, и снижающий риск нежелательного поведения.

Надежное управление в условиях неопределенности: новый подход к системам с мультипликативным шумом

Динамическое изменение размера выборки [latex]n^{\<i>}[/latex] в стратегиях DRO позволяет сформировать консервативное распределение активов в периоды высокой волатильности, эффективно ограничивая риски снижения капитала по сравнению со статическими подходами с фиксированным [latex]n^{\</i>}[/latex].

В статье представлена методика обеспечения устойчивого управления системами, подверженными шумам и неопределенностям в распределении вероятностей, использующая принципы робастного управления и теорию Вассерштейна.