Двойственность в оптимизации: Гарантии для надёжных вычислений

В статье представлена новая схема двойственности, обеспечивающая чёткие гарантии для решений задач математической оптимизации и открывающая возможности для создания надёжных предметно-ориентированных языков.

Справедливая цена страховки: новый подход к долгосрочным полисам

Наблюдается, что величина единовременных страховых взносов различается в зависимости от расовой принадлежности, при этом обобщенная аддитивная модель [latex]GAM[/latex], регрессирующая взнос на возраст, позволяет оценить эти различия с 95%-ным доверительным интервалом, представленным затененной областью.

В статье представлен комплексный метод адаптации принципов справедливого ценообразования к сложным условиям долгосрочного страхования, обеспечивающий учет факторов справедливости при формировании страховых тарифов.

Обратное моделирование: новый подход к решению сложных задач

Предлагаемая байесовская структура для решения обратных задач объединяет оптимизацию на основе байесовской оптимизации (BO) и байесовский вывод (BI), где итеративное уточнение суррогатной GP-модели посредством BO, управляемое стратегией UCB, позволяет, достигнув сходимости, выполнить параметрическую инференцию посредством минимизации методом наименьших квадратов (LS) и получить оценку максимальной апостериорной вероятности (MAP) и апостериорное распределение с использованием формулировки отрицательных наименьших квадратов (NLS).

В статье представлен эффективный байесовский фреймворк, сочетающий суррогатное моделирование и байесовское обратное моделирование для повышения точности и скорости решения обратных задач.

Устойчивое обучение с подкреплением от обратной связи: новый подход к стабилизации

Обучаемый агент SAFE поддерживает необходимый уровень энтропии в процессе работы, динамически регулируя величину расхождения Кулбака-Лейблера и обеспечивая стабильное обучение, что отражается в траектории вознаграждения, снижении потерь и контролируемой длине завершения.

Исследователи разработали метод, повышающий стабильность обучения моделей, управляемых обратной связью от человека, и снижающий риск нежелательного поведения.