Наука — Страница 125

Оптимизация портфеля: как укротить волатильность

29.01.2026 от Денис Аветисян

Распределение оценок эффективности, полученных для пяти эталонных моделей (MV & GMV с выборочными оценками, CVaR, MAD, MM) и лучших моделей, относящихся к группам A, B и C, демонстрирует зависимость от используемых наборов данных и размера периода тестирования вне выборки, подчеркивая влияние этих факторов на стабильность и надежность прогнозов.

Новое исследование показывает, как методы усадки оценок среднего и ковариации позволяют повысить стабильность и доходность инвестиционных портфелей в различных рыночных условиях.

Обучение языковых моделей: как сделать рассуждения надежнее?

29.01.2026 от Денис Аветисян

Предложенная схема обучения с несколькими противниками, динамически адаптируя учебную программу и перераспределяя вычислительные ресурсы от решенных задач к сложным (с акцентом на «границу рассуждений» - бины 6-8), значительно превосходит стандартный подход GRPO в математических задачах, оптимизируя полезность вычислений и обеспечивая эффективное обучение.

Новый подход к обучению с подкреплением позволяет повысить эффективность и устойчивость больших языковых моделей при решении сложных задач.

Плавная оптимизация для гибких объектов: новый подход к управлению деформацией

29.01.2026 от Денис Аветисян

Модель и её применение демонстрируют взаимосвязь между теоретической конструкцией и практическими задачами, подчёркивая, что любая инновация неизбежно становится частью технического долга, когда сталкивается с реальными условиями эксплуатации.

В статье представлен метод, позволяющий эффективно управлять деформируемыми линейными объектами в реальном времени, используя преимущества гладкой выпуклой оптимизации.

Оптимизация стратегий: новый взгляд на минимизацию остатков уравнения Беллмана

29.01.2026 от Денис Аветисян

$В процессе обучения значения [latex]Q_k(1,1)[/latex] и [latex]Q_k(1,2)[/latex] сходятся к оптимальным значениям [latex]Q_{\lambda}^{\<i>}(1,1)[/latex] и [latex]Q_{\lambda}^{\</i>}(1,2)[/latex] соответственно, демонстрируя сходимость алгоритма к оптимальной политике, при этом пунктирные линии указывают на соответствующие оптимальные Q-значения.$

В статье представлен углубленный анализ теоретических свойств и сходимости методов минимизации остатков уравнения Беллмана, применяемых для оптимизации стратегий в марковских процессах принятия решений.

Кто спасает привязку: новая модель стабильных монет

29.01.2026 от Денис Аветисян

Рамки теории игр со средним полем используются для моделирования динамики агентов на рынках стейблкоинов, позволяя исследовать взаимодействие множества участников и их влияние на стабильность рынка.

Исследование предлагает динамическую модель, объясняющую, как поддерживается стабильность фиатных стейблкоинов на рынке.