Наука — Страница 245

Обучение с подкреплением: Как справиться с переоценкой?

06.01.2026 от Денис Аветисян

В исследовании демонстрируется, что при варьировании параметра пессимизма β в алгоритме STAC, при фиксированном уровне отсечения для актора и критика равном 0.01, наблюдается изменение кривых оценки эпизодической ценности, что указывает на влияние данного параметра на стабильность и точность алгоритма.

Новый алгоритм Stochastic Actor-Critic (STAC) предлагает эффективный способ смягчить проблему переоценки в обучении с подкреплением за счет моделирования неопределенности.

Самообучающиеся решатели: оптимизация точности вычислений линейных уравнений

06.01.2026 от Денис Аветисян

Средние показатели производительности плотных систем демонстрируют зависимость от диапазона условий, что позволяет оценить эффективность различных настроек в заданных параметрах.

Новый подход позволяет автоматически настраивать точность вычислений в итерационных методах решения линейных уравнений, повышая эффективность и снижая вычислительные затраты.

Согласование распределений в многоагентных системах: новый подход

05.01.2026 от Денис Аветисян

Соответствие распределений для линейной, время-инвариантной (LTI) системы демонстрирует возможность точного моделирования и управления выходным сигналом посредством настройки параметров системы.

Исследование предлагает децентрализованную систему управления, использующую теорию оптимального транспорта для эффективного распределения агентов к заданной цели.

Рынки в движении: оптимизация очередей и цен

05.01.2026 от Денис Аветисян

Ожидаемое время ожидания в очереди существенно меняется в зависимости от выбранного алгоритма обслуживания, что демонстрирует возможность оптимизации системы для снижения задержек.

В статье представлен обзор новейших достижений в области динамического дизайна рынков, позволяющих эффективно управлять спросом и предложением в условиях асинхронных поступлений.

Квантовый скачок в ценообразовании опционов

05.01.2026 от Денис Аветисян

$В рамках исследования финансовой модели ценообразования опционов показано, что изменение параметра β в модифицированной модели, при [latex]\beta = 0[/latex], приводит к нормальному распределению, лежащему в основе модели Блэка-Шоулза, в то время как при других значениях параметра, при заданных [latex]r = 10\%[/latex], [latex]S_0 = 20[/latex], [latex]K = 20[/latex], [latex]T = 1 \text{ год}[/latex] и [latex]\sigma = 25\%[/latex], наблюдается изменение цены колл-опциона.$

Новый подход к оценке финансовых деривативов использует принципы квантовой механики для преодоления ограничений классической модели Блэка-Шоулза.