Управляя неопределенностью: Эффективное решение задач стохастической оптимизации

В статье представлен новый подход к решению крупномасштабных задач стохастического оптимального управления, основанный на сочетании стохастических методов и иерархической предобусловки.

Обучение с подкреплением: Новый взгляд на эффективность

Обучение с использованием алгоритма LQR демонстрирует, что изменение параметра α оказывает существенное влияние на итоговую награду, что указывает на возможность оптимизации процесса обучения путем тонкой настройки этого параметра.

Исследователи предлагают инновационный подход к обучению с подкреплением, объединяющий преимущества мягких акторов и моделей потоков данных для более точного и быстрого обучения.

Почему фонд продал акции Perpetua Resources за $26 млн

Фонд Anson Funds Management ликвидировал позицию в Perpetua Resources (PPTA 1.26%), полностью устранив её из портфеля в третьем квартале. Сделка, оцененная в $26,1 млн, отразилась в SEC-документе от 13 ноября. В предыдущем квартале акции компании составляли 3,8% от управляемых активов фонда. Теперь в топе — криптовалютные и технологические бумаги, как будто инвесторы предпочли светлые звёзды туманного минерального горизонта.

Вероятностное программирование без границ: новый подход к моделям

Траектория состояния [latex]F_{1:T}[/latex], усредненная по маргинальному F1, демонстрирует различие между выборочным и параметрическим подходами к представлению данных, основанное на круговых наблюдениях.

Исследователи предлагают отказаться от жесткой привязки структуры вероятностных моделей к конкретным вычислительным реализациям, открывая путь к большей гибкости и эффективности.