Наука — Страница 105

Обучение политик: новый взгляд на максимизацию благосостояния

02.03.2026 от Денис Аветисян

На основе выборки, полученной алгоритмом SGLD, построена апостериорная оценка благосостояния в простейшей бинарной задаче, демонстрирующая распределение, формирующееся под воздействием детерминированной политики.

В статье представлена новая структура для обучения оптимальных политик, преобразующая задачу максимизации благосостояния в задачу минимизации квадратичной ошибки.

Оптимизация логистики: Как искусственный интеллект повышает эффективность складов

02.03.2026 от Денис Аветисян

Высокопроизводительный логистический центр, основанный на контейнерных технологиях и тесном взаимодействии человека и роботов, демонстрирует автономную консолидацию товаров между контейнерами, оптимизируя тем самым процесс выполнения заказов и повышая эффективность складской логистики.

Новый подход к управлению потоком товаров на складах, основанный на многокритериальном обучении с подкреплением, позволяет балансировать производительность, использование пространства и соблюдение ограничений.

Устойчивое управление портфелем: обучение с учетом макроэкономической динамики

02.03.2026 от Денис Аветисян

В рамках предложенного подхода к обучению с подкреплением, система генерирует распределение сценариев на следующий день, основываясь на векторах совместной доходности, при этом критик обучается с использованием целевой функции, дополненной как реальными, так и контрфактическими продолжениями для повышения устойчивости и эффективности.

Новый подход к обучению с подкреплением позволяет оптимизировать инвестиционные портфели, учитывая изменяющиеся экономические условия и снижая риски при смене рыночных режимов.

Управление ковариацией динамических систем: минимальные изменения – максимальный эффект

02.03.2026 от Денис Аветисян

$Эллипс ковариации эталонной ковариационной матрицы [latex]\Sigma_{ref}[/latex] и диаграмма рассеяния проекций [latex]x[/latex] в пространстве главных компонент демонстрируют распределение данных, не подвергающееся контролю, и позволяют оценить степень изменчивости в различных направлениях.$

В статье представлена новая методика формирования желаемого распределения состояний линейных динамических систем за счет точечного изменения матрицы системы.

Ускорение обучения гигантских языковых моделей: новый подход к оптимизации

02.03.2026 от Денис Аветисян

В исследовании сравнивалась производительность протоколов SOAP и SOAP-LITE при предварительном обучении больших языковых моделей, при этом использовались те же экспериментальные настройки и обозначения, что и в рисунке 4.

Исследователи предлагают эффективный метод повышения скорости предварительного обучения больших языковых моделей за счет оптимизации динамики в пространстве параметров.