Стохастический градиентный спуск: новый взгляд с помощью исчисления Маллиавена
![Оптимальный вес смешивания [latex]\lambda^{\*}[/latex] уменьшается с увеличением силы связи α, что свидетельствует о возрастающей выгоде от использования компонента Маллиавена, при этом указанная зависимость подтверждается средним значением по 50 повторным экспериментам и отражает погрешность в ±2 стандартных отклонения.](https://arxiv.org/html/2602.17013v1/figures/figure_1_lambda_vs_alpha.png)
Исследование предлагает инновационный подход к оптимизации машинного обучения, объединяющий теорию исчисления Маллиавена с методами стохастического градиентного спуска для снижения дисперсии и повышения эффективности.



