Обучение языковых моделей методом проб и ошибок: новый взгляд на Reinforcement Learning

Исследование предлагает переосмыслить процесс тонкой настройки больших языковых моделей с использованием принципов, аналогичных многорукому бандиту, что позволяет лучше понимать факторы, влияющие на их производительность.

Оптимизация складских запасов: новый алгоритм с гарантированной точностью

Исследователи разработали эффективный алгоритм для решения сложной задачи планирования поставок на складах, обеспечивающий приближение к оптимальному решению с заданной точностью.

Круглосуточное Безуглеродное Энергоснабжение: Новый Подход к Оптимизации

Ежемесячные затраты на электроэнергию для различных конфигураций систем управления энергопотреблением демонстрируют различия при круглосуточной работе без избыточной передачи энергии во внешнюю сеть.

Исследование предлагает инновационную систему управления энергоснабжением, обеспечивающую непрерывную работу на возобновляемых источниках энергии и минимизацию затрат.