Наука — Страница 150

Управление Токенами и Последовательностями: Новый Подход к Обучению Языковых Моделей с Подкреплением

12.01.2026 от Денис Аветисян

Таблица 1 демонстрирует, что предложенный метод DHPO, независимо от используемой стратегии смешивания - усредненной (DHPO-A) или основанной на энтропии (DHPO-E) - последовательно превосходит другие алгоритмы по всем показателям, причем DHPO демонстрирует наилучшие результаты, выделенные полужирным шрифтом.

Исследователи предлагают инновационный метод, позволяющий стабилизировать и повысить эффективность обучения больших языковых моделей с подкреплением, особенно в задачах, требующих логических рассуждений.

Справедливость в машинном обучении: как не потерять контроль при обновлениях моделей

12.01.2026 от Денис Аветисян

В условиях проверки модели, неизвестная аудитору модель сопоставляется со стратегическим классом моделей, при этом слабая проверка направлена на поиск модели в стратегическом классе, обладающей тем же значением групповой справедливости, что и проверяемая, а сильная - на характеристику всего множества моделей в стратегическом классе, разделяющих это значение.

Новое исследование предлагает комплексный подход к аудиту справедливости алгоритмов, особенно в условиях постоянных изменений и обновлений моделей.

Умные дороги: Как наладить движение в смешанном потоке

12.01.2026 от Денис Аветисян

$В исследовании сравнивается коэффициент производительности системы TACTS при различных уровнях загруженности сети - низком, среднем и высоком - для индуцированных транспортных потоков [latex]f_{c} \in \{1.0, 10.0, 30.0\}[/latex], применительно к трем городским сетям: Анахайм, Су-Фолс и Чикаго, демонстрируя её адаптивность к изменяющимся условиям дорожного движения.$

Новая стратегия управления трафиком позволяет оптимизировать потоки в транспортных сетях, где автомобили могут переключаться между различными режимами работы.

Оптимальная транспортировка по Мартингейлам: от теории к ускорению с помощью нейросетей

12.01.2026 от Денис Аветисян

$Оптимальный план переноса [latex]\pi^{\*}\_{0,1}[/latex] для синтетических маржиналов GBM демонстрирует разреженную концентрацию вероятностной массы, при этом диагональная структура отражает ограничение мартингала [latex]\mathbb{E}[X\_{1}|X\_{0}]=X\_{0}[/latex], а сконцентрированный пик вблизи точки [latex](x\_{0},x\_{1})=(5500,6500)[/latex] указывает на высоковероятный путь перехода.$

В статье представлен новый подход к решению задач оптимальной транспортировки по Мартингейлам, сочетающий теоретическую строгость с возможностями нейронных сетей для повышения скорости вычислений.

Глубокое обучение на службе макро-инвестиций: Новый подход к управлению портфелем

12.01.2026 от Денис Аветисян

Исследователи представляют DeePM — фреймворк, сочетающий в себе возможности глубокого обучения и макроэкономические факторы для повышения эффективности и устойчивости инвестиционных стратегий.