Наука — Страница 82

Устойчивое обучение: как привязать языковые модели к реальности

08.02.2026 от Денис Аветисян

В ходе обучения модели Mistral-7B за один эпох, метод GAPO демонстрирует устойчивое улучшение на поздних стадиях оптимизации, в то время как SimPO достигает насыщения после стандартного режима обучения, что указывает на различную динамику сходимости этих подходов.

Новый подход позволяет стабилизировать процесс обучения больших языковых моделей на основе предпочтений человека, делая их более надежными и соответствующими ожиданиям.

Рой под контролем: Безопасность и стабильность в больших системах

08.02.2026 от Денис Аветисян

$Наблюдается эволюция энтропии как в неконструированном, так и в случае с ограничением по CBF, при этом порог энтропии установлен на уровне [latex]\epsilon = 3[/latex], что демонстрирует динамику изменения неопределённости системы в зависимости от наложенных ограничений.$

Новый подход к управлению роем роботов гарантирует соблюдение ограничений безопасности и стабильности благодаря интеграции макроскопических ограничений и децентрализованных алгоритмов управления.

Слияние интеллектов: Перенос знаний между языковыми моделями

08.02.2026 от Денис Аветисян

Для объединения моделей с различными архитектурами используется конвейер, извлекающий промежуточные активации из исходной и целевой моделей, после чего оптимальный транспорт определяет соответствия на уровне слоев и признаков, позволяя напрямую объединять параметры, а последующая адаптация с заморозкой остаточных весов обеспечивает дополнительную оптимизацию.

Новый метод позволяет эффективно объединять большие языковые модели, даже если они построены на разных архитектурах, расширяя возможности для малоресурсных языков.

Социальное влияние и справедливость: как стимулировать распространение инноваций?

08.02.2026 от Денис Аветисян

В новой работе исследователи предлагают модель, учитывающую социальные и когнитивные факторы, для разработки справедливых стратегий стимулирования принятия инноваций в условиях неопределенности.

Преодолевая ограничения: Новые алгоритмы для стохастических вариационных неравенств

08.02.2026 от Денис Аветисян

Алгоритм 1 и метод градиентного спуска (EG) демонстрируют свою эффективность при решении задачи поиска контрпримера (см. (E.1)), в то время как алгоритм 4 и алгоритм из [38] успешно справляются с задачей оптимизации без ограничений (E.2) при наличии операторного шума, распределенного по закону Стьюдента и Лапласа.

В статье представлены эффективные алгоритмы, позволяющие решать стохастические вариационные неравенства без предположения об ограниченной дисперсии, расширяя область их применимости.