Наука — Страница 83

Преодолевая ограничения: Новые алгоритмы для стохастических вариационных неравенств

08.02.2026 от Денис Аветисян

Алгоритм 1 и метод градиентного спуска (EG) демонстрируют свою эффективность при решении задачи поиска контрпримера (см. (E.1)), в то время как алгоритм 4 и алгоритм из [38] успешно справляются с задачей оптимизации без ограничений (E.2) при наличии операторного шума, распределенного по закону Стьюдента и Лапласа.

В статье представлены эффективные алгоритмы, позволяющие решать стохастические вариационные неравенства без предположения об ограниченной дисперсии, расширяя область их применимости.

Оптимальное распределение: Новый подход к подбору донорских органов для трансплантации сердца

08.02.2026 от Денис Аветисян

На основе подхода, основанного на упрощении, разработан алгоритм, демонстрирующий конкурентное преимущество над существующим распределением ресурсов в США после 2018 года, что подтверждается симуляциями, проведенными в период с января по июнь 2019 года.

Исследователи разработали эффективный алгоритм, позволяющий улучшить процесс сопоставления пациентов и донорских органов, повышая шансы на успешную трансплантацию сердца.

Обучение языковых моделей: новый подход к выравниванию

08.02.2026 от Денис Аветисян

$Предлагаемый фреймворк оценивает расхождения между распределениями, используя как верифицируемые сигналы вознаграждения [latex] r(x,y) [/latex] для выявления пар «вопрос-ответ» с высокой и низкой результативностью ([latex] {\cal D}^{+} [/latex] и [latex] {\cal D}^{-} [/latex] соответственно), так и данные о предпочтениях пользователей, комбинируя информацию для достижения согласования политики с помощью алгоритма [latex] ff-HAL [/latex], который интерполирует между согласованием предпочтений и вознаграждения на основе политики.$

В статье представлен унифицированный метод, использующий оценку расхождений, для более эффективного обучения и адаптации больших языковых моделей.

Возвращая разумные пути: новый подход к обучению языковых моделей

08.02.2026 от Денис Аветисян

Исследователи предлагают метод, позволяющий языковым моделям сохранять разнообразие стратегий рассуждений и избегать «коллапса» в процессе обучения.

Адаптация политик обучения с подкреплением: новый подход к преодолению разрыва между доменами

08.02.2026 от Денис Аветисян

Исследователи предлагают метод, позволяющий эффективно переносить навыки, полученные в одной среде, в другую, даже при значительных различиях в динамике.