Наука — Страница 55

Обучение языковых моделей: когда градиент заслуживает доверия

15.02.2026 от Денис Аветисян

Новый подход к обучению больших языковых моделей позволяет динамически балансировать между исследованием и использованием знаний, повышая их эффективность и обобщающую способность.

Гарантии справедливости в машинном обучении: новый взгляд на обобщающую способность

14.02.2026 от Денис Аветисян

Исследователи разработали алгоритмы, позволяющие одновременно контролировать точность и справедливость моделей машинного обучения, обеспечивая надежные гарантии обобщения.

Циклические пептиды: новый подход к генерации конформаций

14.02.2026 от Денис Аветисян

$Разработана трехступенчатая схема MuCO, в которой генерация молекулярной структуры разделена на последовательное создание базового каркаса с использованием [latex]\mathrm{SE(3)}[/latex]-потокового соответствия, условную выборку боковых цепей посредством циклического RPE-потокового соответствия и физически обоснованную оптимизацию с применением силового поля Charmm36 для получения энергетически минимизированной конформации.$

Исследователи разработали метод, позволяющий эффективно создавать разнообразные и физически правдоподобные структуры циклических пептидов с использованием искусственного интеллекта.

Прогнозирование будущего: как учить модели на опыте экспертов

14.02.2026 от Денис Аветисян

$Оптимальный вес первого эксперта, определяемый как [latex]w\_{1}^{\*}[/latex], демонстрирует зависимость от априорного веса [latex]w\_{1}s\_{1}[/latex] и квадратичного отклонения [latex](\mu\_{1}-\mathbb{E}(\mu))^{2}[/latex], при фиксированном прогнозе второго эксперта, причем характер этой зависимости варьируется в зависимости от выбранных преобразований [latex]f[/latex] и штрафных функций Φ.$

Новый метод регулярного ансамблевого прогнозирования позволяет повысить точность предсказаний, используя исторические данные и текущие оценки экспертов.

Когда языковым моделям стоит упрощать?

14.02.2026 от Денис Аветисян

Наблюдения показывают, что метод атомарной селективной абстракции демонстрирует улучшенный баланс между снижением фактических рисков и сохранением охвата информации по сравнению с методами редукции, Inline и саморевизии при оценке на 76 подсказках LongFact для шести больших языковых моделей, что указывает на более эффективный подход к обработке информации.

Новый подход позволяет большим языковым моделям повысить надежность длинных текстов, заменяя сомнительные утверждения на более общие, но проверенные.