Наука — Страница 57

Цена ценностей: Как согласование ИИ с человеческими убеждениями влияет на его поведение

14.02.2026 от Денис Аветисян

В отличие от традиционной оценки, анализирующей отдельные признаки, предложенный подход моделирует ценности как взаимосвязанную систему, выявляя компромиссы, возникающие при согласовании этих ценностей, где направление связи указывает на влияние, а толщина - на степень этого компромисса.

Новое исследование показывает, что попытки направить большие языковые модели в соответствии с человеческими ценностями неизбежно приводят к компромиссам и непредсказуемым последствиям.

Командная Работа в Неопределенности: Новая Стратегия Обучения Агентов

14.02.2026 от Денис Аветисян

Исследователи предлагают новый подход к обучению мультиагентных систем, позволяющий им эффективно действовать в условиях непредсказуемой среды.

Диффузия за гранью KL: Новый подход к оптимизации стратегий

14.02.2026 от Денис Аветисян

По мере обучения модели SD1.5 с использованием HPSv2 наблюдается прогрессирующее повышение соответствия генерируемых изображений заданным текстовым запросам, что свидетельствует о динамической оптимизации процесса выравнивания.

Исследователи предлагают инновационный метод выравнивания диффузионных моделей, переосмысливающий оптимизацию вознаграждения как задачу минимизации дисперсии весов важности.

Защита DeFi-кредитов: роль комиссий и оракулов

14.02.2026 от Денис Аветисян

При расчете прибыли от ликвидации, исключая промежуточные этапы и транзакционные издержки, достигается максимальная выгода от немедленной реализации активов.

Новое исследование показывает, как правильно настроенные комиссии за транзакции могут эффективно предотвратить манипуляции с ценами в децентрализованных финансовых протоколах.

Игры с Марковскими процессами: Новые горизонты равновесия и обучения

14.02.2026 от Денис Аветисян

В статье представлен новый подход к доказательству существования, характеристике и разработке алгоритмов обучения для равновесий Нэша в контексте Марковских игр и их обобщений.