Цена ценностей: Как согласование ИИ с человеческими убеждениями влияет на его поведение

В отличие от традиционной оценки, анализирующей отдельные признаки, предложенный подход моделирует ценности как взаимосвязанную систему, выявляя компромиссы, возникающие при согласовании этих ценностей, где направление связи указывает на влияние, а толщина - на степень этого компромисса.

Новое исследование показывает, что попытки направить большие языковые модели в соответствии с человеческими ценностями неизбежно приводят к компромиссам и непредсказуемым последствиям.

Диффузия за гранью KL: Новый подход к оптимизации стратегий

По мере обучения модели SD1.5 с использованием HPSv2 наблюдается прогрессирующее повышение соответствия генерируемых изображений заданным текстовым запросам, что свидетельствует о динамической оптимизации процесса выравнивания.

Исследователи предлагают инновационный метод выравнивания диффузионных моделей, переосмысливающий оптимизацию вознаграждения как задачу минимизации дисперсии весов важности.

Игры с Марковскими процессами: Новые горизонты равновесия и обучения

В статье представлен новый подход к доказательству существования, характеристике и разработке алгоритмов обучения для равновесий Нэша в контексте Марковских игр и их обобщений.