Цена ценностей: Как согласование ИИ с человеческими убеждениями влияет на его поведение

Новое исследование показывает, что попытки направить большие языковые модели в соответствии с человеческими ценностями неизбежно приводят к компромиссам и непредсказуемым последствиям.

