Память о безопасности: Как не допустить деградации моральных принципов у больших языковых моделей

Новое исследование показывает, что методы непрерывного обучения позволяют сохранить этичность больших языковых моделей даже при обучении на потенциально опасных данных.


