Справедливое обучение с подкреплением: новый подход к линейным бандитам
Исследователи предложили усовершенствованные алгоритмы для решения проблемы оптимального распределения ресурсов в сценариях обучения с подкреплением, обеспечивающие баланс между индивидуальной выгодой и общей справедливостью.



