Преодолевая ограничения: Новые алгоритмы для стохастических вариационных неравенств

Алгоритм 1 и метод градиентного спуска (EG) демонстрируют свою эффективность при решении задачи поиска контрпримера (см. (E.1)), в то время как алгоритм 4 и алгоритм из [38] успешно справляются с задачей оптимизации без ограничений (E.2) при наличии операторного шума, распределенного по закону Стьюдента и Лапласа.

В статье представлены эффективные алгоритмы, позволяющие решать стохастические вариационные неравенства без предположения об ограниченной дисперсии, расширяя область их применимости.

Оптимальное распределение: Новый подход к подбору донорских органов для трансплантации сердца

На основе подхода, основанного на упрощении, разработан алгоритм, демонстрирующий конкурентное преимущество над существующим распределением ресурсов в США после 2018 года, что подтверждается симуляциями, проведенными в период с января по июнь 2019 года.

Исследователи разработали эффективный алгоритм, позволяющий улучшить процесс сопоставления пациентов и донорских органов, повышая шансы на успешную трансплантацию сердца.

Адаптация политик обучения с подкреплением: новый подход к преодолению разрыва между доменами

Алгоритм STC обучается в два этапа: сначала моделируется прямая динамика, функция вознаграждения и обратная политика для захвата двунаправленной динамики переходов в целевом домене, а затем, используя данные из исходного и целевого доменов, агент обучения с подкреплением корректирует действия и вознаграждения в исходном домене с помощью обратной политики и, дополнительно, селективно корректирует переходы из исходного домена, чтобы лучше соответствовать целевому.

Исследователи предлагают метод, позволяющий эффективно переносить навыки, полученные в одной среде, в другую, даже при значительных различиях в динамике.