Защита моделей: как сделать обновления несовместимыми

Новый подход позволяет создавать обновления для нейросетей, эффективно работающие по отдельности, но теряющие эффективность при объединении с другими, предотвращая несанкционированное слияние моделей.

Обучение в Неизвестности: Алгоритм Томпсона для Стохастических Игр

Новое исследование предлагает эффективный алгоритм обучения с подкреплением для игр с неполной информацией и случайными факторами, позволяющий игрокам адаптироваться к неизвестным параметрам среды.

Эволюция без задач: Новый подход к адаптивной оптимизации

Методы MetaBBO учатся мета-стратегиям на основе распределения задач, но полагаются на разработанные вручную тренировочные данные, в то время как предлагаемая система осуществляет адаптивное обучение параметров, используя самогенерируемые данные оптимизации, что позволяет избежать зависимости от конкретного распределения задач.

Исследователи представили алгоритм ABOM, способный самостоятельно совершенствовать стратегии оптимизации, не требуя предварительного обучения на специализированных задачах.