Бандиты с одноиндексными наградами: новый взгляд на адаптивность
В статье представлена инновационная схема для контекстных бандитов, использующая одноиндексные награды и позволяющая достичь оптимальных показателей без зависимости от размерности пространства признаков.

![Алгоритмы, представленные в таблице, обеспечивают эффективное вычисление ориентации на (мульти)графах с [latex]n[/latex] вершинами и [latex]m[/latex] ребрами (разделы 3.1, 3.3, 3.4 и 4.2), при этом все, за исключением алгоритма второй строки, также применимы к соответствующей задаче о минимальной благотворительности.](https://arxiv.org/html/2512.25033v1/Images/reduction.png)
![На деревьях поиска ошибок наблюдается зависимость между долей одобренных элементов и величиной ошибки [latex] err_{1} [/latex], демонстрирующая, что увеличение доли одобренных элементов коррелирует с уменьшением ошибки.](https://arxiv.org/html/2512.24105v1/approval_comb.png)