Где важна каждая битовая деталь: оптимизация моделей мира для эффективного планирования

Новое исследование показывает, что эффективность моделей мира при планировании пространственных задач зависит не столько от общего количества бит, сколько от того, как они распределены между энкодером и предсказателем.
![На основе анализа примера 2.10, визуализация положения объектов с точки зрения агента 11 демонстрирует, что множество [latex]X\_1 = \{g\_1, g\_2\}[/latex] является допустимым решением в рамках критерия EEFX.](https://arxiv.org/html/2602.11732v1/x2.png)
![Исследование влияния параметра α в алгоритме MRS-DPO (предпочтения ST с шумом конечной выборки) при фиксированных значениях [latex]\beta = 1.0[/latex] и [latex]\lambda = 0.6[/latex] демонстрирует, как варьирование данного параметра влияет на стабильность и эффективность обучения.](https://arxiv.org/html/2602.12180v1/figs/dpo_figure1.png)
