Восемь Токенов для Планирования: Сжатие Изображений для ИИ

Предложенная модель латентного мира отображает входное изображение в компактные латентные токены [latex]{\bm{z}}[/latex], после чего, используя полученные токены, обучает модель [latex]f\_{\phi}({\bm{z}}\_{t},{\bm{a}}\_{t})[/latex] для моделирования условного распределения будущего состояния [latex]p\_{\phi}({\bm{z}}\_{t+1}|{\bm{z}}\_{t},{\bm{a}}\_{t})[/latex] посредством маскированного генеративного моделирования, что позволяет осуществлять планирование действий [latex]{\bm{a}}\_{0:H-1}[/latex] во время принятия решений для минимизации расстояния между предсказанным конечным состоянием и целевым изображением.

Новый подход к токенизации изображений позволяет значительно уменьшить объем данных, необходимых для обучения систем искусственного интеллекта, не теряя при этом возможности планирования сложных действий.

Дешёвый оптимизм: Эффективная оптимизация с использованием недорогих меток

Предлагаемый трехступенчатый алгоритм оптимизации с амортизацией, включающий сбор недорогих неточных меток, предварительное обучение с контролируемым стартом и обучение с самоконтролем, позволяет снизить вычислительные затраты до 59 раз при одновременном повышении точности, оптимальности и реализуемости по сравнению с существующими подходами.

Новый подход позволяет значительно повысить стабильность и эффективность обучения суррогатных моделей для сложных задач оптимизации, используя минимальные вычислительные ресурсы.