Оптимизация под Неизвестностью: Эффективный Поиск в Мире Дорогих Расчетов

В новой работе исследуется подход к оптимизации сложных систем, где каждое вычисление требует значительных ресурсов, позволяющий находить лучшие решения, учитывая неопределенность исходных данных.

Скрытые закономерности в рое: как взаимодействующие агенты находят невозможные решения

Новое исследование показывает, что эффективность систем, состоящих из множества взаимодействующих языковых моделей, обусловлена не обменом информацией, а выявлением скрытой структуры решений, недоступных для отдельных агентов.

Обучение языковых моделей методом проб и ошибок: новый взгляд на Reinforcement Learning

Исследование предлагает переосмыслить процесс тонкой настройки больших языковых моделей с использованием принципов, аналогичных многорукому бандиту, что позволяет лучше понимать факторы, влияющие на их производительность.