Сглаживание Квантования: Новый Метод Борьбы с Выбросами Весов

Оптимизация весов с помощью OptRot, оценка несогласованности Гессиана, отношение [latex]\operatorname{tr}(D)/\text{Tr}(H)[/latex], показатель UB, нормированный к [latex]\text{Tr}(H)[/latex], и соотношение сигнал/шум после квантизации GPTQ для модели Llama-3.1-8B демонстрируют взаимосвязь между оптимизацией весов и сохранением точности после квантизации.

Исследователи предлагают эффективный способ повышения точности квантования больших языковых моделей за счет оптимизации поворотов весов без использования обучающих данных.

Предсказание липофильности: от терабайтов данных к понятным моделям

Новый фреймворк позволяет с высокой точностью предсказывать липофильность молекул, используя огромные объемы данных и интерпретируемые методы машинного обучения.

Управляя неопределенностью: Эффективное решение задач стохастической оптимизации

В статье представлен новый подход к решению крупномасштабных задач стохастического оптимального управления, основанный на сочетании стохастических методов и иерархической предобусловки.

Обучение с подкреплением: Новый взгляд на эффективность

Обучение с использованием алгоритма LQR демонстрирует, что изменение параметра α оказывает существенное влияние на итоговую награду, что указывает на возможность оптимизации процесса обучения путем тонкой настройки этого параметра.

Исследователи предлагают инновационный подход к обучению с подкреплением, объединяющий преимущества мягких акторов и моделей потоков данных для более точного и быстрого обучения.