Сглаживание Квантования: Новый Метод Борьбы с Выбросами Весов
![Оптимизация весов с помощью OptRot, оценка несогласованности Гессиана, отношение [latex]\operatorname{tr}(D)/\text{Tr}(H)[/latex], показатель UB, нормированный к [latex]\text{Tr}(H)[/latex], и соотношение сигнал/шум после квантизации GPTQ для модели Llama-3.1-8B демонстрируют взаимосвязь между оптимизацией весов и сохранением точности после квантизации.](https://arxiv.org/html/2512.24124v1/figs/optrot_full_plot_8b.png)
Исследователи предлагают эффективный способ повышения точности квантования больших языковых моделей за счет оптимизации поворотов весов без использования обучающих данных.
![Оптимизация весов с помощью OptRot, оценка несогласованности Гессиана, отношение [latex]\operatorname{tr}(D)/\text{Tr}(H)[/latex], показатель UB, нормированный к [latex]\text{Tr}(H)[/latex], и соотношение сигнал/шум после квантизации GPTQ для модели Llama-3.1-8B демонстрируют взаимосвязь между оптимизацией весов и сохранением точности после квантизации.](https://arxiv.org/html/2512.24124v1/figs/optrot_full_plot_8b.png)
Исследователи предлагают эффективный способ повышения точности квантования больших языковых моделей за счет оптимизации поворотов весов без использования обучающих данных.
Новый фреймворк позволяет с высокой точностью предсказывать липофильность молекул, используя огромные объемы данных и интерпретируемые методы машинного обучения.
В статье представлен новый подход к решению крупномасштабных задач стохастического оптимального управления, основанный на сочетании стохастических методов и иерархической предобусловки.

Исследователи представили комплексный тест FinMMDocR, чтобы оценить способность искусственного интеллекта к анализу финансовых документов и принятию обоснованных решений.

Исследователи предлагают инновационный подход к обучению с подкреплением, объединяющий преимущества мягких акторов и моделей потоков данных для более точного и быстрого обучения.