Наука — Страница 164

Сглаживание Квантования: Новый Метод Борьбы с Выбросами Весов

02.01.2026 от Денис Аветисян

$Оптимизация весов с помощью OptRot, оценка несогласованности Гессиана, отношение [latex]\operatorname{tr}(D)/\text{Tr}(H)[/latex], показатель UB, нормированный к [latex]\text{Tr}(H)[/latex], и соотношение сигнал/шум после квантизации GPTQ для модели Llama-3.1-8B демонстрируют взаимосвязь между оптимизацией весов и сохранением точности после квантизации.$

Исследователи предлагают эффективный способ повышения точности квантования больших языковых моделей за счет оптимизации поворотов весов без использования обучающих данных.

Предсказание липофильности: от терабайтов данных к понятным моделям

02.01.2026 от Денис Аветисян

Новый фреймворк позволяет с высокой точностью предсказывать липофильность молекул, используя огромные объемы данных и интерпретируемые методы машинного обучения.

Управляя неопределенностью: Эффективное решение задач стохастической оптимизации

02.01.2026 от Денис Аветисян

В статье представлен новый подход к решению крупномасштабных задач стохастического оптимального управления, основанный на сочетании стохастических методов и иерархической предобусловки.

Финансовый интеллект машин: новый вызов для ИИ

02.01.2026 от Денис Аветисян

Распределение FinMMDocR демонстрирует вариативность финансовых сценариев, длины обрабатываемых документов и глубины рассуждений, необходимых для ответа на каждый вопрос, отражая сложность и многогранность задачи.

Исследователи представили комплексный тест FinMMDocR, чтобы оценить способность искусственного интеллекта к анализу финансовых документов и принятию обоснованных решений.

Обучение с подкреплением: Новый взгляд на эффективность

02.01.2026 от Денис Аветисян

Обучение с использованием алгоритма LQR демонстрирует, что изменение параметра α оказывает существенное влияние на итоговую награду, что указывает на возможность оптимизации процесса обучения путем тонкой настройки этого параметра.

Исследователи предлагают инновационный подход к обучению с подкреплением, объединяющий преимущества мягких акторов и моделей потоков данных для более точного и быстрого обучения.