Наука — Страница 248

Оптимизация данных для обучения больших языковых моделей: новый подход

04.01.2026 от Денис Аветисян

Результаты показывают, что усредненная производительность модели плотности 1.5B на двенадцати задачах варьируется в зависимости от набора данных предварительного обучения: FineWeb, FineWeb-Semdedup, FineWeb-Edu, UltraFineWeb, FineWeb-DCLM и разработанного FineWeb-Mask, демонстрируя влияние выбора данных на эффективность обучения.

Исследователи разработали эффективный метод отбора данных для предварительного обучения, позволяющий одновременно учитывать качество и разнообразие наборов данных.

Скрытые смеси: новый взгляд на моделирование видов

04.01.2026 от Денис Аветисян

$На основе анализа плотностей данных, полученных с использованием методов Монте-Карло и [latex]95\%[/latex] доверительных интервалов для различных значений [latex]\xi_j[/latex] и η, модели DPFinite и DPSlice, а также GSBFinite и GSBSlice, демонстрируют различия в оценке распределений, выявляя тонкости в определении вероятностных характеристик данных.$

В статье представлена точная конечная аппроксимация процессов выборки видов, позволяющая эффективно применять байесовские непараметрические модели.

Авиаальянсы: Оптимизация конкуренции и охвата рынка

04.01.2026 от Денис Аветисян

Для решения смешанной целочисленной квадратичной программы визуализируется улучшение способности каждой авиакомпании к проникновению на рынок, демонстрирующее количественный прирост эффективности стратегий, ориентированных на конкретных перевозчиков.

Новое исследование предлагает комплексный подход к анализу и совершенствованию структуры авиационных альянсов для повышения эффективности и конкурентоспособности.

Гауссовы Всплески: Новый Подход к Сжатию Изображений

04.01.2026 от Денис Аветисян

$На основе сравнения распределений двумерных гауссиан, полученных с использованием 6000 компонентов на наборе данных DIV2K×2\times 2, продемонстрировано, что предложенный метод позволяет добиться структурного улучшения по сравнению с GSImage, что свидетельствует о более эффективном моделировании сложных распределений.$

Исследователи предлагают инновационный метод представления и сжатия изображений на основе адаптивного распределения двумерных гауссовых функций.

Оптимизация сетевых проектов: новые границы эффективности

04.01.2026 от Денис Аветисян

Исследование предлагает усовершенствованные методы решения задач многокоммодного проектирования сетей с ограничениями на неделимость потока, позволяющие существенно повысить качество решений.