Наука — Страница 51

Законы обучения научных моделей: как добиться универсальности

16.02.2026 от Денис Аветисян

Междисциплинарная тонкая настройка демонстрирует меньшую эффективность и стабильность по сравнению с настройкой на одной дисциплине, подчеркивая компромисс между обобщающей способностью, производительностью и устойчивостью различных методов.

Новое исследование выявляет ключевые принципы, определяющие эффективность дообучения больших языковых моделей для решения задач в различных научных областях.

Рекомендации нового поколения: MTFM для масштабируемых систем Meituan

16.02.2026 от Денис Аветисян

Анализ масштабируемости модели MTFM демонстрирует её способность к эффективной работе при увеличении нагрузки, что подтверждает её практическую применимость в сложных вычислительных задачах.

В статье представлена модель MTFM, разработанная для повышения эффективности и гибкости рекомендательных систем в условиях растущих объемов данных и разнообразия сценариев.

Где важна каждая битовая деталь: оптимизация моделей мира для эффективного планирования

16.02.2026 от Денис Аветисян

В ходе исследования смешанных битовых моделей, удалось выявить стабильный участок в 8/6-битовом диапазоне, чувствительный к распределению ресурсов переход в 4-битовом режиме и коллапс производительности в 3-битовом диапазоне, что демонстрирует компромисс между успешностью и размером модели и позволяет определить не доминируемые точки Парето для оптимальной конфигурации.

Новое исследование показывает, что эффективность моделей мира при планировании пространственных задач зависит не столько от общего количества бит, сколько от того, как они распределены между энкодером и предсказателем.

Справедливое распределение: достигнута новая высота

15.02.2026 от Денис Аветисян

$На основе анализа примера 2.10, визуализация положения объектов с точки зрения агента 11 демонстрирует, что множество [latex]X\_1 = \{g\_1, g\_2\}[/latex] является допустимым решением в рамках критерия EEFX.$

Новое исследование доказывает возможность одновременного обеспечения двух ключевых критериев справедливости при распределении ресурсов между участниками.

Как выборка формирует поведение больших языковых моделей: от мгновенной оптимизации к динамическим процессам

15.02.2026 от Денис Аветисян

$Исследование влияния параметра α в алгоритме MRS-DPO (предпочтения ST с шумом конечной выборки) при фиксированных значениях [latex]\beta = 1.0[/latex] и [latex]\lambda = 0.6[/latex] демонстрирует, как варьирование данного параметра влияет на стабильность и эффективность обучения.$

Новое исследование показывает, как стратегия отбора данных влияет на процесс согласования языковых моделей с предпочтениями человека, выявляя потенциальные риски нестабильности и предлагая способы их предотвращения.