Оптимальный эксперимент: поиск по распределениям
Новый подход к пакетной байесовской оптимизации экспериментального дизайна использует потоки Вассерштейна для эффективного исследования пространства конфигураций.
Новый подход к пакетной байесовской оптимизации экспериментального дизайна использует потоки Вассерштейна для эффективного исследования пространства конфигураций.
![Рассматривается решение задачи приближения ранга-1, где различные методы - [latex]\mathtt{poolPCA}[/latex], [latex]\mathtt{sepPCA}[/latex], [latex]\mathtt{minPCA}[/latex] и [latex]\mathtt{maxRegret}[/latex] - демонстрируют различные подходы к агрегированию данных из разных исходных областей, при этом [latex]\mathtt{minPCA}[/latex] максимизирует объясненную дисперсию в наихудшем случае (достигая 36%), а [latex]\mathtt{maxRegret}[/latex] обеспечивает объяснение как минимум 24% дисперсии в каждом из доменов, в то время как [latex]\mathtt{poolPCA}[/latex] и [latex]\mathtt{sepPCA}[/latex] не объясняют дисперсию в наихудшем домене, оставаясь ортогональными к его поддержке.](https://arxiv.org/html/2603.11304v1/x1.png)
Исследование предлагает теоретическую основу для надежного снижения размерности и восстановления матриц в условиях неоднородных данных и смещения распределений.
![Задействуя линейную регрессию [latex] (4.6) [/latex], анализ резервов по страховым случаям, разделенных на закрытые и открытые на дату оценки, демонстрирует зависимость величины резервов от года наступления страхового случая.](https://arxiv.org/html/2603.11660v1/x1.png)
В статье рассматривается усовершенствованный метод прогнозирования индивидуальных страховых выплат с использованием машинного обучения.
![Оптимальное распределение вычислительных ресурсов для обучения с подкреплением больших языковых моделей достигается за счет балансировки между количеством параллельных прогонов ([latex]n[/latex]), количеством решаемых задач в пакете ([latex]B_{\text{p}}[/latex]), и количеством последовательных итераций ([latex]M[/latex]), при общем объеме вычислений [latex]C = B_{\text{p}} \cdot n \cdot M[/latex], причем, увеличение числа прогонов ([latex]n[/latex]) коррелирует с ростом вычислительного бюджета, а стратегии, ориентированные на увеличение [latex]B_{\text{p}}[/latex] при низких бюджетах и [latex]n[/latex] при высоких, позволяют максимизировать производительность, в то время как влияние [latex]B_{\text{p}}[/latex] в умеренном диапазоне незначительно.](https://arxiv.org/html/2603.12151v1/x1.png)
Новое исследование показывает, что оптимальное распределение вычислительных ресурсов при обучении с подкреплением больших языковых моделей достигается за счет увеличения числа параллельных прогонов, а не увеличения размера пакета или последовательных обновлений.
Новое исследование демонстрирует успешный перенос алгоритма глубокого обучения с подкреплением для автономной подводной техники из виртуальной среды в реальные условия.