Чёрные дыры под микроскопом: Искусственный интеллект оценивает массы сотен тысяч квазаров

Основываясь на анализе тестового набора данных, новая модель, использующая автокодировщик, демонстрирует значительно более точную оценку массы черных дыр - с коэффициентом детерминации $R^{2}=0.909$ и среднеквадратичной ошибкой RMSE всего 0.058 dex по сравнению с методами реверберационного картирования, превосходя традиционные одноэпоховые вириальные оценки, особенно в диапазонах низких и высоких масс, и позволяя получать оценки для объектов, для которых стандартные методы оказываются неэффективными.

Новая модель машинного обучения позволяет с беспрецедентной точностью определять массы сверхмассивных чёрных дыр, открывая новые возможности для изучения галактик и Вселенной.

Баланс экспертов: Теория эффективного распределения нагрузки в больших моделях ИИ

Схема наивного $s$-MoE слоя, лишенного механизмов балансировки нагрузки, демонстрирует потенциальные проблемы с неравномерным распределением вычислений и, как следствие, неоптимальное использование ресурсов.

Новая работа предлагает теоретическую основу для оптимизации распределения нагрузки в разреженных моделях Mixture-of-Experts, обеспечивая стабильную работу и высокую производительность.