Обучение в федерации: как стимулировать участие и учесть сетевые эффекты

Участие клиентов в федеративном обучении демонстрирует сетевой эффект, где расширение клиентской базы способствует повышению общей производительности и устойчивости системы, подобно тому, как [latex]n[/latex] участников увеличивают общую точность модели.

Новый подход позволяет максимизировать общую выгоду в федеративном обучении, стратегически incentivizing клиентов и адаптируясь к особенностям конкретных приложений.

Обучение языковых моделей: фокус на финансы и тайский язык

Новое исследование демонстрирует эффективный метод адаптации открытых языковых моделей для повышения их экспертизы в финансовой сфере и улучшения обработки тайского языка.

Визуализация по запросу: новый подход к генерации графиков на основе текста

Архитектура обучения GRPO для генерации визуализаций из текста предполагает оптимизацию политики на основе многоцелевых вознаграждений, включающих точность ответа, корректность кода и качество визуализации, при вычислении комбинированного вознаграждения и преимущества для обновления политики.

Исследователи предлагают систему, которая автоматически создает визуализации, опираясь на текстовое описание и используя возможности машинного обучения с подкреплением.