Наука — Страница 234

Обучение в федерации: как стимулировать участие и учесть сетевые эффекты

10.01.2026 от Денис Аветисян

Участие клиентов в федеративном обучении демонстрирует сетевой эффект, где расширение клиентской базы способствует повышению общей производительности и устойчивости системы, подобно тому, как [latex]n[/latex] участников увеличивают общую точность модели.

Новый подход позволяет максимизировать общую выгоду в федеративном обучении, стратегически incentivizing клиентов и адаптируясь к особенностям конкретных приложений.

Разумный сжатие: как повысить эффективность логических рассуждений ИИ

10.01.2026 от Денис Аветисян

В рамках разработанной системы ConMax, обучение стратегии с использованием обучения с подкреплением позволяет сжимать многословные цепочки рассуждений, при этом составная функция вознаграждения балансирует уверенность в ответе и уверенность в процессе мышления, обеспечивая оптимальное сжатие без потери качества рассуждений.

Новый подход позволяет значительно сократить объем информации, генерируемой нейросетями при решении задач, не теряя при этом точности и обоснованности выводов.

Гибкое производство: новый уровень оптимизации

10.01.2026 от Денис Аветисян

Расширенные сети Петри, учитывающие время раскраски, служат для моделирования проблем, связанных с конечными автоматами, обеспечивая инструмент для анализа и проектирования сложных систем, поведение которых определяется переходами состояний.

Исследование предлагает инновационный подход к управлению автоматизированными логистическими системами на производстве, повышая их эффективность и масштабируемость.

Обучение языковых моделей: фокус на финансы и тайский язык

10.01.2026 от Денис Аветисян

Новое исследование демонстрирует эффективный метод адаптации открытых языковых моделей для повышения их экспертизы в финансовой сфере и улучшения обработки тайского языка.

Визуализация по запросу: новый подход к генерации графиков на основе текста

10.01.2026 от Денис Аветисян

Архитектура обучения GRPO для генерации визуализаций из текста предполагает оптимизацию политики на основе многоцелевых вознаграждений, включающих точность ответа, корректность кода и качество визуализации, при вычислении комбинированного вознаграждения и преимущества для обновления политики.

Исследователи предлагают систему, которая автоматически создает визуализации, опираясь на текстовое описание и используя возможности машинного обучения с подкреплением.