Наука — Страница 53

Обучение с подкреплением: как избежать хаоса и добиться стабильности

21.03.2026 от Денис Аветисян

Новый подход к оптимизации политик позволяет создавать более надежные и эффективные алгоритмы обучения с подкреплением, особенно в сложных задачах, требующих логического мышления.

Роботы на четырех ногах: Безопасное взаимодействие в команде

21.03.2026 от Денис Аветисян

В симуляции, алгоритм CBF-DMPC, основанный на ADMM, демонстрирует траектории движения, практически идентичные таковым для централизованного CBF-MPC при навигации четырех агентов среди препятствий, подтверждая сопоставимую безопасность и эффективность обеих стратегий.

Новый подход к управлению группами четвероногих роботов обеспечивает безопасное и скоординированное движение в сложных условиях.

Защита децентрализованного обучения: активный аудит и топологический анализ

21.03.2026 от Денис Аветисян

Анализ вычислительной эффективности различных механизмов выявил существенные различия в производительности, демонстрируя, что оптимизация конкретного механизма может значительно снизить вычислительные затраты [latex]O(n)[/latex] по сравнению с другими подходами.

Новый подход к выявлению и нейтрализации скрытых атак на децентрализованные системы федеративного обучения, основанный на динамическом моделировании и анализе асимметрии информации.

Оптимизация предпочтений: как сделать языковые модели более понятливыми

21.03.2026 от Денис Аветисян

Динамика обучения модели Mistral-7B на наборе данных UltraFeedback демонстрирует сравнительный анализ оптимизаторов AdamW и logits-SAM по таким метрикам, как функция потерь при обучении, функция потерь при оценке и точность оценки, при этом для logits-SAM представлены кривые, отражающие влияние различных значений параметра ρ на процесс оптимизации.

Новое исследование показывает, как улучшить процесс обучения больших языковых моделей, чтобы они точнее соответствовали человеческим предпочтениям.

Баланс ресурсов: токенизированная экономика для справедливого распределения

21.03.2026 от Денис Аветисян

Моделирование экономики токенов для упрощённой транспортной сети демонстрирует возможность управления потоками и ресурсами посредством стимулирования и вознаграждения, что позволяет оптимизировать функционирование системы.

Новый подход к динамическому распределению ресурсов в условиях перегрузки использует принципы токенизированной экономики для достижения баланса между эффективностью и справедливостью.