Наука — Страница 49

Политики с энтропией: Новый подход к обучению с подкреплением

16.02.2026 от Денис Аветисян

Исследователи предложили инновационный метод, позволяющий создавать более стабильные и предсказуемые стратегии обучения с подкреплением за счет регуляризации кинетической энергией.

Обучение агентов в риске: новая стратегия для многоагентного обучения с подкреплением

16.02.2026 от Денис Аветисян

Исследователи предлагают оригинальный подход к обучению нескольких агентов, учитывающий фактор риска, и доказывают сходимость разработанного алгоритма к стабильным решениям.

Торги в сети: адаптивные алгоритмы для двусторонней торговли

16.02.2026 от Денис Аветисян

Новое исследование представляет алгоритмы онлайн-торговли, учитывающие контекст, для оптимизации прибыли и эффективности.

Безопасный взлёт в условиях неопределённости: новый подход

16.02.2026 от Денис Аветисян

Диаграмма оптимизации пути демонстрирует последовательный процесс поиска наиболее эффективной траектории, позволяющий системе последовательно оценивать и улучшать решения для достижения заданной цели.

В статье представлена инновационная методика обеспечения безопасного взлёта беспилотных летательных аппаратов в сложных и непредсказуемых условиях окружающей среды.

В поисках оптимального баланса: удача множества вариантов в многокритериальных задачах

16.02.2026 от Денис Аветисян

Новое исследование показывает, что наличие нескольких перспективных решений может упростить процесс принятия решений в сложных задачах, где необходимо учитывать несколько целей одновременно.