Наука — Страница 3

Ближайшие Марковские Цепи: Оптимизация с Ограничениями

28.02.2026 от Денис Аветисян

В статье представлена новая методика поиска оптимальной разреженной марковской цепи, приближенной к заданной несимметричной матрице вероятностей.

Диалоги с выгодой: обучение сервисных агентов балансу между качеством и затратами

28.02.2026 от Денис Аветисян

Новый подход к обучению диалоговых систем позволяет оптимизировать взаимодействие с пользователями, учитывая не только успешное выполнение задачи, но и экономическую эффективность.

Укрощение Градиента: Единый Подход к Оптимальному Управлению

28.02.2026 от Денис Аветисян

$В задачах линейно-квадратичного регулятора (LQR) с дискретным временем доминирование градиента проявляется даже при неполной наблюдаемости состояния и частичной стабилизируемости системы, где оптимальное усиление [latex]K^{\star}[/latex] определяется ландшафтом, зависящим от весов [latex]Q[/latex] и [latex]W[/latex], даже если [latex]Q[/latex] является лишь положительно полуопределённой матрицей.$

Новое исследование предлагает унифицированный анализ доминирования градиента в линейных квадратичных регуляторах (LQR) для непрерывных и дискретных систем, раскрывая скрытую структуру и упрощая процесс оптимизации.

Скорпион против паука: кто опаснее?

28.02.2026 от Денис Аветисян

Построенные на основе TNTP подграфы служат основой для анализа и моделирования в сценариях, обозначенных как 1-3, позволяя исследовать взаимосвязи и закономерности в рамках заданной системы.

Новое исследование рассматривает стратегии охоты и токсичность ядов скорпионов и пауков, выявляя сложности прямого сравнения их ‘силы’.

Стратегии раскрытия информации для эффективного взаимодействия в многоагентных системах

28.02.2026 от Денис Аветисян

$Политика последовательного принятия решений [latex] \pi^{\mathrm{seq}\,\star} [/latex] демонстрирует устойчивое принятие технологий лишь при обеспечении координации, в то время как политика BCE, хотя и рекомендует более широкое внедрение, коллапсирует к полному отказу при стратегии равновесия по наименьшей оценке, что указывает на критическую зависимость успешного внедрения от механизмов координации и стабильности равновесия, определяемых пороговыми значениями [latex] S(\theta) [/latex].$

Новый подход позволяет проектировать политики обмена информацией, обеспечивающие надежную координацию агентов даже при консервативном поведении.