Наука — Страница 183

Воздушное такси: Оптимизация маршрутов с помощью ИИ

01.02.2026 от Денис Аветисян

Предлагаемая модель системы представляет собой комплексную структуру, предназначенную для организации воздушного такси «от двери до двери», охватывающую все аспекты - от планирования маршрута до непосредственной доставки пассажиров.

Новая система, основанная на машинном обучении с подкреплением, позволяет значительно сократить время в пути для пассажиров воздушного транспорта, учитывая наземную и воздушную инфраструктуру.

Охота на экзопланеты: Как выбрать самые интересные цели для Ariel

31.01.2026 от Денис Аветисян

$На основе анализа подвыборки планет, исследование демонстрирует, что оптимизация по различным критериям - размер выборки [latex]\eqref{2}[/latex], разнообразие [latex]\eqref{3}[/latex] и значимость [latex]\eqref{6}[/latex] - приводит к различным вкладам отдельных планет в общий бюджет времени TT или в значение целевой функции, выявляя сложные взаимосвязи между стратегиями отбора и их результатами.$

Новое исследование предлагает эффективную стратегию выбора экзопланет для наблюдений миссии Ariel, позволяющую максимизировать научную отдачу.

JADE: Интеллектуальные агенты и динамический поиск знаний

31.01.2026 от Денис Аветисян

Различные парадигмы агентного RAG демонстрируют, что переход от простого извлечения релевантной информации к активному формированию запросов и адаптации стратегии поиска позволяет значительно повысить качество и точность ответов, приближая системы к более сложным когнитивным способностям.

Новая архитектура JADE объединяет стратегическое планирование и оперативное исполнение в системах, основанных на больших языковых моделях, для повышения эффективности и качества поиска информации.

Борьба за позиции: новая модель стратегического соперничества

31.01.2026 от Денис Аветисян

В статье представлена общая теоретическая база для анализа ситуаций, где игроки соревнуются, выбирая вероятностные распределения результатов, что позволяет исследовать широкий спектр экономических взаимодействий.

Ловушка Ожидаемой Выгоды: Почему Обучение с Подкреплением Застревает в Ограниченном Наборе Решений

31.01.2026 от Денис Аветисян

В исследовании, посвященном изучению стратегий восстановления допустимых модальных решений, алгоритм IPS-GRPO демонстрирует устойчивое обнаружение новых модальных решений по мере увеличения количества выборок из обученной политики, в то время как алгоритмы GRPO и FlowRL достигают насыщения на ранних этапах, что указывает на коллапс модальных решений на уровне результатов.

Новое исследование выявляет структурную причину ‘коллапса режимов’ в обучении с подкреплением и предлагает эффективный метод для восстановления разнообразия стратегий.