Обучение поисковых систем: новый взгляд на множественные релевантные примеры

Оценка влияния размера группы и максимального числа положительных примеров на соотношение положительных и отрицательных результатов на наборе данных MS MARCO демонстрирует возможность оптимизации этого соотношения путем варьирования данных параметров.

Исследование посвящено изучению методов обучения плотных поисковых систем, использующих несколько положительных примеров для повышения точности ранжирования.

Сингапурский опыт: как обуздать волатильность цен на электроэнергию

Новое исследование подтверждает эффективность комбинированной системы защиты, включающей долгосрочные контракты и временное ограничение цен, в стабилизации оптового рынка электроэнергии Сингапура.

Политики с энтропией: Новый подход к обучению с подкреплением

Исследователи предложили инновационный метод, позволяющий создавать более стабильные и предсказуемые стратегии обучения с подкреплением за счет регуляризации кинетической энергией.

Обучение агентов в риске: новая стратегия для многоагентного обучения с подкреплением

Исследователи предлагают оригинальный подход к обучению нескольких агентов, учитывающий фактор риска, и доказывают сходимость разработанного алгоритма к стабильным решениям.