Наука — Страница 175

Искусство адаптации: генеративные модели учатся на малом количестве данных

26.12.2025 от Денис Аветисян

Существующий наивный метод прямой выравнивания уступает разработанному самовращающемуся алгоритму, демонстрируя его превосходство в точности сопоставления данных.

Новый подход позволяет генеративным моделям быстро адаптироваться к новым условиям, используя лишь небольшое количество примеров.

Адаптивные абстракции для обучения с подкреплением

26.12.2025 от Денис Аветисян

Новый подход позволяет агентам эффективнее осваивать сложные задачи, используя гибкие представления состояний и действий.

Укрощение случайности: как нейросимвольные системы повышают надежность программного обеспечения

26.12.2025 от Денис Аветисян

$Тепловая карта демонстрирует, что модели показывают различную надёжность в зависимости от задачи при использовании конфигурации с ограничением [latex]R_{max}=3[/latex], при этом DeepSeek-Coder (1.3B) не справляется ни с одной задачей, Phi4-Mini демонстрирует избирательную надёжность (58% для LRU, 0% для паролей), а аномально низкий показатель Qwen2.5-Coder (14B) при решении задачи с паролями указывает на проблему с данными, а не на недостаток возможностей модели.$

Новый подход объединяет мощь нейронных сетей и формальную верификацию, чтобы сделать разработку программного обеспечения с использованием больших языковых моделей более предсказуемой и контролируемой.

Малые языковые модели: баланс между мощностью и ресурсами

26.12.2025 от Денис Аветисян

В ходе обучения моделей на корпусе Tiny Shakespeare наблюдается, что более сложные архитектуры демонстрируют снижение функции потерь NLL, при этом эффективно избегая переобучения, что указывает на их способность к более точному моделированию языковых закономерностей.

Новое исследование показывает, что при ограниченных вычислительных возможностях, архитектуры, основанные на механизмах внимания, оказываются наиболее эффективными для малых языковых моделей.

Совместная работа агентов: Искусственный интеллект, управляемый кодом

26.12.2025 от Денис Аветисян

Экспериментальные результаты демонстрируют ключевые закономерности, лежащие в основе исследуемого явления.

Новый подход к обучению мультиагентных систем позволяет им адаптироваться к стратегиям друг друга, используя возможности больших языковых моделей для создания программных политик.