Автор: Денис Аветисян
Как учитывать текущие позиции при торговле с помощью больших языковых моделей и обучения с подкреплением для достижения лучших результатов и управления рисками.
"Покупай на слухах, продавай на новостях". А потом сиди с акциями никому не известной биотех-компании. Здесь мы про скучный, но рабочий фундаментал.
Бесплатный Телеграм канал
Разработка и тестирование системы FinPos – торгового агента, учитывающего размер и состав портфеля.
Несмотря на перспективность больших языковых моделей (LLM) в обработке финансовых данных, существующие торговые агенты часто не учитывают непрерывное управление позициями и риски, связанные с колебаниями рынка. В данной работе, посвященной разработке системы ‘FinPos: A Position-Aware Trading Agent System for Real Financial Markets’, предложен агент FinPos, оптимизированный для учета позиции и управления рисками в реалистичных рыночных условиях. Эксперименты демонстрируют, что FinPos превосходит современные торговые агенты в задаче, требующей непрерывного управления позициями, благодаря использованию многовременных вознаграждений и двойной системы принятия решений. Какие еще возможности для долгосрочного принятия решений на рынке открываются при использовании LLM-центрированных агентских систем?
Эволюция Финансового Искусственного Интеллекта
Традиционное финансовое моделирование часто сталкивается со сложностью и шумом реальных рынков, что открывает возможности для применения искусственного интеллекта. Существующие методы нередко упрощают рыночную динамику, не учитывая множество взаимосвязанных факторов.
Первые подходы к применению ИИ в финансах были ограничены данными и алгоритмами, не отражая нюансы рыночной конъюнктуры. Недостаточно внимания уделялось адаптивности моделей, что приводило к низкой точности прогнозов.

Появление больших языковых моделей (LLM) открыло перспективы, однако их применение в финансах потребовало специализированных архитектур. Существующие LLM часто не обладают способностью к интеграции долгосрочного планирования и надежного управления рисками.
Стабильность на финансовых рынках – лишь иллюзия, маскируемая течением времени.
FinPos: Интеллект, Осознающий Позицию
Агент FinPos – это система для торговли, выходящая за рамки традиционных моделей благодаря включению концепции ‘Осведомленности о позиции’. В отличие от систем, ориентированных только на текущие рыночные данные, FinPos учитывает историю и текущее состояние своих позиций, что позволяет эффективно управлять рисками и оптимизировать стратегии.
В основе FinPos лежит обучение с подкреплением (Deep Reinforcement Learning), позволяющее агенту адаптироваться к сложным рыночным сценариям и оптимизировать торговые стратегии без явного программирования. Использование глубоких нейронных сетей обеспечивает способность агента к обобщению и эффективной работе в условиях высокой волатильности.
Ключевым нововведением является система ‘Многовременного вознаграждения’, стимулирующая как краткосрочные прибыли, так и долгосрочную устойчивость. Кроме того, FinPos использует ‘Модуль обработки рыночных сигналов’ для фильтрации и структурирования рыночных данных, обеспечивая принятие обоснованных решений.
Внутренняя Архитектура FinPos: Симфония Агентов
В основе FinPos лежит архитектура, состоящая из взаимодействующих агентов принятия решений. Агент ‘Агент Оценки Направления’ определяет оптимальную торговую ориентацию – покупку, продажу или удержание – на основе анализа рыночной ситуации. Данный агент использует комбинацию технических и фундаментальных индикаторов для прогнозирования ценовых движений.
Агент ‘Агент Оценки Объема’ динамически регулирует размер позиции, стремясь минимизировать риски и максимизировать потенциальную прибыль. Регулировка осуществляется на основе оценки волатильности, текущего размера позиции и общего капитала. Этот агент использует алгоритмы управления капиталом, направленные на поддержание оптимального соотношения риск/доходность.
Взаимодействие этих агентов осуществляется под управлением системы ‘Многовременного вознаграждения’, которая обеспечивает согласованность стратегии в различных временных масштабах. Система оценивает результаты торговли и корректирует поведение агентов для поддержания стабильной производительности. Такая структура позволяет FinPos адаптироваться к изменяющимся рыночным условиям и поддерживать надежную торговую стратегию.
Метрики Производительности и Риск-Скорректированная Доходность
Агент FinPos демонстрирует стабильно высокую производительность, достигая кумулятивной доходности в 54.99% по акциям TSLA. Это свидетельствует о способности агента генерировать значительную прибыль в долгосрочной перспективе.
Ключевым преимуществом FinPos является эффективное управление рисками. Максимальная просадка по акциям TSLA составила 42.34%, что существенно ниже, чем у базовых моделей обучения с подкреплением, таких как A3C (96.6%). Это указывает на способность агента ограничивать потенциальные убытки.
FinPos достиг коэффициента Шарпа 0.67 по акциям TSLA, превосходя все сравниваемые базовые модели, а также демонстрирует наивысший коэффициент Кальмара. Эти показатели подтверждают, что FinPos эффективно балансирует прибыльность и риск, предлагая существенное преимущество. Время не щадит никого, но достойная инфраструктура способна противостоять его разрушительному воздействию.
Будущее FinPos: Масштабирование и Расширение
Дальнейшие исследования будут сосредоточены на интеграции альтернативных источников данных для повышения эффективности обработки рыночных сигналов. Ожидается, что это позволит улавливать более тонкие тенденции и повысить точность прогнозов, особенно в условиях волатильности.
Изучение передовых методов обучения с подкреплением может открыть еще больший потенциал оптимизации. В частности, рассматривается возможность применения алгоритмов, способных к самообучению и адаптации к изменяющимся рыночным условиям.
Архитектура FinPos может быть адаптирована к различным классам активов и торговым стратегиям, расширяя сферу ее применимости. Это делает ее универсальным инструментом для автоматизированной торговли и управления портфелем. В конечном итоге, FinPos представляет собой значительный шаг на пути к созданию действительно интеллектуальных и адаптивных финансовых агентов.
Исследование, представленное в данной работе, демонстрирует стремление к созданию систем, способных адаптироваться к динамичной среде финансовых рынков. FinPos, как агент, учитывающий позицию и риски, воплощает идею о том, что любая стабильность – лишь временное состояние, обусловленное кэшированием данных во времени. Г.Х. Харди метко заметил: «Математика — это наука об иллюзиях, более убедительных, чем реальность». Подобно тому, как математические модели стремятся к упрощению сложной реальности, FinPos пытается ориентироваться в неопределенности рынка, используя LLM и обучение с подкреплением. Осознание позиции и управление рисками – ключевые элементы, позволяющие агенту функционировать в условиях постоянных изменений и задержек, которые, по сути, являются неизбежным налогом каждого запроса в этой сложной системе.
Что впереди?
Представленная работа, демонстрируя возможности агента FinPos в реальных финансовых условиях, лишь подчеркивает неизбежную сложность систем, оперирующих во времени. Успех в краткосрочной перспективе не гарантирует устойчивости в долгосрочной – стабильность, как часто бывает, оказывается лишь отсрочкой неизбежного. Вопрос не в том, насколько точно модель предсказывает будущее, а в том, как она адаптируется к его непредсказуемости.
Очевидным направлением дальнейших исследований представляется углубленное изучение механизмов самосохранения агента. Необходимо перейти от оптимизации прибыли к оптимизации выживаемости, поскольку любая система, даже самая совершенная, подвержена энтропии. Искусственное внедрение “позиционной осознанности” – лишь первый шаг к созданию агента, способного адекватно оценивать не только текущую ситуацию, но и свою роль в динамично меняющемся окружении.
Важно признать, что финансовые рынки – это не просто набор данных, а сложная адаптивная система, эволюционирующая со временем. Любая модель, претендующая на успех, должна учитывать эту эволюцию, а не просто экстраполировать прошлые тенденции. Иначе, она обречена на повторение ошибок, неизбежных для любой системы, игнорирующей течение времени.
Оригинал статьи: https://arxiv.org/pdf/2510.27251.pdf
Связаться с автором: https://www.linkedin.com/in/avetisyan/
Смотрите также:
- Будущее KCS: прогноз цен на криптовалюту KCS
 - Аналитический обзор рынка (04.11.2025 12:15)
 - Падение акций Navitas Semiconductor: дьявольская сделка и танец ставок
 - Инвестиционный обзор и ключевые инвестиционные идеи воскресенье, 26 октября 2025 9:49
 - Палантин и его дьявольская сделка: прогноз после 4 августа
 - Нужны ли дивиденды на долгие годы? 2 актива с высокой доходностью для покупки и бесконечного удержания
 - Лучшие акции S&P 500 июля 2025 года: тонкие нюансы успеха
 - Starbucks все еще требует времени
 - Почему акции Navitas Semiconductor рухнули сегодня
 - Стоит ли покупать евро за малайзийские ринггиты сейчас или подождать?
 
2025-11-03 18:22