Торговля на бирже с помощью ИИ: баланс стратегии и риска

Автор: Денис Аветисян


Новое исследование показывает, как большие языковые модели могут эффективно торговать на фондовом рынке, учитывая различные рыночные сигналы и избегая распространенных поведенческих ошибок.

"Покупай на слухах, продавай на новостях". А потом сиди с акциями никому не известной биотех-компании. Здесь мы про скучный, но рабочий фундаментал.

Бесплатный Телеграм канал
Система Strat-LLM функционирует как многоуровневая экосистема, объединяющая потоковые рыночные данные, новостные ленты и статические знания в единый вектор состояния [latex]STS\_{T}[/latex], после чего направляет большую языковую модель для генерации торговых действий [latex]ATA\_{T}[/latex] под различной степенью автономии - от полной свободы до строгих ограничений, классифицированных по экспертной таксономии стратегий (S1-S4) - и, наконец, реализует эти действия с использованием скользящего окна T+1, оценивая многомерные риски, включая коэффициент Шарпа и максимальную просадку, для обеспечения обратной связи и адаптации.
Система Strat-LLM функционирует как многоуровневая экосистема, объединяющая потоковые рыночные данные, новостные ленты и статические знания в единый вектор состояния STS\_{T}, после чего направляет большую языковую модель для генерации торговых действий ATA\_{T} под различной степенью автономии — от полной свободы до строгих ограничений, классифицированных по экспертной таксономии стратегий (S1-S4) — и, наконец, реализует эти действия с использованием скользящего окна T+1, оценивая многомерные риски, включая коэффициент Шарпа и максимальную просадку, для обеспечения обратной связи и адаптации.

Предложена методика Strat-LLM, определяющая оптимальный уровень стратегических ограничений для больших языковых моделей в финансовой торговле с учетом архитектуры модели, рыночной конъюнктуры и необходимости смягчения поведенческих искажений, таких как эффект предрасположенности.

Несмотря на растущий интерес к применению больших языковых моделей (LLM) в автоматизированной торговле, часто упускается из виду зависимость эффективности от архитектуры модели и согласованности стратегии. В работе ‘Strat-LLM: Stratified Strategy Alignment for LLM-based Stock Trading with Real-time Multi-Source Signals’ предложен фреймворк Strat-LLM, демонстрирующий, что оптимальный уровень стратегических ограничений для LLM зависит от архитектуры модели, рыночной конъюнктуры и необходимости смягчения поведенческих искажений, таких как эффект предрасположенности. Проведенные стресс-тесты на рынках акций Китая и США выявили, что модели, основанные на логических рассуждениях, достигают максимальной эффективности в режиме свободной торговли, в то время как стандартные модели требуют строгого контроля рисков. Какие новые подходы к стратегическому выравниванию LLM позволят раскрыть весь потенциал этих моделей в динамично меняющихся рыночных условиях?


Экосистемы Автономной Торговли: За гранью Жестких Правил

Традиционные количественные стратегии, широко применяемые в финансовой торговле, зачастую основываются на жестко заданных правилах и алгоритмах, которые не способны эффективно адаптироваться к постоянно меняющейся рыночной конъюнктуре. Данный подход, несмотря на свою кажущуюся простоту и предсказуемость, демонстрирует ограниченную эффективность в периоды повышенной волатильности или при возникновении новых рыночных тенденций. Неспособность к динамической переоценке рисков и возможностей приводит к упущенной прибыли и, в ряде случаев, к значительным финансовым потерям. В отличие от гибких систем, способных к самообучению и адаптации, статические стратегии остаются нечувствительными к сигналам, указывающим на изменение рыночной ситуации, что делает их уязвимыми в долгосрочной перспективе.

Успешная навигация по финансовым рынкам требует от агентов способности к тонкому, нюансированному принятию решений, выходящего за рамки жестких, заранее заданных ограничений. Исследования показывают, что оптимальная производительность достигается при использовании моделей среднего размера — порядка 35 миллиардов параметров — в условиях строгих ограничений ресурсов. Данный «золотой стандарт» позволяет достичь баланса между способностью к адаптации и вычислительной эффективностью, позволяя агентам улавливать сложные закономерности и быстро реагировать на меняющуюся рыночную конъюнктуру, что существенно превосходит возможности систем, основанных на фиксированных правилах. Такой подход открывает перспективы для создания более гибких и эффективных алгоритмов автоматизированной торговли.

Модель среднего размера (35B) демонстрирует наилучшую производительность при строгих ограничениях, разрешая так называемый
Модель среднего размера (35B) демонстрирует наилучшую производительность при строгих ограничениях, разрешая так называемый «Парадокс масштабирования» в сравнении с моделями меньшего (9B) и большего (122B) размеров.

Страт-LLM: Архитектура Стратифицированного Выравнивания Стратегий

Страт-LLM использует стратифицированный подход к оценке агентов на базе больших языковых моделей (LLM), варьируя степень стратегических ограничений. Оценка проводится по шкале от полной свободы действий, позволяющей агенту исследовать пространство решений без каких-либо указаний, до жесткого следования заданным ограничениям и целям. Такая стратификация позволяет оценить производительность агента в различных условиях, определяя оптимальный баланс между автономией и управляемостью. Система позволяет систематически анализировать, как внутренние рассуждения агента взаимодействуют с внешними директивами, и выявлять режимы работы, обеспечивающие наилучшие результаты в конкретных сценариях.

Система Strat-LLM использует “Двигатель построения стратифицированных стратегий” (Stratified Strategy Scaffolding Engine) для динамического внедрения ограничений в процесс работы LLM-агентов. Этот механизм позволяет варьировать степень стратегического контроля — от полной свободы действий до строгого следования заданным рамкам. Внедрение ограничений осуществляется в реальном времени, что обеспечивает возможность проведения контролируемых экспериментов и точной оценки влияния внешних факторов на внутренние рассуждения агента. Двигатель позволяет изменять параметры ограничений в процессе эксперимента, что дает возможность исследовать широкий спектр поведенческих режимов и выявлять оптимальные конфигурации для конкретных задач.

Данный подход позволяет провести точную оценку взаимодействия внутренних механизмов рассуждений агента, основанных на больших языковых моделях, с внешними управляющими сигналами. Систематически изменяя степень ограничений, накладываемых на агента, можно выявить оптимальные режимы его работы, при которых достигается наилучший баланс между свободой исследования и соблюдением заданных инструкций. Это включает в себя определение того, при каких уровнях внешнего руководства внутренние рассуждения агента наиболее эффективно используются для достижения поставленных целей, а также выявление потенциальных конфликтов между внутренними и внешними источниками информации.

Строгая Оценка: Анализ Производительности и Рисков

Стратегическая система Strat-LLM использует “Динамический механизм исполнения и оценки”, имитирующий процесс торговли с использованием модели T+1. Это означает, что система ежедневно принимает решения на основе данных предыдущего дня, а затем оценивает результаты этих решений, повторяя процесс в течение всего периода тестирования. Такой подход позволяет максимально точно воспроизвести условия реальной торговли, учитывая задержки, связанные с исполнением ордеров и расчетами, что обеспечивает более реалистичную оценку эффективности стратегий.

Для количественной оценки производительности Strat-LLM используются ключевые показатели, такие как годовая доходность (Annualized Return), коэффициент Шарпа (Sharpe Ratio) и максимальная просадка (Max Drawdown). Оценка проводится в двух временных горизонтах: краткосрочном тактическом (Short-Term Tactical Window) и долгосрочном стратегическом (Long-Term Strategic Window). В ходе тестирования на A-акциях китайского рынка с использованием GPT-5.4 (Strict) была достигнута общая доходность 12.31%. Коэффициент Шарпа и максимальная просадка являются важными показателями оценки риска и эффективности стратегии управления капиталом.

Система Strat-LLM использует интеграцию данных из множественных источников для формирования комплексного вектора состояния, предоставляемого агентам. Этот вектор включает в себя данные о ценах акций, объемах торгов, макроэкономических показателях, новостном фоне и других релевантных факторах. Объединение информации из различных источников позволяет агентам получать наиболее полное представление о текущей рыночной ситуации и принимать обоснованные инвестиционные решения, что повышает эффективность стратегий и снижает риски.

Смягчение Смещений и Оптимизация Стратегического Контроля: Последствия для Рынка

Оценка показала, что использование “Строгого режима” эффективно нейтрализует эффект предрасположенности, заключающийся в склонности инвесторов продавать прибыльные активы слишком рано и удерживать убыточные слишком долго. Режим обеспечивает последовательное выполнение стратегии, что приводит к значительному снижению максимальной просадки — до 11.66% на американском фондовом рынке, в то время как в “Режиме помощи” (Guided Mode) этот показатель достигал 20.83%. Такое уменьшение риска демонстрирует, что принудительное следование заранее определенной стратегии позволяет избежать импульсивных решений, обусловленных эмоциональными факторами, и повысить стабильность инвестиционного портфеля.

В режиме ‘Свободного выбора’ агенты, использующие метод ‘CoT Reasoning’ (Chain-of-Thought Reasoning), способны детально объяснять логику своих торговых решений, значительно повышая прозрачность и уровень доверия к ним. Этот подход позволяет не только понять, почему было принято то или иное решение, но и оценить его обоснованность, что особенно важно для инвесторов и аналитиков. Результаты исследований показывают, что использование ‘CoT Reasoning’ в сочетании с моделью Kimi-K2.5_think обеспечивает впечатляющий уровень выигрышных сделок — 75,00%, что свидетельствует о высокой эффективности данного метода в процессе принятия торговых решений и прогнозировании рыночных тенденций.

Исследование демонстрирует, что согласование стратегий на разных уровнях оказывает значительное влияние не только на финансовые показатели, но и на рациональность и предсказуемость торговых операций. В частности, модель Qwen3.5-35B-A3B, работающая в режиме “Строгий контроль”, достигла общей доходности в 12.33% на рынке акций A. Более того, использование GPT-5.4 (в режиме “Строгий контроль”) позволило добиться альфа-коэффициента в 17.88% на том же рынке. Эти результаты подтверждают, что систематизированный подход к стратегии, подкрепленный строгим исполнением, способствует более стабильному и прибыльному трейдингу, минимизируя влияние иррациональных факторов и повышая предсказуемость поведения агента на рынке.

Исследование демонстрирует, что оптимальный уровень стратегических ограничений для больших языковых моделей в финансовой торговле динамичен и зависит от множества факторов. Авторы подчеркивают, что попытки создать абсолютно совершенную архитектуру, игнорирующую энтропию рынка, обречены на неудачу. В этом контексте особенно примечательна фраза Андрея Николаевича Колмогорова: «Математика — это искусство находить закономерности в хаосе». Данная работа, подобно математическому анализу, стремится выявить закономерности в сложном поведении рынков, принимая во внимание необходимость смягчения поведенческих искажений, таких как эффект диспозиции. Успех Strat-LLM заключается не в создании идеальной системы, а в адаптации к неизбежному хаосу, что подтверждает идею о системах как об экосистемах, а не о жестких конструкциях.

Куда же дальше?

Представленная работа демонстрирует, что оптимальный уровень стратегических ограничений для больших языковых моделей в финансовой торговле — величина не абсолютная, но зависящая от множества факторов. Это не открытие, конечно, но напоминание о том, что системы — это не машины, а сады. Попытки построить идеальную, непогрешимую модель обречены на провал. Важнее не исключить ошибки, а создать среду, в которой система способна их прощать, смягчать последствия. Устойчивость не в изоляции компонентов, а в их способности прощать ошибки друг друга.

Очевидным направлением дальнейших исследований представляется изучение динамических стратегий, способных адаптироваться к меняющимся условиям рынка. Модель, жестко запрограммированная на определенное поведение, рано или поздно столкнется с ситуацией, к которой не готова. Необходимо сместить фокус с поиска оптимальной статической стратегии на создание самообучающейся системы, способной непрерывно совершенствовать свои алгоритмы.

Однако, даже самая сложная модель не сможет решить все проблемы. Финансовые рынки — это не просто математическая задача, но и отражение человеческих эмоций, иррационального поведения. Игнорирование этой стороны вопроса — всё равно, что строить дом на песке. В конечном итоге, успех любой торговой системы зависит не от её технической сложности, а от её способности понимать и учитывать человеческий фактор. И это понимание — задача не для алгоритмов, а для людей.


Оригинал статьи: https://arxiv.org/pdf/2605.06024.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2026-05-09 08:14