Торговля на бирже с помощью ИИ: баланс стратегии и риска

Автор: Денис Аветисян

Новое исследование показывает, как большие языковые модели могут эффективно торговать на фондовом рынке, учитывая различные рыночные сигналы и избегая распространенных поведенческих ошибок.

"Покупай на слухах, продавай на новостях". А потом сиди с акциями никому не известной биотех-компании. Здесь мы про скучный, но рабочий фундаментал.

Бесплатный Телеграм канал

Система Strat-LLM функционирует как многоуровневая экосистема, объединяющая потоковые рыночные данные, новостные ленты и статические знания в единый вектор состояния [latex]STS\_{T}[/latex], после чего направляет большую языковую модель для генерации торговых действий [latex]ATA\_{T}[/latex] под различной степенью автономии - от полной свободы до строгих ограничений, классифицированных по экспертной таксономии стратегий (S1-S4) - и, наконец, реализует эти действия с использованием скользящего окна T+1, оценивая многомерные риски, включая коэффициент Шарпа и максимальную просадку, для обеспечения обратной связи и адаптации. — Система Strat-LLM функционирует как многоуровневая экосистема, объединяющая потоковые рыночные данные, новостные ленты и статические знания в единый вектор состояния $STS\_{T}$ , после чего направляет большую языковую модель для генерации торговых действий $ATA\_{T}$ под различной степенью автономии — от полной свободы до строгих ограничений, классифицированных по экспертной таксономии стратегий (S1-S4) — и, наконец, реализует эти действия с использованием скользящего окна T+1, оценивая многомерные риски, включая коэффициент Шарпа и максимальную просадку, для обеспечения обратной связи и адаптации.

Предложена методика Strat-LLM, определяющая оптимальный уровень стратегических ограничений для больших языковых моделей в финансовой торговле с учетом архитектуры модели, рыночной конъюнктуры и необходимости смягчения поведенческих искажений, таких как эффект предрасположенности.

Несмотря на растущий интерес к применению больших языковых моделей (LLM) в автоматизированной торговле, часто упускается из виду зависимость эффективности от архитектуры модели и согласованности стратегии. В работе ‘Strat-LLM: Stratified Strategy Alignment for LLM-based Stock Trading with Real-time Multi-Source Signals’ предложен фреймворк Strat-LLM, демонстрирующий, что оптимальный уровень стратегических ограничений для LLM зависит от архитектуры модели, рыночной конъюнктуры и необходимости смягчения поведенческих искажений, таких как эффект предрасположенности. Проведенные стресс-тесты на рынках акций Китая и США выявили, что модели, основанные на логических рассуждениях, достигают максимальной эффективности в режиме свободной торговли, в то время как стандартные модели требуют строгого контроля рисков. Какие новые подходы к стратегическому выравниванию LLM позволят раскрыть весь потенциал этих моделей в динамично меняющихся рыночных условиях?

Экосистемы Автономной Торговли: За гранью Жестких Правил

Традиционные количественные стратегии, широко применяемые в финансовой торговле, зачастую основываются на жестко заданных правилах и алгоритмах, которые не способны эффективно адаптироваться к постоянно меняющейся рыночной конъюнктуре. Данный подход, несмотря на свою кажущуюся простоту и предсказуемость, демонстрирует ограниченную эффективность в периоды повышенной волатильности или при возникновении новых рыночных тенденций. Неспособность к динамической переоценке рисков и возможностей приводит к упущенной прибыли и, в ряде случаев, к значительным финансовым потерям. В отличие от гибких систем, способных к самообучению и адаптации, статические стратегии остаются нечувствительными к сигналам, указывающим на изменение рыночной ситуации, что делает их уязвимыми в долгосрочной перспективе.

Успешная навигация по финансовым рынкам требует от агентов способности к тонкому, нюансированному принятию решений, выходящего за рамки жестких, заранее заданных ограничений. Исследования показывают, что оптимальная производительность достигается при использовании моделей среднего размера — порядка 35 миллиардов параметров — в условиях строгих ограничений ресурсов. Данный «золотой стандарт» позволяет достичь баланса между способностью к адаптации и вычислительной эффективностью, позволяя агентам улавливать сложные закономерности и быстро реагировать на меняющуюся рыночную конъюнктуру, что существенно превосходит возможности систем, основанных на фиксированных правилах. Такой подход открывает перспективы для создания более гибких и эффективных алгоритмов автоматизированной торговли.

Модель среднего размера (35B) демонстрирует наилучшую производительность при строгих ограничениях, разрешая так называемый «Парадокс масштабирования» в сравнении с моделями меньшего (9B) и большего (122B) размеров.

Страт-LLM: Архитектура Стратифицированного Выравнивания Стратегий

Страт-LLM использует стратифицированный подход к оценке агентов на базе больших языковых моделей (LLM), варьируя степень стратегических ограничений. Оценка проводится по шкале от полной свободы действий, позволяющей агенту исследовать пространство решений без каких-либо указаний, до жесткого следования заданным ограничениям и целям. Такая стратификация позволяет оценить производительность агента в различных условиях, определяя оптимальный баланс между автономией и управляемостью. Система позволяет систематически анализировать, как внутренние рассуждения агента взаимодействуют с внешними директивами, и выявлять режимы работы, обеспечивающие наилучшие результаты в конкретных сценариях.

Система Strat-LLM использует “Двигатель построения стратифицированных стратегий” (Stratified Strategy Scaffolding Engine) для динамического внедрения ограничений в процесс работы LLM-агентов. Этот механизм позволяет варьировать степень стратегического контроля — от полной свободы действий до строгого следования заданным рамкам. Внедрение ограничений осуществляется в реальном времени, что обеспечивает возможность проведения контролируемых экспериментов и точной оценки влияния внешних факторов на внутренние рассуждения агента. Двигатель позволяет изменять параметры ограничений в процессе эксперимента, что дает возможность исследовать широкий спектр поведенческих режимов и выявлять оптимальные конфигурации для конкретных задач.

Данный подход позволяет провести точную оценку взаимодействия внутренних механизмов рассуждений агента, основанных на больших языковых моделях, с внешними управляющими сигналами. Систематически изменяя степень ограничений, накладываемых на агента, можно выявить оптимальные режимы его работы, при которых достигается наилучший баланс между свободой исследования и соблюдением заданных инструкций. Это включает в себя определение того, при каких уровнях внешнего руководства внутренние рассуждения агента наиболее эффективно используются для достижения поставленных целей, а также выявление потенциальных конфликтов между внутренними и внешними источниками информации.

Строгая Оценка: Анализ Производительности и Рисков

Стратегическая система Strat-LLM использует “Динамический механизм исполнения и оценки”, имитирующий процесс торговли с использованием модели T+1. Это означает, что система ежедневно принимает решения на основе данных предыдущего дня, а затем оценивает результаты этих решений, повторяя процесс в течение всего периода тестирования. Такой подход позволяет максимально точно воспроизвести условия реальной торговли, учитывая задержки, связанные с исполнением ордеров и расчетами, что обеспечивает более реалистичную оценку эффективности стратегий.

Для количественной оценки производительности Strat-LLM используются ключевые показатели, такие как годовая доходность (Annualized Return), коэффициент Шарпа (Sharpe Ratio) и максимальная просадка (Max Drawdown). Оценка проводится в двух временных горизонтах: краткосрочном тактическом (Short-Term Tactical Window) и долгосрочном стратегическом (Long-Term Strategic Window). В ходе тестирования на A-акциях китайского рынка с использованием GPT-5.4 (Strict) была достигнута общая доходность $12.31%$ . Коэффициент Шарпа и максимальная просадка являются важными показателями оценки риска и эффективности стратегии управления капиталом.

Система Strat-LLM использует интеграцию данных из множественных источников для формирования комплексного вектора состояния, предоставляемого агентам. Этот вектор включает в себя данные о ценах акций, объемах торгов, макроэкономических показателях, новостном фоне и других релевантных факторах. Объединение информации из различных источников позволяет агентам получать наиболее полное представление о текущей рыночной ситуации и принимать обоснованные инвестиционные решения, что повышает эффективность стратегий и снижает риски.

Смягчение Смещений и Оптимизация Стратегического Контроля: Последствия для Рынка

Оценка показала, что использование “Строгого режима” эффективно нейтрализует эффект предрасположенности, заключающийся в склонности инвесторов продавать прибыльные активы слишком рано и удерживать убыточные слишком долго. Режим обеспечивает последовательное выполнение стратегии, что приводит к значительному снижению максимальной просадки — до 11.66% на американском фондовом рынке, в то время как в “Режиме помощи” (Guided Mode) этот показатель достигал 20.83%. Такое уменьшение риска демонстрирует, что принудительное следование заранее определенной стратегии позволяет избежать импульсивных решений, обусловленных эмоциональными факторами, и повысить стабильность инвестиционного портфеля.

В режиме ‘Свободного выбора’ агенты, использующие метод ‘CoT Reasoning’ (Chain-of-Thought Reasoning), способны детально объяснять логику своих торговых решений, значительно повышая прозрачность и уровень доверия к ним. Этот подход позволяет не только понять, почему было принято то или иное решение, но и оценить его обоснованность, что особенно важно для инвесторов и аналитиков. Результаты исследований показывают, что использование ‘CoT Reasoning’ в сочетании с моделью Kimi-K2.5_think обеспечивает впечатляющий уровень выигрышных сделок — 75,00%, что свидетельствует о высокой эффективности данного метода в процессе принятия торговых решений и прогнозировании рыночных тенденций.

Исследование демонстрирует, что согласование стратегий на разных уровнях оказывает значительное влияние не только на финансовые показатели, но и на рациональность и предсказуемость торговых операций. В частности, модель Qwen3.5-35B-A3B, работающая в режиме “Строгий контроль”, достигла общей доходности в 12.33% на рынке акций A. Более того, использование GPT-5.4 (в режиме “Строгий контроль”) позволило добиться альфа-коэффициента в 17.88% на том же рынке. Эти результаты подтверждают, что систематизированный подход к стратегии, подкрепленный строгим исполнением, способствует более стабильному и прибыльному трейдингу, минимизируя влияние иррациональных факторов и повышая предсказуемость поведения агента на рынке.

Исследование демонстрирует, что оптимальный уровень стратегических ограничений для больших языковых моделей в финансовой торговле динамичен и зависит от множества факторов. Авторы подчеркивают, что попытки создать абсолютно совершенную архитектуру, игнорирующую энтропию рынка, обречены на неудачу. В этом контексте особенно примечательна фраза Андрея Николаевича Колмогорова: «Математика — это искусство находить закономерности в хаосе». Данная работа, подобно математическому анализу, стремится выявить закономерности в сложном поведении рынков, принимая во внимание необходимость смягчения поведенческих искажений, таких как эффект диспозиции. Успех Strat-LLM заключается не в создании идеальной системы, а в адаптации к неизбежному хаосу, что подтверждает идею о системах как об экосистемах, а не о жестких конструкциях.

Куда же дальше?

Представленная работа демонстрирует, что оптимальный уровень стратегических ограничений для больших языковых моделей в финансовой торговле — величина не абсолютная, но зависящая от множества факторов. Это не открытие, конечно, но напоминание о том, что системы — это не машины, а сады. Попытки построить идеальную, непогрешимую модель обречены на провал. Важнее не исключить ошибки, а создать среду, в которой система способна их прощать, смягчать последствия. Устойчивость не в изоляции компонентов, а в их способности прощать ошибки друг друга.

Очевидным направлением дальнейших исследований представляется изучение динамических стратегий, способных адаптироваться к меняющимся условиям рынка. Модель, жестко запрограммированная на определенное поведение, рано или поздно столкнется с ситуацией, к которой не готова. Необходимо сместить фокус с поиска оптимальной статической стратегии на создание самообучающейся системы, способной непрерывно совершенствовать свои алгоритмы.

Однако, даже самая сложная модель не сможет решить все проблемы. Финансовые рынки — это не просто математическая задача, но и отражение человеческих эмоций, иррационального поведения. Игнорирование этой стороны вопроса — всё равно, что строить дом на песке. В конечном итоге, успех любой торговой системы зависит не от её технической сложности, а от её способности понимать и учитывать человеческий фактор. И это понимание — задача не для алгоритмов, а для людей.

Оригинал статьи: https://arxiv.org/pdf/2605.06024.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2026-05-09 08:14