Когда новости становятся фактором: как ChatGPT улучшает результаты инвестиций

Автор: Денис Аветисян


Как анализ новостного потока с помощью больших языковых моделей позволяет улучшить результаты инвестиционных стратегий и повысить доходность.

"Покупай на слухах, продавай на новостях". А потом сиди с акциями никому не известной биотех-компании. Здесь мы про скучный, но рабочий фундаментал.

Бесплатный Телеграм канал

Применение больших языковых моделей для выявления аномалий и улучшения показателей стратегий импульса на основе анализа новостного фона.

Несмотря на развитые количественные модели, извлечение ценной информации из неструктурированных текстовых данных остается сложной задачей. В работе ‘ChatGPT in Systematic Investing — Enhancing Risk-Adjusted Returns with LLMs’ исследуется возможность повышения эффективности стратегий импульса за счет анализа новостного потока с использованием больших языковых моделей (LLM). Полученные результаты демонстрируют, что интеграция LLM в процесс принятия инвестиционных решений позволяет последовательно улучшать показатели Sharpe и Sortino, как в рамках тестовой выборки, так и в реальном времени после момента завершения обучения модели. Возможно ли дальнейшее расширение применения LLM для выявления новых факторов и оптимизации инвестиционных портфелей?


Интеграция новостного потока и сигналов большой языковой модели позволяет динамически формировать инвестиционный портфель, адаптируясь к изменяющимся условиям и потенциально максимизируя доходность.
Интеграция новостного потока и сигналов большой языковой модели позволяет динамически формировать инвестиционный портфель, адаптируясь к изменяющимся условиям и потенциально максимизируя доходность.

Отголоски Времени: Пределы Традиционного Анализа

Традиционный финансовый анализ часто упускает тонкие сдвиги в настроениях рынка и возникающие тенденции из-за неспособности адекватно отразить сложность ценообразования. Информационные трения и запаздывания препятствуют эффективному включению новой информации, создавая возможности для эксплуатации аномалий. Сохранение эффектов импульса указывает на нерациональность рынков и несоответствие классическим моделям. Для выявления этих аномалий требуются инновационные методы обработки текстовых данных. Финансовые рынки хранят отпечатки прошлого, которые могут предсказать будущее для тех, кто умеет их читать.

Язык Рынка: Новая Эра Текстуального Анализа

Крупные языковые модели (LLM) – мощный инструмент для извлечения информации из неструктурированных текстов, таких как новости и отчеты. Они способны анализировать большие объемы данных, выявляя тенденции и настроения, полезные для принятия инвестиционных решений. Проектирование запросов играет ключевую роль в управлении LLM для точной интерпретации информации. Правильно сформулированные запросы обеспечивают получение более точных результатов. ChatGPT – пример LLM, способный обрабатывать новостные потоки и генерировать инвестиционные сигналы, однако его эффективность ограничена датой окончания обучения. Необходимо учитывать это при анализе текущей рыночной ситуации.

Импульс Времени: От Сигнала к Инвестиционной Стратегии

В основе инвестиционной стратегии лежит концепция поперечного импульса, предполагающая ранжирование акций на основе прошлых показателей для выявления перспективных активов. Конструирование портфеля обеспечивает перевод импульсных сигналов в реальное инвестиционное решение, определяя оптимальное распределение активов с учетом целей инвестора и уровня риска. Важно учитывать корреляцию между активами. При формировании портфеля необходимо учитывать ограничения, связанные с размером и диверсификацией. Оптимальная диверсификация снижает риск концентрации капитала. Частота ребалансировки балансирует между транзакционными издержками и необходимостью поддержания желаемого распределения активов.

Изменение частоты ребалансировки оказывает влияние на коэффициент Шарпа.
Изменение частоты ребалансировки оказывает влияние на коэффициент Шарпа.

Взвешенная Выгода: Оценка Рисков и Практические Аспекты

Основным показателем эффективности стратегии являются скорректированные на риск доходы. Коэффициент Шарпа предоставляет стандартизированную меру доходности с учетом риска, облегчая сравнение стратегии с альтернативами. В период вневыборочной оценки коэффициент Шарпа составил 1.06, превзойдя показатель базовой стратегии (0.79). Годовая доходность стратегии составляет 30%, при максимальной просадке в -17% (против -19% для базовой стратегии) и волатильности в 22% (против 24% для базовой стратегии). Транзакционные издержки оказывают существенное влияние на прибыльность стратегии и должны учитываться при оценке ее эффективности. Архитектура, не учитывающая цену времени, обречена на хрупкость.

Исследование, представленное в статье, демонстрирует, что даже самые передовые инвестиционные стратегии, такие как импульсная торговля, подвержены влиянию времени и требуют постоянной адаптации. Анализ новостного фона с помощью больших языковых моделей позволяет выявлять факторы, которые ускоряют процесс устаревания улучшений. Как отмечал Альбер Камю: «Всё течёт, всё изменяется». Эта фраза отражает суть работы: любые улучшения в инвестиционных моделях со временем теряют свою эффективность, и лишь непрерывный анализ и адаптация к новым данным позволяют поддерживать устойчивую доходность. Игнорирование этой динамики приводит к неизбежному откату, подтверждая, что время – это не просто метрика, а среда, в которой существуют и стареют любые системы.

Что дальше?

Представленная работа, как и любая попытка обуздать флуктуации рынка, является лишь моментом на кривой старения системы. Успешное применение больших языковых моделей к стратегии импульсивных инвестиций не решает проблему, а лишь переносит её в другую область – область интерпретации и адаптации к меняющимся информационным потокам. Каждый обнаруженный фактор аномалии – это, по сути, эхо прошлого, отраженное в настоящем. Важно понимать, что совершенствование алгоритмов – это не поиск истины, а лишь улучшение способности предсказывать её проявления.

Очевидным направлением дальнейших исследований является углубленное изучение механизмов, лежащих в основе взаимодействия между новостным фоном и рыночной динамикой. Технический долг, накопленный в процессе создания и оптимизации моделей, рано или поздно потребует оплаты. Необходимо признать, что предсказательная сила моделей ограничена, и сосредоточиться на разработке более устойчивых и адаптивных стратегий управления рисками. Каждый баг – это момент истины во временной кривой, указывающий на хрупкость любой системы.

В конечном итоге, вопрос не в том, чтобы создать идеальную модель, а в том, чтобы научиться достойно стареть вместе с ней. Время – не метрика, а среда, в которой существуют системы, и их способность к адаптации определяет их долговечность. Поиск новых факторов аномалии – это бесконечный процесс, и его ценность заключается не в достижении абсолютной точности, а в постоянном стремлении к пониманию сложности мира.


Оригинал статьи: https://arxiv.org/pdf/2510.26228.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/