Ранжирование акций: как отделить зерна от плевел

Автор: Денис Аветисян

Новый подход позволяет повысить точность прогнозирования доходности акций, устраняя взаимное влияние сигналов во времени и структуре.

"Покупай на слухах, продавай на новостях". А потом сиди с акциями никому не известной биотех-компании. Здесь мы про скучный, но рабочий фундаментал.

Бесплатный Телеграм канал

Существующие методы склонны к возникновению перекрестных помех из-за смешения разнородных временных динамик и реляционных структур в единых представлениях, в то время как предложенная структура ACT смягчает утечку информации посредством разделения на основе временной когерентной декомпозиции и выделения специализированных путей кодирования (PSPE/FCI/SCI) перед адаптивной интеграцией (ACF).

В статье представлена методика Anti-Crosstalk (ACT), использующая временное разделение и структурную очистку для улучшения ранжирования акций на основе графовых нейронных сетей.

В задачах количественной оценки акций, несмотря на широкое применение графовых нейронных сетей, часто возникает проблема нежелательного смешения информации между факторами, снижающая точность прогнозов. В данной работе, представленной под названием ‘ACT: Anti-Crosstalk Learning for Cross-Sectional Stock Ranking via Temporal Disentanglement and Structural Purification’, предлагается новый фреймворк ACT, направленный на устранение этого «перекрестного шума» посредством временного разделения и структурной очистки данных. Эксперименты на индексах CSI300 и CSI500 показали, что ACT обеспечивает улучшение точности ранжирования акций до 74.25% и превосходит существующие методы. Сможет ли предложенный подход стать основой для создания более эффективных инвестиционных стратегий и снижения рисков на финансовых рынках?

Понимание Искажений: Проблема «Перекрестных Помех» в Ранжировании Акций

Традиционные методы ранжирования акций в поперечном сечении сталкиваются с проблемой “перекрестных помех” — искажением полезного сигнала из-за влияния коррелированных ценных бумаг. Данное явление возникает, когда информация, релевантная для одной акции, ошибочно переносится на другую, что приводит к неверной оценке и, как следствие, к неоптимальному формированию инвестиционного портфеля. В частности, если две акции демонстрируют высокую корреляцию, алгоритм ранжирования может ошибочно приписать одной из них характеристики, свойственные другой, тем самым искажая истинную картину и снижая потенциальную доходность. Эффект “перекрестных помех” особенно заметен при анализе акций, объединенных в один сектор или отрасль, где взаимосвязи между компаниями особенно сильны и могут маскировать индивидуальные особенности каждой из них.

Влияние на ранжирование акций не ограничивается текущими характеристиками отдельных компаний, но также формируется под воздействием двух ключевых факторов. Во-первых, временные зависимости, когда прошлые показатели доходности оказывают влияние на прогнозы будущего, создают инерцию в ранжировании. Во-вторых, структурные связи, обусловленные отраслевой принадлежностью, приводят к тому, что акции внутри одной отрасли демонстрируют схожую динамику, искажая истинную оценку отдельных компаний. Эти взаимосвязи создают помехи, затрудняя выделение действительно значимых сигналов и приводя к неоптимальному ранжированию, поскольку алгоритмы могут ошибочно приписывать успех или неудачу отдельных акций влиянию общих отраслевых трендов или инерции прошлых периодов.

Существующие методы ранжирования акций зачастую не способны разделить влияние временных зависимостей и структурных корреляций, что приводит к ухудшению результатов и снижению доходности инвестиций. Традиционные подходы, игнорируя перекрестные помехи, неадекватно оценивают истинный потенциал каждой акции, смешивая сигналы от коррелированных компаний. Это приводит к формированию неоптимальных инвестиционных портфелей, где акции с реальным потенциалом роста могут быть недооценены, а переоцененные активы — включены в состав портфеля, что негативно сказывается на общей доходности и увеличивает риски. В результате, инвесторы могут упускать возможности получения прибыли и сталкиваться с убытками из-за неточного ранжирования активов.

Анализ абсолютного и рангового IC по географическим регионам индекса CSI500 показал, что в регионах с высокой концентрацией акций (Северо-Восточный, Северный и Южный Китай) явно преобладает эффект ACT, за исключением Северо-Западного Китая.

Anti-Crosstalk (ACT): Раздвижение Временных Рядов для Точного Анализа

Фреймворк Anti-Crosstalk (ACT) решает проблему искажений в финансовых временных рядах путём декомпозиции последовательностей цен на три отдельные временные компоненты: тренд, флуктуации и шоки. Тренд представляет собой долгосрочное направление изменения цены, флуктуации — краткосрочные колебания вокруг тренда, а шоки — внезапные, резкие изменения цены, вызванные внешними факторами. Разделение временного ряда на эти компоненты позволяет проводить независимый анализ каждого из них, что повышает точность прогнозирования и снижает влияние нежелательных корреляций между различными активами. Данная декомпозиция является основой для последующей фильтрации шума и выделения значимых сигналов.

Разложение временных рядов на составляющие — тренд, флуктуации и шоки — осуществляется посредством модуля Temporal Component Decomposition (TCD). TCD позволяет проводить независимый анализ каждого из выделенных компонентов, что обеспечивает более детальное понимание структуры данных и выявление специфических паттернов. В частности, выделение тренда, флуктуаций и шоков позволяет отделить долгосрочные тенденции от краткосрочных колебаний и внезапных изменений, что важно для прогнозирования и анализа рисков. Каждый компонент обрабатывается отдельно, что повышает эффективность и точность анализа по сравнению с анализом исходного временного ряда.

Прогрессивный структурный фильтр (PSPE) уточняет трендовую компоненту путём использования как статических, так и динамических реляционных графов для устранения структурного шума. Статические графы отражают неизменные связи между элементами временного ряда, в то время как динамические графы учитывают изменения этих связей во времени. PSPE последовательно применяет фильтрацию на основе этих графов, постепенно очищая трендовую компоненту от нежелательных структурных искажений и повышая точность анализа временного ряда. Этот процесс позволяет выделить истинный тренд, отделяя его от случайных флуктуаций и шоков.

Архитектура ACT разделяет входные данные на тренд, колебания и скачки, обрабатывая тренд с помощью PSPE, а колебания и скачки - в отдельных ветвях (FCI и SCI), после чего все представления объединяются Adaptive Component Fusion для прогнозирования. — Архитектура ACT разделяет входные данные на тренд, колебания и скачки, обрабатывая тренд с помощью PSPE, а колебания и скачки — в отдельных ветвях (FCI и SCI), после чего все представления объединяются Adaptive Component Fusion для прогнозирования.

Выделение Сигналов: Флуктуации, Шоки и Адаптивное Объединение

В рамках архитектуры ACT, модули изоляции флуктуаций (Fluctuation Component Isolation, FCI) и изоляции скачков (Shock Component Isolation, SCI) специализируются на выделении различных типов отклонений от тренда. FCI предназначен для идентификации и фильтрации краткосрочных колебаний, характеризующихся высокой частотой и низкой амплитудой. SCI, в свою очередь, ориентирован на обнаружение и изоляцию резких, внезапных изменений, вызванных конкретными событиями или шоками. Разделение этих компонентов позволяет более точно анализировать и прогнозировать динамику временных рядов, исключая взаимное влияние краткосрочных колебаний и резких отклонений на основной тренд.

Модуль Adaptive Component Fusion (ACF) объединяет изолированные компоненты — колебания, скачки и очищенный тренд — путем динамического взвешивания вклада каждого из них. Веса компонентов не являются фиксированными, а определяются на основе обученных представлений данных, что позволяет ACF адаптироваться к изменяющимся характеристикам сигнала. Этот подход обеспечивает оптимальную комбинацию компонентов, максимизируя четкость сигнала и минимизируя взаимные помехи, обеспечивая более надежное и точное выделение полезной информации.

Модуль адаптивного объединения компонентов (ACF) использует полученные в процессе обучения представления данных для определения оптимальной комбинации изолированных компонентов — флуктуаций, скачков и очищенного тренда. Этот процесс позволяет динамически взвешивать вклад каждого компонента, максимизируя четкость сигнала и минимизируя взаимные помехи. Обученные представления позволяют ACF адаптироваться к изменяющимся характеристикам сигнала, обеспечивая наиболее эффективное объединение компонентов в различных условиях и повышая точность анализа временных рядов.

В период с 2023 по 2025 год стратегия ACT (красная линия) значительно превзошла все базовые стратегии по показателю совокупной доходности индекса CSI500.

Подтверждение Эффективности: Результаты и Преимущества

Эмпирические исследования последовательно демонстрируют превосходство предложенной структуры ACT над существующими базовыми методами, включая передовые модели, основанные на графовых нейронных сетях, такие как GCN и GAT. В ходе сравнительного анализа было установлено, что ACT обеспечивает более точные прогнозы и стабильные результаты в различных сценариях, превосходя альтернативные подходы в задачах анализа временных рядов и прогнозирования. Данное превосходство обусловлено уникальной архитектурой ACT, позволяющей эффективно моделировать сложные зависимости между различными факторами, влияющими на динамику исследуемых данных, и тем самым, значительно повышать общую производительность системы.

Разработанная методика демонстрирует существенное повышение точности ранжирования благодаря способности разделять временные и структурные факторы, влияющие на динамику финансовых активов. В частности, при анализе данных индекса CSI300, удалось добиться улучшения точности поперечного ранжирования на 74.25%. Это свидетельствует о том, что выделение и независимая оценка влияния временных трендов и внутренней структуры взаимосвязей между активами позволяет более эффективно прогнозировать их относительную производительность и, как следствие, формировать более точные рейтинги. Данный подход позволяет учитывать не только текущую динамику, но и устойчивые характеристики, определяющие долгосрочную ценность активов.

В ходе тестирования на индексе CSI500 предложенная система продемонстрировала выдающиеся результаты, достигнув значения ICIR (Information Coefficient of Rank) в 2.5944 и AR (Accuracy Ratio) в 0.4579. Эти показатели значительно превосходят результаты ближайшего конкурента — разница составила впечатляющие 40.1%. Данные результаты свидетельствуют о высокой эффективности разработанного подхода в прогнозировании динамики фондового рынка и подтверждают его потенциал для практического применения в сфере инвестиций и финансового анализа. Такое существенное превосходство над существующими методами указывает на принципиально новую возможность более точной оценки и прогнозирования рыночных тенденций.

Детальный анализ по секторам экономики выявил существенные улучшения в показателях Rank IC и Rank ICIR в 11 и 13 из 15 исследуемых отраслей соответственно. Данный результат подчеркивает универсальность предложенного подхода и его способность эффективно функционировать в различных рыночных условиях. Полученные данные свидетельствуют о том, что фреймворк не ограничивается конкретным сектором, а демонстрирует стабильные улучшения в ранжировании активов, независимо от их принадлежности к той или иной отрасли. Это указывает на то, что механизм разделения временных и структурных влияний является ключевым фактором успеха, обеспечивающим надежные результаты в широком спектре инвестиционных сценариев.

Модель ACT демонстрирует улучшение результатов по сравнению с лучшими из базовых моделей (XGBoost, iTransformer) в различных секторах экономики и регионах Китая (CSI500), при этом более интенсивный зеленый цвет указывает на значительный выигрыш, а красный - на превосходство базовых моделей. — Модель ACT демонстрирует улучшение результатов по сравнению с лучшими из базовых моделей (XGBoost, iTransformer) в различных секторах экономики и регионах Китая (CSI500), при этом более интенсивный зеленый цвет указывает на значительный выигрыш, а красный — на превосходство базовых моделей.

Перспективы Развития: Расширение Горизонтов Anti-Crosstalk

В дальнейшем исследования будут направлены на расширение рамок модели ACT путем включения дополнительных источников данных, таких как анализ тональности новостей и макроэкономические показатели. Это позволит не только учитывать текущую рыночную ситуацию, но и прогнозировать будущие изменения, основываясь на общественном мнении и экономических тенденциях. Интеграция данных о настроениях инвесторов, отраженных в новостных потоках, и ключевых макроэкономических индикаторах, таких как уровень инфляции, процентные ставки и ВВП, потенциально способна значительно повысить точность прогнозов и выявить скрытые взаимосвязи между различными финансовыми активами. Подобный подход позволит создать более комплексную и устойчивую модель, способную адаптироваться к быстро меняющимся условиям рынка и обеспечивать более надежные результаты.

Исследования направлены на усовершенствование существующей структуры за счет внедрения более сложных архитектур графовых нейронных сетей и механизмов внимания. Эти усовершенствования позволят системе более эффективно выявлять и учитывать сложные взаимосвязи между различными финансовыми активами и рыночными индикаторами. В частности, применение механизмов внимания позволит модели фокусироваться на наиболее значимых связях, игнорируя несущественные, что потенциально повысит точность прогнозов и улучшит понимание рыночной динамики. Ожидается, что такие подходы позволят перейти от простого обнаружения корреляций к выявлению причинно-следственных связей, что открывает новые возможности для разработки более надежных и эффективных стратегий управления рисками и оптимизации инвестиционных портфелей.

Перспективы применения парадигмы предотвращения «перекрестных помех» (anti-crosstalk) выходят далеко за рамки первоначальных задач прогнозирования. Исследования показывают, что данный подход может быть успешно адаптирован для решения более сложных задач финансового моделирования, таких как оптимизация портфеля инвестиций и управление рисками. Идея заключается в том, чтобы, идентифицируя и устраняя ложные корреляции между активами, повысить эффективность стратегий распределения капитала и снизить вероятность убытков. Более точное прогнозирование, основанное на исключении «шума» в данных, позволяет разрабатывать более устойчивые и прибыльные инвестиционные портфели, а также более эффективно оценивать и управлять финансовыми рисками, что делает данное направление особенно перспективным для дальнейших исследований и практического применения в сфере финансов.

Анализ абсолютного и рангового IC для CSI500 показывает, что ACT (красный) превосходит в отраслях с высокой степенью взаимосвязанности (электроника, фармацевтика, продукты питания и напитки), в то время как iTransformer демонстрирует конкурентоспособность в некоторых секторах (добыча полезных ископаемых, материалы), что подтверждается данными сравнительной тепловой карты.

Исследование демонстрирует стремление к созданию систем, способных к адаптации и эволюции без радикальных изменений. Как отмечает Барбара Лисков: «Хорошо спроектованная система должна быть достаточно гибкой, чтобы допускать изменения в одной части, не затрагивая другие». Предложенный фреймворк ACT, фокусируясь на временном разделении и очистке структуры графа, воплощает эту идею. Он позволяет усовершенствовать ранжирование акций, минимизируя нежелательное влияние «перекрестных помех» (crosstalk), и тем самым повышает эффективность инвестиционных стратегий. Подход, основанный на эволюции структуры, а не на её полной перестройке, является ключевым принципом, обеспечивающим стабильность и масштабируемость системы.

Куда же дальше?

Предложенная работа, безусловно, демонстрирует потенциал отделения временных закономерностей и очистки структуры графа для улучшения ранжирования акций. Однако, элегантность решения не должна заслонять более широкую картину. Существующая архитектура, хоть и смягчает проблему «перекрестного шума», по сути, лишь локализует её. Возникает вопрос: не является ли «шум» не недостатком данных, а отражением истинной, нелинейной взаимосвязи между активами, которую текущие модели попросту не способны уловить?

Дальнейшие исследования должны быть направлены не только на улучшение методов разделения временных рядов и очистки графов, но и на разработку принципиально новых подходов к моделированию финансовых связей. Необходимо исследовать возможность интеграции механизмов внимания, способных динамически оценивать значимость различных узлов и связей в графе, и учитывать контекст, в котором происходит взаимодействие. Особый интерес представляет применение методов обучения с подкреплением для оптимизации стратегий ранжирования, учитывающих не только текущую ситуацию, но и долгосрочные последствия принимаемых решений.

В конечном счете, задача состоит не в том, чтобы построить идеально «чистую» модель, а в том, чтобы создать систему, способную адаптироваться к постоянно меняющимся условиям рынка и извлекать пользу из кажущегося хаоса. Ведь, как известно, даже в самых сложных системах порядок рождается из простоты, а устойчивость — из ясных границ, а не из усложнения.

Оригинал статьи: https://arxiv.org/pdf/2604.20204.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2026-04-24 01:11