Китайский след на Уолл-стрит: Поиск альфа-сигналов за рубежом

Автор: Денис Аветисян


Новое исследование показывает, что факторы, определяющие доходность акций на китайском рынке, могут быть использованы для повышения эффективности инвестиций в США.

"Покупай на слухах, продавай на новостях". А потом сиди с акциями никому не известной биотех-компании. Здесь мы про скучный, но рабочий фундаментал.

Бесплатный Телеграм канал

В статье представлена оценка влияния краткосрочных торговых сигналов, полученных на основе данных китайского рынка акций, на доходность акций США с использованием метода Double Selection LASSO.

Несмотря на значительный прогресс в ценообразовании активов, кросс-рыночная валидация краткосрочных торговых факторов остается недостаточно изученной областью. В данной работе, ‘Cross-Market Alpha: Testing Short-Term Trading Factors in the U.S. Market via Double-Selection LASSO’, исследуется универсальность факторов, разработанных для китайского рынка акций A, с использованием алгоритма Double-Selection LASSO. Полученные результаты демонстрируют, что 17 факторов из библиотеки Alpha191 сохраняют инкрементальную объясняющую силу для доходности акций на американском рынке, даже после контроля за фундаментальными факторами. Указывает ли это на то, что поведенческие факторы, проявляющиеся в торговых сигналах, являются универсальным компонентом ценообразования активов, и какие перспективы открываются для создания глобальных инвестиционных стратегий?


Факторный Зоопарк и Пределы Традиционного Ценообразования Активов

В последние десятилетия модели ценообразования активов, изначально представленные, например, трехфакторной моделью Фамы-Френча, претерпели значительное расширение. Стремясь объяснить всё больше аномалий на финансовых рынках, исследователи добавляли новые факторы, такие как прибыльность, качество и импульс, что привело к появлению так называемого “зоопарка факторов”. Однако, подобное бесконечное наращивание факторов вызывает обоснованные опасения относительно ложных открытий и переобучения моделей. Вместо повышения прогностической силы, увеличение числа факторов может привести к улучшению результатов лишь на исторических данных, в то время как вне выборки модель демонстрирует низкую эффективность. Эта проблема требует от исследователей более строгого подхода к выявлению действительно значимых факторов и разработке методов, способных отличать истинные закономерности от случайных шумов.

Расширение моделей ценообразования активов, направленное на объяснение новых рыночных аномалий, сопряжено с риском переобучения. Включение всё большего числа факторов, хотя и кажется способом повышения точности, на практике может привести к снижению эффективности модели при прогнозировании на новых данных — вне выборки, использованной для обучения. Это происходит из-за того, что модель начинает адаптироваться не к реальным закономерностям, а к случайным колебаниям в исторических данных. Таким образом, становится необходимым переход к более надёжным методам, способным отличать истинные факторы, влияющие на цену активов, от статистического шума, и обеспечивать стабильную производительность модели в различных рыночных условиях.

Распространение факторов, используемых в моделях ценообразования активов, усугубляется ограничениями традиционных статистических методов при анализе данных высокой размерности. Классические подходы, такие как множественная регрессия, склонны к ложным корреляциям и переоценке значимости факторов при большом количестве переменных. В условиях, когда количество факторов приближается или превышает количество наблюдений, статистическая мощность снижается, а риск обнаружения случайных закономерностей возрастает. Это приводит к построению моделей, которые хорошо работают на исторических данных, но оказываются неэффективными в прогнозировании будущих изменений на рынке. Необходимость учета этих ограничений становится критически важной при разработке новых библиотек факторов и применении строгих методов отбора, чтобы избежать построения моделей, основанных на случайных шумах, а не на реальных закономерностях.

Прежде чем представлять новую библиотеку факторов, необходимо глубокое понимание ограничений существующих статистических методов. Распространенные подходы часто оказываются неэффективными при анализе данных высокой размерности, что приводит к ложноположительным результатам и переоценке значимости выявленных факторов. Игнорирование этих ограничений может привести к построению моделей, которые демонстрируют хорошие результаты на исторических данных, но оказываются неспособными предсказывать будущие изменения рыночной конъюнктуры. Тщательный анализ и разработка строгих методов отбора факторов, учитывающих статистические погрешности и риски переобучения, являются необходимым условием для создания действительно полезных и надежных моделей ценообразования активов.

Alpha191: Микроструктурный Подход к Анализу Акций

Библиотека Alpha191 состоит из 191 сигнала, основанного на ценах, объеме торгов и потоке ордеров, полученных исключительно с китайского рынка акций класса А. Особенностью данного рынка является высокая доля розничных инвесторов, что оказывает значительное влияние на динамику ценообразования и требует специализированных факторов для анализа. Сбор данных и разработка сигналов ориентированы именно на учет особенностей поведения розничных инвесторов на этом рынке, отличающегося от рынков с преобладанием институциональных участников.

Библиотека Alpha191 включает в себя 191 фактор, предназначенных для улавливания тонких изменений рыночной динамики. Эти факторы систематизированы по тематическим областям, таким как «Ценовое действие» (Price Action), охватывающее краткосрочные изменения цен; «Тренды и импульс» (Trend & Momentum), определяющие устойчивые направления и силу движения цен; и «Объем и поток» (Volume & Flow), анализирующие объемы торгов и характер ордерных потоков. Такая организация позволяет исследователям и трейдерам целенаправленно использовать факторы, соответствующие конкретным инвестиционным стратегиям и временным горизонтам, а также комплексно оценивать рыночные условия, объединяя сигналы из разных тематических групп.

Факторы, входящие в библиотеку Alpha191, принципиально отличаются от факторов, основанных на фундаментальном анализе. В то время как фундаментальные факторы оценивают внутреннюю стоимость актива на основе финансовых показателей, факторы Alpha191 строятся исключительно на основе наблюдаемого рыночного поведения — цен, объемов торгов и потока ордеров. Такой подход позволяет получить дополнительную перспективу при анализе рынка, дополняя информацию, полученную из фундаментальных исследований, и позволяя учитывать краткосрочные и среднесрочные рыночные тенденции, обусловленные действиями участников торгов.

Разработка библиотеки Alpha191 основывается на гипотезе поведенческой универсальности, предполагающей, что психологические предубеждения и когнитивные искажения оказывают влияние на динамику финансовых рынков вне зависимости от их географического расположения или структуры. Данная гипотеза предполагает, что иррациональное поведение участников рынка, проявляющееся в различных формах — от эффекта стада и неприятия потерь до чрезмерной уверенности и эвристики доступности — является общим для всех рынков. В связи с этим, факторы, входящие в библиотеку Alpha191, направлены на выявление и количественную оценку проявлений этих универсальных поведенческих паттернов в данных о ценах, объемах торгов и потоке ордеров, что позволяет использовать их для прогнозирования рыночных движений и построения эффективных торговых стратегий.

Строгий Отбор Факторов: От LASSO до Двойного Отбора

Начальный отбор факторов часто осуществляется с использованием методов, таких как LASSO (Least Absolute Shrinkage and Selection Operator) и Elastic Net, для снижения размерности пространства признаков и предотвращения переобучения модели. LASSO выполняет регуляризацию, добавляя к функции потерь сумму абсолютных значений коэффициентов регрессии, что приводит к обнулению незначимых коэффициентов и, следовательно, к отбору наиболее важных факторов. Elastic Net сочетает в себе L1 (LASSO) и L2 (Ridge) регуляризацию, обеспечивая преимущества обоих подходов и повышая устойчивость модели при наличии коррелированных факторов. Уменьшение размерности помогает упростить модель, снизить вычислительную сложность и улучшить ее обобщающую способность на новых данных.

В условиях высокой размерности данных, стандартный алгоритм LASSO демонстрирует смещение в оценках коэффициентов. Это происходит из-за того, что при большом количестве предикторов (признаков) и относительно небольшом количестве наблюдений, LASSO склонен отбирать не все действительно значимые факторы, а лишь часть из них. Смещение проявляется в тенденции алгоритма приравнивать коэффициенты незначимых факторов к нулю, даже если они имеют небольшое, но статистически значимое влияние на целевую переменную. Для решения этой проблемы и снижения смещения используются более продвинутые методы, такие как Double-Selection LASSO, которые учитывают взаимосвязи между предикторами и обеспечивают более точный отбор значимых факторов.

Метод Double-Selection LASSO решает проблему смещения, возникающую при использовании стандартного LASSO в задачах высокой размерности, за счет двухэтапного процесса отбора факторов. На первом этапе, выполняется регрессия LASSO для получения оценок коэффициентов. На втором этапе, отбираются только те факторы, для которых оценки коэффициентов значительно отличаются от нуля, используя статистический критерий, например, t-тест. Такой подход позволяет более надежно идентифицировать действительно значимые факторы и снизить вероятность включения в модель ложноположительных факторов, улучшая обобщающую способность модели и повышая её интерпретируемость.

Для упрощения моделей и повышения их способности к обобщению, к библиотеке Alpha191 могут применяться методы понижения размерности, такие как анализ главных компонент (PCA). PCA позволяет преобразовать исходный набор признаков в новый, состоящий из некоррелированных переменных — главных компонент. Выбор наиболее значимых главных компонент, объясняющих наибольшую дисперсию данных, позволяет снизить количество входных параметров модели, уменьшить вычислительную сложность и предотвратить переобучение, особенно в случаях, когда исходное количество признаков значительно превышает количество наблюдений. Это приводит к созданию более устойчивой и эффективной модели с улучшенными прогнозирующими свойствами.

Влияние и Перспективы: За Пределами Прогнозирования

Исследование продемонстрировало, что отобранные факторы Alpha191 демонстрируют высокую эффективность в различных приложениях ценообразования активов, что открывает перспективы для улучшения существующих моделей. В отличие от традиционных подходов, основанных на общепринятых финансовых показателях, эти факторы, изначально разработанные для китайского рынка акций, показали способность объяснять колебания доходности на американском рынке S&P 500. Это указывает на то, что данные факторы не просто отражают локальные особенности конкретного рынка, а выявляют более общие закономерности, влияющие на ценообразование активов. Использование этих факторов может повысить точность прогнозов и помочь инвесторам принимать более обоснованные решения, а также предоставить новые инструменты для управления рисками и оптимизации инвестиционных портфелей.

Исследование выявило, что семнадцать из ста девяноста одного фактора Alpha191, изначально разработанных для китайского рынка акций A, сохранили статистическую значимость при объяснении межсессионной доходности в рамках американского индекса S&P 500. Этот результат особенно примечателен, поскольку значимость этих факторов была подтверждена даже после учета влияния ста пятидесяти одного общепринятого фундаментального фактора. Фактически, это демонстрирует, что определенные закономерности, выявленные на одном финансовом рынке, могут быть успешно применены для анализа и прогнозирования на совершенно другом, что указывает на существование универсальных принципов, определяющих динамику финансовых активов.

Исследование продемонстрировало, что значительная часть факторов Alpha191, изначально разработанных для китайского рынка акций, успешно обобщается на другие рынки, в частности, на американский S&P 500. Из 191 исследованного фактора, 17 продемонстрировали статистически значимые результаты (p < 0.05) при объяснении кросс-секционных доходностей акций S&P 500, даже после учета влияния 151 традиционных фундаментальных факторов. Этот результат указывает на то, что факторы Alpha191 способны выявлять закономерности, не улавливаемые стандартными моделями ценообразования активов, и могут быть применены для улучшения инвестиционных стратегий на различных финансовых рынках. Выявленная способность к обобщению подчеркивает потенциал библиотеки Alpha191 как ценного инструмента для инвесторов и аналитиков, стремящихся к повышению точности прогнозов и оптимизации портфелей.

Перспективные исследования направлены на расширение области применения библиотеки факторов Alpha191, включая анализ ее эффективности на других финансовых рынках, помимо уже изученных. Особый интерес представляет возможность адаптации и проверки этих факторов на примере индекса S&P 500, что позволит оценить их универсальность и потенциал для улучшения моделей ценообразования активов. Помимо этого, планируется детальное изучение взаимосвязей между различными тематическими группами факторов, входящими в библиотеку. Понимание этих взаимодействий может привести к созданию более сложных и точных моделей, способных лучше объяснять динамику финансовых рынков и повышать эффективность инвестиционных стратегий. Предполагается, что углубленный анализ позволит выявить синергетические эффекты и оптимизировать комбинации факторов для достижения наилучших результатов.

Исследование показывает, что факторы, успешно работающие на одном рынке, могут сохранять свою прогностическую силу и на другом, даже учитывая существующие фундаментальные показатели. Этот процесс напоминает выращивание экосистемы, где каждый элемент влияет на другие. Как отмечал Томас Кун: «Научные знания не растут поступательно, а скорее переживают революционные изменения». Подобно тому, как смена парадигмы в науке требует переосмысления устоявшихся представлений, обнаружение устойчивости факторов на разных рынках указывает на универсальность поведенческих искажений в ценообразовании активов. Порядок, наблюдаемый в финансовых рынках, является лишь временным буфером между неизбежными сбоями, а устойчивость факторов — это не доказательство их абсолютной истинности, а свидетельство их способности выживать в условиях хаоса.

Что дальше?

Представленная работа демонстрирует устойчивость определенных поведенческих шаблонов на различных рынках. Однако, не стоит обольщаться иллюзией универсальных законов. Каждый фактор, даже выявленный на обширных данных, — это лишь временный компромисс, застывший в определенном моменте времени. Рынки учатся, адаптируются, и вчерашняя альфа становится сегодняшним шумом. Истинная проблема не в поиске новых сигналов, а в понимании, почему эти сигналы вообще возникают — не как статистическая аномалия, а как проявление глубинных, не всегда рациональных сил.

Исследование, по сути, открывает ящик Пандоры. Если поведенческие искажения действительно универсальны, то и их последствия будут неизбежны. Будущие работы должны сосредоточиться не на оптимизации портфелей, а на моделировании эволюции этих искажений. Попытки построить «непробиваемую» систему — тщетны. Системы не строятся, они вырастают, и каждое архитектурное решение — это пророчество о будущей поломке.

Технологии сменяются, зависимости остаются. В погоне за краткосрочной прибылью легко упустить из виду долгосрочные последствия. Важнее не количество факторов, а их взаимодействие и эволюция во времени. Истина, вероятно, кроется не в статистической значимости, а в понимании, что рынки — это не просто механизмы, а сложные адаптивные системы, подчиняющиеся своим собственным, зачастую непредсказуемым законам.


Оригинал статьи: https://arxiv.org/pdf/2601.06499.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2026-01-13 16:15