Прогнозирование волатильности Bitcoin: новый взгляд на возможности градиентного бустинга

Автор: Денис Аветисян


Исследование демонстрирует эффективность моделей градиентного бустинга LightGBM для точного прогнозирования колебаний цены Bitcoin, превосходя традиционные методы.

"Покупай на слухах, продавай на новостях". А потом сиди с акциями никому не известной биотех-компании. Здесь мы про скучный, но рабочий фундаментал.

Бесплатный Телеграм канал
Прогнозы точек реверсии для биткоина демонстрируют вариативность оценок, отражая присущую этому активу волатильность и сложность долгосрочного планирования.
Прогнозы точек реверсии для биткоина демонстрируют вариативность оценок, отражая присущую этому активу волатильность и сложность долгосрочного планирования.

Квантильная регрессия и анализ значимости признаков позволяют выявить ключевые факторы, влияющие на волатильность Bitcoin, включая объемы торгов и интерес инвесторов.

Несмотря на растущую популярность криптовалют, точное прогнозирование волатильности Биткоина остается сложной задачей. В работе ‘Multivariate Forecasting of Bitcoin Volatility with Gradient Boosting: Deterministic, Probabilistic, and Feature Importance Perspectives’ исследуется применение модели Light Gradient Boosting Machine (LGBM) для детерминированного и вероятностного прогнозирования реализованной волатильности Биткоина, используя широкий спектр рыночных, поведенческих и макроэкономических показателей. Полученные результаты демонстрируют, что модели LGBM, особенно с использованием квантильной регрессии, эффективно захватывают нелинейные характеристики криптовалютного рынка и превосходят традиционные методы, выявляя ключевые факторы, такие как объем торгов и внимание инвесторов. Возможно ли дальнейшее повышение точности прогнозов волатильности Биткоина за счет интеграции альтернативных источников данных и усовершенствования архитектуры моделей машинного обучения?


Колебания Биткоина: Почему Прогнозы Так Сложны

Колебания цены Bitcoin представляют собой уникальные трудности для прогнозирования, обусловленные спецификой его рыночной динамики и ограниченной историей торгов. В отличие от традиционных активов с десятилетиями накопленных данных, Bitcoin существует относительно недолго, что затрудняет применение стандартных статистических методов. Рынок криптовалют характеризуется высокой волатильностью, подверженной влиянию новостей, регулирования, технологических инноваций и настроений инвесторов, что создает нелинейные зависимости, которые трудно уловить с помощью линейных моделей прогнозирования. Отсутствие долгосрочной истории и сложность рыночных факторов делают точные прогнозы крайне сложной задачей, требующей разработки новых подходов и инструментов для анализа и моделирования.

Традиционные статистические модели, разработанные для анализа устоявшихся финансовых рынков, зачастую оказываются неэффективными при прогнозировании волатильности биткоина. Это связано с тем, что динамика цены криптовалюты характеризуется выраженной нелинейностью, которую линейные модели просто не способны адекватно отразить. В отличие от традиционных активов, где изменения цены часто происходят постепенно и предсказуемо, цена биткоина подвержена резким скачкам и падениям, обусловленным сложным взаимодействием рыночных настроений, новостного фона и технологических факторов. Попытки применить к биткоину такие методы, как $ARIMA$ или $GARCH$, часто приводят к существенным ошибкам прогнозирования, поскольку они не учитывают эти нелинейные зависимости и специфические особенности крипторынка. В результате, модели оказываются неспособными точно оценить риски и возможности, связанные с инвестициями в биткоин.

Существующие методы прогнозирования волатильности биткоина демонстрируют неустойчивость и недостаточную надежность, что существенно затрудняет эффективное управление рисками и разработку инвестиционных стратегий. Анализ показывает, что традиционные модели значительно уступают в точности предсказаний, что подтверждается существенным снижением значений CRPS (Continuous Ranked Probability Score) на 23% при использовании предложенных альтернативных подходов. Данное улучшение свидетельствует о значительном повышении точности прогнозов и, как следствие, о возможности более обоснованных и безопасных инвестиционных решений в условиях высокой волатильности криптовалютного рынка. Неспособность существующих моделей адекватно отражать динамику биткоина подчеркивает необходимость разработки и внедрения инновационных методов прогнозирования, способных учитывать специфические особенности данного актива.

Прогнозы квантилей волатильности биткоина (красная линия - фактические значения) демонстрируют соответствие модели реальным данным.
Прогнозы квантилей волатильности биткоина (красная линия — фактические значения) демонстрируют соответствие модели реальным данным.

LightGBM: Эффективный Инструмент для Прогнозирования

LightGBM — это фреймворк градиентного бустинга, предлагающий гибкий и эффективный подход к прогнозированию волатильности Bitcoin. В отличие от традиционных методов, LightGBM использует алгоритмы, основанные на деревьях решений, которые строятся последовательно, корректируя ошибки предыдущих деревьев. Это позволяет модели адаптироваться к сложным нелинейным зависимостям в данных о волатильности. Эффективность LightGBM достигается за счет использования методов, таких как Gradient-based One-Side Sampling (GOSS) и Exclusive Feature Bundling (EFB), которые уменьшают вычислительную нагрузку и ускоряют процесс обучения, особенно при работе с большими объемами данных. Архитектура LightGBM позволяет эффективно обрабатывать категориальные признаки без необходимости предварительного кодирования, что упрощает процесс подготовки данных и повышает точность прогнозов.

LightGBM позволяет выполнять как детерминированный, так и вероятностный прогноз волатильности Bitcoin. Детерминированный прогноз выдает единственное значение для будущей волатильности, в то время как вероятностный прогноз формирует распределение вероятностей, описывающее диапазон возможных значений. Такой подход, основанный на квантилях, позволяет оценить не только наиболее вероятный сценарий, но и вероятность различных уровней волатильности, что критически важно для управления рисками и формирования инвестиционных стратегий. Использование квантильного регрессионного дерева в LightGBM позволяет напрямую моделировать различные процентили распределения, предоставляя полный прогнозный диапазон.

Для обеспечения надежности и предотвращения переобучения моделей LightGBM применялась строгая процедура перекрестной проверки (cross-validation). В ходе исследования, LightGBM последовательно демонстрировал превосходство над базовыми моделями, достигая снижения значений CRPS (Continuous Ranked Probability Score) до 23%. Данный показатель подтверждает способность LightGBM формировать более точные и надежные прогнозы волатильности Bitcoin по сравнению с альтернативными подходами. Использование перекрестной проверки позволило оценить обобщающую способность модели на независимых данных и избежать искажений, связанных с адаптацией к историческим данным.

Модель Light Gradient Boosting Machine (LGBM) используется для анализа данных.
Модель Light Gradient Boosting Machine (LGBM) используется для анализа данных.

Выявление Ключевых Факторов: Что Действительно Влияет на Волатильность?

Анализ с использованием SHAP-значений позволил выявить ключевые факторы, влияющие на волатильность Bitcoin. Данный метод позволяет оценить вклад каждого предиктора в прогнозирование изменений волатильности, что предоставляет ценную информацию о рыночных процессах. В частности, SHAP-значения демонстрируют, какие переменные оказывают наибольшее влияние на увеличение или уменьшение волатильности, позволяя глубже понять динамику рынка и выявить потенциальные драйверы ценовых колебаний. Использование SHAP-значений способствует более точному моделированию и прогнозированию волатильности Bitcoin, что важно для управления рисками и принятия инвестиционных решений.

Анализ показал, что объем торгов и данные Google Trends оказывают существенное влияние на волатильность Bitcoin. Объем торгов напрямую отражает активность участников рынка и степень интереса к активу, в то время как данные Google Trends позволяют оценить общественное мнение и настроения инвесторов. Высокий объем торгов, как правило, сопровождает периоды повышенной волатильности, а изменения в поисковых запросах, связанных с Bitcoin, могут служить индикатором изменения настроений рынка и потенциальных ценовых движений. Корреляция между этими показателями и волатильностью подтверждает важность учета данных о рыночной активности и общественного мнения при прогнозировании колебаний цены Bitcoin.

Метод ансамблевого усреднения повышает точность прогнозирования за счет объединения нескольких моделей LightGBM. Принцип заключается в построении множества моделей, обученных на различных подмножествах данных или с использованием различных параметров, и последующем усреднении их прогнозов. Это позволяет снизить дисперсию и уменьшить вероятность переобучения, что приводит к более стабильным и надежным результатам. В данном случае, использование ансамблевого подхода позволило получить более робастный прогноз волатильности биткоина, чем при использовании одиночной модели.

Анализ показал, что рыночная капитализация обладает дополнительной предсказательной силой в отношении волатильности Bitcoin, указывая на взаимосвязь между размером сети и колебаниями цен. Модель Quantile Regression Switching-LightGBM (QRS-LGBM) продемонстрировала превосходную производительность по сравнению с QRS-HAR, достигнув среднего абсолютного процентного отклонения (MARFE) в размере 0.0249 против 0.0779 для QRS-HAR, а также более низкий показатель Winkler Score — 0.00678 против 0.0129 для QRS-HAR. Данные результаты подтверждают, что учет рыночной капитализации повышает точность прогнозирования волатильности Bitcoin.

Анализ средней абсолютной ошибки (MAE) и среднеквадратичной ошибки (MSE) по различным горизонтам прогнозирования показывает зависимость от автокорреляции логарифма волатильности Bitcoin (ln_RVBTC).
Анализ средней абсолютной ошибки (MAE) и среднеквадратичной ошибки (MSE) по различным горизонтам прогнозирования показывает зависимость от автокорреляции логарифма волатильности Bitcoin (ln_RVBTC).

Вероятностное Прогнозирование: Оценка Неопределенности и Управление Рисками

В отличие от традиционных прогнозов, предоставляющих лишь единичное значение волатильности, вероятностное прогнозирование, в частности с использованием методов квантильной регрессии (QRS), позволяет оценивать диапазон возможных значений и, следовательно, количественно определять неопределенность в оценках волатильности. Такой подход позволяет не просто предсказать, каким будет уровень волатильности, но и оценить вероятность различных сценариев её развития. Это особенно важно для финансовых рынков, где понимание рисков и возможностей, связанных с волатильностью, имеет решающее значение. Вместо того, чтобы полагаться на одно число, инвесторы и риск-менеджеры получают представление о распределении вероятностей, что дает возможность более обоснованно принимать решения и разрабатывать стратегии управления рисками, учитывающие потенциальные колебания рынка. Оценка неопределенности с помощью вероятностного прогнозирования, таким образом, является ключевым элементом эффективного управления портфелем и минимизации потенциальных потерь.

Понимание диапазона возможных исходов имеет решающее значение для эффективного управления рисками и оптимизации портфеля. В отличие от точечных прогнозов, которые предоставляют лишь одно значение, оценка вероятности различных сценариев позволяет инвесторам и финансовым аналитикам принимать более взвешенные решения. Учитывая не только наиболее вероятный исход, но и потенциальные отклонения от него, становится возможным построение портфелей, устойчивых к неблагоприятным колебаниям рынка. Такой подход позволяет более точно оценивать $VaR$ (Value at Risk) и другие показатели риска, а также эффективно распределять капитал, максимизируя доходность при заданном уровне риска. Оценка вероятностных распределений, таким образом, является ключевым элементом современной финансовой аналитики и управления активами.

Современные методы прогнозирования, в частности, разработанная модель QRS-LGBM, демонстрируют значительное превосходство над традиционными подходами в оценке волатильности. Исследования показывают, что данная модель позволяет снизить значения CRPS (Continuous Ranked Probability Score) до 23%, что свидетельствует о значительном повышении точности вероятностных прогнозов. Такое улучшение не только обеспечивает более надежные оценки рисков, но и предоставляет возможность для принятия более обоснованных инвестиционных решений и оптимизации портфеля активов, поскольку позволяет учитывать диапазон возможных исходов, а не полагаться на единичные точечные прогнозы.

Графики показывают функции потерь, используемые для точечного (слева) и квантильного (справа) прогнозирования.
Графики показывают функции потерь, используемые для точечного (слева) и квантильного (справа) прогнозирования.

Исследование демонстрирует, что модели LightGBM способны эффективно прогнозировать волатильность Bitcoin, превосходя традиционные подходы. Однако, стоит помнить, что даже самые изящные алгоритмы рано или поздно сталкиваются с реальностью производственных задач. Как говорил Алан Тьюринг: «Мы можем только сделать то, что можем, и, как только это сделано, мы должны переходить к следующему вопросу». Этот принцип особенно актуален в контексте машинного обучения: точность модели в лабораторных условиях часто отличается от её производительности в условиях реальных рыночных данных и постоянных изменений объёмов торгов, которые, как показано в работе, являются ключевым фактором, влияющим на волатильность.

Что дальше?

Представленная работа, безусловно, демонстрирует возможности градиентного бустинга в прогнозировании волатильности Bitcoin. Однако, каждый «прорыв» — это лишь отсрочка неизбежного технического долга. Модель хорошо работает на исторических данных, но рынок, как известно, обладает удивительной способностью находить новые способы разочаровать. Полагаться на объёмы торгов и «внимание инвесторов» — всё равно что гадать на кофейной гуще, прикрываясь статистикой. Рынок всегда найдет способ сломать элегантную теорию.

Следующим шагом, вероятно, станет усложнение моделей, добавление ещё больше «фичей», которые будут давать иллюзию контроля над хаосом. Скрам, конечно, не решит проблему, это просто способ убедить людей, что хаос управляем. Но истинная проблема не в алгоритмах, а в данных. Доступ к качественным, неискажённым данным — это миф. Багтрекер — это дневник боли, и он показывает, что данные всегда будут грязными.

В конечном итоге, вопрос не в том, насколько точно можно предсказать волатильность, а в том, как долго можно откладывать неизбежное. Мы не деплоим модели — мы отпускаем их в дикую природу. И рано или поздно, рынок напомнит о себе. Кажется, что впереди нас ждет бесконечная гонка за точностью, в которой победить невозможно.


Оригинал статьи: https://arxiv.org/pdf/2511.20105.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2025-11-26 20:18