Автор: Денис Аветисян
Новый подход к оптимизации портфеля, основанный на прямом обучении принятию решений, демонстрирует стабильно лучшие результаты на реальных рынках.
"Покупай на слухах, продавай на новостях". А потом сиди с акциями никому не известной биотех-компании. Здесь мы про скучный, но рабочий фундаментал.
Бесплатный Телеграм канал![В период турбулентности рынка в 2020 году, вызванной COVID-19, стратегии RobustSPO (при [latex]\rho = 0.1[/latex]) и SPO+ с учетом комиссий продемонстрировали практически идентичные траектории чистой стоимости активов, что указывает на высокую степень согласованности в принятии решений по формированию портфеля в условиях экстремального стресса, и подтверждает, что в подобных ситуациях решение SPO+ с учетом комиссий уже обладает достаточной степенью консервативности благодаря ограничивающим факторам и штрафам за транзакционные издержки, нивелируя потребность в дополнительной устойчивости.](https://arxiv.org/html/2601.04062v1/figures/2020COVID.png)
Применение принципов обучения, ориентированного на принятие решений (Decision-Focused Learning), для повышения эффективности и устойчивости инвестиционных стратегий с учетом транзакционных издержек и рисков.
Не всегда повышение точности прогнозов доходности напрямую приводит к улучшению качества инвестиционных решений, особенно с учетом реальных транзакционных издержек и ограничений. В данной работе, посвященной парадигме ‘Smart Predict—then—Optimize Paradigm for Portfolio Optimization in Real Markets’, предлагается подход, ориентированный на прямое согласование цели обучения с качеством принимаемых инвестиционных решений, а не на точечную точность прогнозирования. Показано, что обучение моделей с использованием разработанной функции потерь, отражающей эффективность инвестиций, позволяет добиться устойчивого улучшения риск-скорректированной доходности и повышения устойчивости стратегии в различных рыночных условиях. Можно ли, используя подобный подход, создать более надежные и эффективные инвестиционные стратегии, адаптированные к непредсказуемости современных финансовых рынков?
Пределы Традиционной Оптимизации Портфеля
Классические методы оптимизации портфеля, такие как Mean-Variance Optimization (MVO), опираются на упрощающие предположения о доходности активов, что зачастую приводит к неоптимальным результатам в реальных рыночных условиях. В частности, MVO предполагает нормальное распределение доходности и постоянную ковариацию между активами, что редко соответствует действительности. Рынки демонстрируют «толстые хвосты» — более высокую вероятность экстремальных событий, чем предсказывает нормальное распределение, и ковариация между активами меняется со временем. Эти упрощения приводят к недооценке рисков и формированию портфелей, которые могут показать неудовлетворительные результаты при неблагоприятном стечении обстоятельств. В результате, инвесторы, полагающиеся исключительно на MVO, могут столкнуться с неожиданными потерями и не достичь желаемого уровня доходности.
Традиционные методы оптимизации портфеля, такие как оптимизация по среднему и дисперсии, часто сталкиваются с трудностями при учете сложной динамики рынка и подвержены значительным рискам из-за ошибок в оценке параметров. Неточности в прогнозировании ожидаемой доходности, волатильности или корреляции между активами могут привести к формированию портфелей, существенно отличающихся от оптимальных в реальных условиях. Это особенно критично в периоды высокой рыночной неопределенности или при работе с неликвидными активами, где исторические данные могут быть нерепрезентативными. В результате, даже незначительные погрешности в исходных данных способны привести к значительным потерям и снижению общей эффективности инвестиционной стратегии, подчеркивая необходимость разработки более устойчивых и адаптивных подходов к управлению портфелем.
Традиционные методы оптимизации портфеля, как правило, основаны на анализе данных за определенный исторический период, что делает их неспособными эффективно реагировать на меняющиеся рыночные условия. Исследования показывают, что статические портфели, сформированные на основе фиксированных параметров, часто демонстрируют ухудшение результатов в периоды повышенной волатильности или смены трендов. Отсутствие адаптивности приводит к тому, что оптимальное распределение активов, рассчитанное ранее, перестает соответствовать текущей рыночной реальности, снижая потенциальную доходность и увеличивая риск убытков. Более того, игнорирование динамики рынка может привести к упущению новых возможностей и неэффективному использованию капитала, особенно в долгосрочной перспективе. Таким образом, статичность традиционных подходов является существенным ограничением, препятствующим достижению устойчивой и эффективной инвестиционной стратегии.
Прогнозная Сила: Использование Моделей Временных Рядов
Продвинутые модели временных рядов, включая рекуррентные нейронные сети (RNN) и архитектуры Transformer, представляют собой мощный инструмент для прогнозирования доходности активов и улучшения построения инвестиционных портфелей. RNN, благодаря своей способности обрабатывать последовательные данные, эффективно выявляют зависимости во временных рядах, в то время как Transformer-архитектуры, использующие механизм внимания, позволяют моделировать долгосрочные зависимости и параллельно обрабатывать данные, что повышает точность прогнозов. Применение этих моделей позволяет не только предсказывать будущую доходность, но и оптимизировать распределение активов в портфеле для достижения заданных целей по доходности и риску, что особенно важно в условиях высокой волатильности рынков.
Модели временных рядов, такие как рекуррентные нейронные сети и архитектуры Transformer, способны выявлять сложные закономерности и зависимости в исторических данных финансовых активов. Обучение на больших объемах данных позволяет им учитывать нелинейные взаимосвязи, сезонность, тренды и другие факторы, влияющие на доходность. В отличие от простых статистических методов, эти модели могут автоматически извлекать и учитывать взаимосвязи между различными временными точками и переменными, что приводит к повышению точности прогнозов по сравнению с моделями, основанными на предположении о линейности или стационарности данных. Например, модель может выявить, что определенная комбинация предыдущих значений актива, а также внешних факторов, таких как макроэкономические показатели, коррелирует с будущей доходностью, что позволяет улучшить прогноз.
Прогнозирование доходности активов само по себе недостаточно для эффективного управления портфелем. Для реализации реальной силы принятия решений необходимо интегрировать процесс прогнозирования с задачами оптимизации. Такая интеграция позволяет не просто предсказывать будущую доходность, но и определять оптимальное распределение активов в портфеле, учитывая риски, ограничения и инвестиционные цели. Эффективная система управления портфелем должна включать в себя алгоритмы оптимизации, которые используют прогнозы доходности в качестве входных данных для максимизации ожидаемой доходности при заданном уровне риска или минимизации риска при заданном уровне доходности. Без такой интеграции, даже точные прогнозы не приведут к улучшению результатов инвестирования.
Принятие Решений на Первом Плане: Согласование Прогнозирования и Оптимизации
Обучение, ориентированное на принятие решений (Decision-Focused Learning, DFL) представляет собой принципиально новый подход к управлению портфелем, в котором оптимизация инвестиционных решений осуществляется напрямую на основе качества прогнозов. В отличие от традиционных методов, где прогнозы используются как входные данные для последующей оптимизации, DFL интегрирует эти два процесса, делая акцент на максимизации итоговой прибыли, а не на точности прогноза как таковой. Это означает, что модель обучается не просто предсказывать будущие цены активов, но и выбирать оптимальные действия с учетом возможных ошибок прогнозирования, что позволяет повысить устойчивость портфеля к рыночным колебаниям и улучшить итоговые финансовые результаты.
Метод “Умное Предсказание, Затем Оптимизация” (Smart Predict-Then-Optimize, SPO) является расширением парадигмы обучения, ориентированного на принятие решений (Decision-Focused Learning, DFL). В SPO, задача оптимизации портфеля не рассматривается как отдельный этап после получения прогнозов, а интегрируется непосредственно в цикл обучения модели. Это означает, что оптимизация становится частью функции потерь, что позволяет модели учиться одновременно прогнозировать будущие изменения и находить оптимальные решения для портфеля, учитывая эти прогнозы. Этот замкнутый цикл обучения позволяет модели адаптироваться к динамике рынка и улучшать качество принимаемых решений, поскольку процесс оптимизации влияет на процесс обучения прогнозирования и наоборот.
В рамках Smart Predict-Then-Optimize (SPO) подхода, использование линейных предикторов, включающих такие технические индикаторы как MACD, RSI и простые скользящие средние, способствует повышению интерпретируемости и устойчивости модели. Линейные модели, в отличие от более сложных нелинейных, позволяют четко отслеживать влияние каждого индикатора на принимаемые решения по формированию портфеля. Это облегчает анализ и валидацию модели, а также повышает ее надежность в различных рыночных условиях. Включение данных индикаторов в процесс обучения позволяет модели более эффективно выявлять закономерности и строить прогнозы, что, в свою очередь, улучшает качество оптимизации портфеля.
Интеграция формулировок портфельной оптимизации и учет транзакционных издержек значительно повышают реалистичность и практическую применимость подхода. Модель SPO+ учитывает ограничения, характерные для реальных рыночных условий, включая комиссии брокеров и спреды, что позволяет получить более точные оценки эффективности портфеля. В ходе тестирования SPO+ демонстрировала стабильное улучшение качества принимаемых инвестиционных решений и повышение доходности с учетом риска по сравнению с традиционными методами оптимизации портфеля. Данное улучшение наблюдалось на различных временных горизонтах и при использовании различных классов активов, что подтверждает универсальность и надежность предложенного подхода.
Устойчивость и Управление Рисками: Навигация в Неопределенности
Оптимизация устойчивого портфеля учитывает присущую неопределенность доходности активов, рассматривая множество возможных сценариев развития событий. Вместо того, чтобы полагаться на единственную прогнозную оценку, данный подход предполагает, что будущие показатели могут существенно отличаться от ожидаемых, и стремится построить портфель, который сохранит свою эффективность даже в неблагоприятных условиях. В рамках этой стратегии формируется так называемое «множество неопределенности», включающее различные варианты развития рыночной ситуации, и портфель оптимизируется с учетом наихудшего из этих сценариев. Это позволяет существенно снизить риски, связанные с ошибками прогнозирования, и обеспечить более стабильную доходность в долгосрочной перспективе, особенно в периоды высокой волатильности и экономической нестабильности. Такой подход обеспечивает защиту от неблагоприятных рыночных условий, позволяя инвесторам сохранять капитал и достигать своих финансовых целей даже в условиях повышенной неопределенности.
Дистрибутивная робастная оптимизация представляет собой мощный инструментарий, позволяющий явно учитывать неопределенность в распределении параметров модели. В отличие от традиционных подходов, полагающихся на точечные оценки, данный метод рассматривает параметры как случайные величины, описываемые вероятностным распределением. Это позволяет строить стратегии, устойчивые к отклонениям от ожидаемых значений и менее подверженные риску неблагоприятных сценариев. Использование дистрибутивной робастной оптимизации особенно ценно в условиях неполной информации или нестабильности рынков, поскольку позволяет явно моделировать и минимизировать потенциальные потери, связанные с неопределенностью в параметрах, формируя более надежные и эффективные портфели.
Условное значение в риске (CVaR) представляет собой ключевой показатель для оценки потенциальных убытков, превышающих заданный порог, и является более чувствительным к «хвосту» распределения, чем стандартное отклонение или Value-at-Risk (VaR). В отличие от VaR, который лишь указывает на уровень потерь, которые не будут превышены с определенной вероятностью, CVaR рассчитывает среднее значение потерь в худшем сценарии. CVaR = E[X | X \leq VaR_{\alpha}(X)] , где X — случайная величина, представляющая убытки, а VaR_{\alpha}(X) — Value-at-Risk на уровне α. Таким образом, CVaR предоставляет более полную картину риска, позволяя инвесторам и управляющим активами лучше понимать и контролировать потенциальные потери, особенно в периоды повышенной волатильности рынка и экстремальных событий.
Оценка эффективности и устойчивости стратегий управления портфелем в реалистичных рыночных условиях требует применения методов бэктестинга с использованием скользящего окна. Данный подход позволяет проверить, как стратегия адаптируется к изменяющимся рыночным условиям и насколько она способна смягчить потенциальные потери. В ходе тестирования модель RobustSPO (с параметром ρ=0.1) продемонстрировала максимальную просадку менее 10% в период пандемии COVID-19, что существенно ниже, чем у стандартного подхода “Предсказать, а затем оптимизировать”, где максимальная просадка превысила 30%. Такое превосходство подтверждает способность RobustSPO более эффективно управлять рисками в условиях высокой волатильности и неопределенности, обеспечивая более стабильную доходность портфеля.
Будущее Интеллектуального Распределения Активов
Глубокое обучение с подкреплением (DRL) представляет собой перспективный подход к автоматизации стратегий распределения активов в инвестиционных портфелях и адаптации к изменяющимся рыночным условиям. В отличие от традиционных методов, требующих ручной настройки и периодической перебалансировки, DRL позволяет агенту самостоятельно обучаться оптимальному поведению посредством взаимодействия с историческими данными и симуляциями рынка. Агент, используя алгоритмы обучения с подкреплением, исследует различные стратегии, максимизируя ожидаемую доходность при заданном уровне риска. Эта способность к самообучению и адаптации особенно ценна в периоды высокой волатильности и непредсказуемости, позволяя портфелю динамически реагировать на изменения и минимизировать потенциальные убытки. В результате, DRL открывает возможности для создания интеллектуальных инвестиционных систем, способных превосходить традиционные подходы и обеспечивать более стабильные и высокие показатели доходности.
Методы дифференцируемого распределения активов позволяют осуществлять сквозную оптимизацию весов портфеля, значительно упрощая инвестиционный процесс. В отличие от традиционных подходов, требующих ручной настройки и отдельных этапов оптимизации, дифференцируемые методы интегрируют процесс принятия решений об инвестициях в единую, оптимизируемую функцию. Это позволяет алгоритму автоматически адаптировать распределение активов к изменяющимся рыночным условиям и целям инвестора. По сути, вместо последовательного выполнения отдельных шагов, система непрерывно корректирует веса активов, стремясь к максимальной доходности при заданном уровне риска, что повышает эффективность и скорость реагирования на динамику рынка. Такой подход открывает возможности для создания более гибких и адаптивных инвестиционных стратегий, способных эффективно работать в различных экономических сценариях.
Применение метода Softmax Allocation в алгоритмах распределения портфеля способствует не только повышению стабильности модели, но и ее большей прозрачности. В отличие от жестких ограничений или дискретных выборов, Softmax Allocation позволяет назначать веса активам в виде вероятностного распределения. Это означает, что модель не просто выбирает активы для включения в портфель, а определяет степень их участия, смягчая влияние отдельных рыночных колебаний. Такой подход предотвращает резкие изменения в структуре портфеля, снижая риск неоптимальных решений, особенно в периоды высокой волатильности. Кроме того, вероятностная интерпретация весов упрощает понимание логики работы модели и позволяет инвесторам оценить вклад каждого актива в общий результат, повышая доверие к автоматизированной системе управления портфелем.
Сочетание передовых методов, таких как глубокое обучение с подкреплением, дифференцируемое распределение активов и аллокация на основе Softmax, позволяет создавать принципиально новые, интеллектуальные системы управления инвестиционным портфелем, демонстрирующие превосходную доходность с учетом риска. В частности, модель SPO+ показала среднегодовую доходность в 14,05% и коэффициент Шарпа 0,785, превосходя базовый подход PtO как в период кризиса, вызванного COVID-19, так и в периоды рыночного роста. Коэффициент Sortino, равный 0,728, подтверждает устойчивость модели к негативным колебаниям рынка и ее способность обеспечивать стабильную прибыль даже в сложных экономических условиях.
Исследование демонстрирует, что согласование целей обучения непосредственно с принятием инвестиционных решений, используя подход, ориентированный на принятие решений, последовательно улучшает результаты и устойчивость портфеля в различных рыночных условиях. Это подтверждает древнюю мудрость, выраженную Аристотелем: “Цель есть начало всякого действия”. Как и в искусстве, где гармония достигается через точное соответствие замысла и исполнения, так и в управлении портфелем, фокусировка на конечном результате — оптимизации решений — позволяет достичь большей эффективности и устойчивости. Подход «предсказать, а затем оптимизировать», если он не ориентирован на принятие решений, подобен изящной форме без функциональной основы — красив, но лишен истинной ценности. Элегантность в управлении капиталом заключается в ясности цели и точности ее достижения.
Куда Далее?
Представленная работа, хотя и демонстрирует преимущество подхода “Предскажи, а затем Оптимизируй”, ориентированного на принятие решений, всё же не избавляет от фундаментальной неопределённости, присущей финансовым рынкам. Элегантность решения не должна заслонять тот факт, что даже наиболее изощрённые модели — лишь приближения к реальности. Дальнейшие исследования должны быть направлены на повышение робастности алгоритмов в условиях экстремальных, непредсказуемых событий — так называемых “чёрных лебедей”.
Особый интерес представляет вопрос о взаимодействии между обучением и транзакционными издержками. Часто, стремление к минимальным издержкам приводит к упрощению моделей, что, в свою очередь, снижает их способность к адаптации. Необходимо найти баланс между сложностью алгоритма и его практической реализуемостью, учитывая, что “красота” решения проявляется не только в математической точности, но и в его экономическом обосновании.
В конечном счете, задача оптимизации портфеля — это не просто поиск оптимальной точки в многомерном пространстве, а создание системы, способной к непрерывному обучению и адаптации. Истинная ценность заключается не в краткосрочной прибыли, а в долгосрочной устойчивости и способности сохранять свою функциональность в меняющихся условиях. Долговечность и понятность системы — вот признак истинного мастерства.
Оригинал статьи: https://arxiv.org/pdf/2601.04062.pdf
Связаться с автором: https://www.linkedin.com/in/avetisyan/
Смотрите также:
- Стоит ли покупать фунты за йены сейчас или подождать?
- Будущее эфириума: прогноз цен на криптовалюту ETH
- Что такое дивидендный гэп и как на этом заработать
- Российский рынок в 2026: риски, возможности и дивидендные акции (08.01.2026 20:32)
- МосБиржа под давлением геополитики: что ждет инвесторов в 2026 году? (05.01.2026 21:32)
- Газпром акции прогноз. Цена GAZP
- Bitcoin ETF: Отток $681Млн и Сигналы Разворота – Что Ждет Инвесторов? (11.01.2026 13:45)
- НЛМК акции прогноз. Цена NLMK
- Инвестиционный обзор и ключевые инвестиционные идеи воскресенье, 11 января 2026 9:46
- Золото прогноз
2026-01-08 06:49