Оптимизация инвестиционного портфеля во времени: новый подход

Автор: Денис Аветисян

В статье представлена методика построения портфельных стратегий, учитывающих изменения предпочтений инвестора во времени и нестабильные ставки дисконтирования.

"Покупай на слухах, продавай на новостях". А потом сиди с акциями никому не известной биотех-компании. Здесь мы про скучный, но рабочий фундаментал.

Бесплатный Телеграм канал

Разработанная модель обеспечивает оптимальные стратегии, основанные на принципе согласованности во времени и максимизации полезности с учетом взвешенной ставки дисконтирования.

Непостоянные во времени ставки дисконтирования часто приводят к противоречиям в задачах оптимального управления портфелем. В работе ‘Time consistent portfolio strategies for a general utility function’ исследуется проблема управления портфелем в условиях неконстантной ставки дисконтирования и общей функции полезности. Показано, что стратегии, оптимальные во времени (subgame perfect), совпадают с оптимальными при использовании ставки дисконтирования, взвешенной функцией полезности $\rho(t,x)$ . Каким образом предложенный подход может быть расширен для учета транзакционных издержек и неполных рынков?

Временные предпочтения и планирование: Зачем нужна эта головная боль?

Традиционные экономические модели часто оперируют постоянными или внешне заданными ставками дисконтирования, что не позволяет в полной мере отразить изменчивость предпочтений во времени. Предположение о неизменной оценке будущих благ упрощает анализ, однако игнорирует тот факт, что люди склонны пересматривать свои приоритеты в зависимости от текущей ситуации и перспектив. Например, в периоды экономической нестабильности или личных кризисов, горизонт планирования может существенно сокращаться, а значимость будущих вознаграждений — снижаться. Данное ограничение препятствует построению реалистичных моделей поведения, особенно при анализе долгосрочных инвестиций, пенсионных накоплений или экологических стратегий, где учет динамики предпочтений является критически важным для достижения оптимальных результатов. Более сложные модели стремятся заменить фиксированную ставку дисконтирования на переменную, отражающую индивидуальные особенности и контекст принятия решений.

Основополагающим принципом рационального экономического поведения является максимизация суммарной полезности во времени — интеграл удовлетворения, полученного от потребления и инвестиций на протяжении всей жизни. В рамках этой концепции, индивид стремится распределить свои ресурсы таким образом, чтобы получить максимальное общее удовлетворение, учитывая не только текущие потребности, но и будущие. Именно стремление к максимизации этой интегральной полезности определяет оптимальные решения о потреблении, сбережениях и инвестициях, формируя основу для анализа долгосрочного экономического планирования и прогнозирования. Понимание этого процесса позволяет моделировать поведение экономических агентов и предсказывать их реакции на различные стимулы и изменения в экономической среде, что имеет решающее значение для разработки эффективных экономических стратегий и политик.

В основе анализа межвременного выбора лежит чётко определённая функция полезности, обеспечивающая как возрастающую общую выгоду от потребления во времени, так и убывающую предельную полезность от каждой дополнительной единицы этого потребления. Данный принцип отражает фундаментальную экономическую концепцию: хотя увеличение общего количества потреблённых благ в течение жизни приносит удовлетворение, ценность каждой последующей единицы блага снижается. $U(c_1, c_2, ..., c_T) = \sum_{t=1}^{T} \beta^t u(c_t)$ , где $u(c_t)$ представляет собой мгновенную полезность от потребления в момент времени t, а β — коэффициент дисконтирования. Понимание этой взаимосвязи критически важно для моделирования оптимальных решений о потреблении и инвестициях, поскольку позволяет учесть, что индивид будет стремиться максимизировать совокупную полезность, балансируя между текущим и будущим потреблением, при этом учитывая, что ценность будущего потребления дисконтируется.

Традиционные модели экономического анализа часто опираются на фиксированные коэффициенты дисконтирования, что ограничивает их способность адекватно отражать изменяющиеся во времени предпочтения. Данная работа предлагает принципиально новый подход, заменяя стандартный коэффициент дисконтирования на его динамически взвешенную версию, $ρ(t,x)$ . Это позволяет учесть, что ценность будущих благ зависит не только от времени, но и от текущего состояния системы и получаемой полезности. Введение функции дисконтирования, зависящей от времени и состояния, открывает возможности для более точного моделирования поведения агентов, стремящихся максимизировать суммарную полезность во времени, и, как следствие, для получения более реалистичных прогнозов в области потребления и инвестиций. Такой подход позволяет выйти за рамки упрощенных предположений о постоянстве предпочтений и приблизиться к более адекватному описанию динамики экономических процессов.

Ставка дисконтирования, взвешенная по полезности: Шаг к реальности

В данной работе вводится ставка дисконтирования, взвешенная по полезности — $ρ(t,x)$ , которая заменяет традиционный постоянный коэффициент дисконтирования. В отличие от стандартного подхода, где предпочтения агента отражаются лишь в функции полезности, предложенная ставка $ρ(t,x)$ напрямую включает временные предпочтения в процесс дисконтирования будущих вознаграждений. Это позволяет более точно моделировать поведение агента, чьи предпочтения могут меняться во времени и зависеть от текущего состояния $x$ и момента времени $t$ . Использование $ρ(t,x)$ обеспечивает динамическое дисконтирование, учитывающее изменяющуюся оценку будущих выгод и затрат.

Основное новшество заключается во встраивании изменяющихся во времени предпочтений непосредственно в процесс дисконтирования. В отличие от традиционного использования постоянного коэффициента дисконтирования, предлагаемый подход определяет ставку дисконтирования $ρ(t,x)$ итеративно, как неподвижную точку. Это означает, что ставка дисконтирования вычисляется таким образом, чтобы обеспечить согласованность между текущими предпочтениями агента и его оптимальным поведением в будущем. Итерационный процесс продолжается до достижения сходимости, гарантируя, что ставка дисконтирования отражает динамически изменяющиеся предпочтения агента в каждый момент времени $t$ и при заданном состоянии $x$ .

Вычисление предлагаемой ставки дисконтирования $\rho(t,x)$ осуществляется посредством итеративного решения задачи нахождения неподвижной точки. Данный подход обеспечивает согласованность между изменяющимися во времени предпочтениями агента и его оптимальным поведением. Итеративный процесс продолжается до достижения сходимости, то есть до тех пор, пока последовательные приближения к ставке дисконтирования не перестанут существенно изменяться. Это гарантирует, что выбранная ставка дисконтирования отражает внутреннюю оценку ценности будущих благ, максимизирующую функцию полезности агента в каждый момент времени, и, следовательно, соответствует его оптимальной стратегии принятия решений.

Предлагаемая ставка дисконтирования, учитывающая полезность, интегрируется в уравнение Гамильтона-Якоби-Беллмана (HJB) как неотъемлемая часть процесса динамического программирования. Замена стандартного постоянного коэффициента дисконтирования на $ρ(t,x)$ в HJB уравнении позволяет моделировать оптимальное поведение агента с учетом изменяющихся во времени предпочтений. Результирующее уравнение, включающее $ρ(t,x)$ , служит основой для итеративного решения, определяющего оптимальную стратегию и соответствующую ценностную функцию. Использование данной интеграции позволяет последовательно применять методы динамического программирования для анализа и решения задач оптимального управления с учетом индивидуальных предпочтений агента.

Динамическое программирование и вывод оптимальной политики: Доказательство концепции

Функция ценности $G(t,x)$ является ключевым элементом для определения временной согласованности стратегии потребления и инвестиций. Она представляет собой максимальную ожидаемую полезность, которую агент может получить, начиная с момента времени $t$ и состояния капитала $x$ , следуя оптимальной политике. По сути, $G(t,x)$ определяет оптимальное решение для каждой возможной траектории капитала и времени, учитывая текущие предпочтения агента и ограничения, накладываемые динамикой капитала. Определение этой функции является первым шагом в построении подгодовой совершенной стратегии, обеспечивающей оптимальное распределение ресурсов во времени и при неопределенности.

Динамика капитала моделируется явно, отражая взаимосвязь между потреблением, инвестициями и ростом активов. Это предполагает, что изменение капитала во времени $\Delta w$ определяется как сумма инвестиций $I_t$ , прирост активов $R_t w_t$ (где $R_t$ — доходность активов в период t, а $w_t$ — капитал в период t) и отрицательного потребления $-C_t$ . Таким образом, уравнение изменения капитала имеет вид: $\Delta w = I_t + R_t w_t - C_t$ . При этом, инвестиции и потребление являются управляемыми переменными, а доходность активов — стохастической, что позволяет анализировать оптимальную стратегию управления капиталом в условиях неопределенности и максимизации полезности от потребления.

Геометрическое броуновское движение (ГБД) широко используется для моделирования стохастической динамики богатства в экономических моделях благодаря своей способности описывать непрерывные изменения цен активов с учетом как дрейфа, так и волатильности. В рамках данной модели, изменение богатства $dW_t$ представляется как диффузионный процесс, где $dW_t$ является винеровским процессом. Математически, динамика богатства описывается стохастическим дифференциальным уравнением вида: $dx_t = \mu x_t dt + \sigma x_t dW_t$ , где μ — средняя доходность, σ — волатильность, а $x_t$ — величина богатства в момент времени $t$ . Использование ГБД позволяет аналитически исследовать оптимальные стратегии потребления и инвестирования, учитывая случайный характер рыночных условий и обеспечивая реалистичное представление о динамике богатства во времени.

Полученная стратегия совершенного под-игры (subgame perfect strategy), обоснованная уравнением Гамильтона-Якоби (HJB), представляет собой строгое решение для оптимального принятия решений в условиях неопределенности. Уравнение HJB является нелинейным дифференциальным уравнением в частных производных, которое выражает оптимальное значение функции $G(t,x)$ для каждого момента времени $t$ и уровня богатства $x$ . Решение этого уравнения определяет оптимальную политику потребления и инвестиций, максимизирующую ожидаемую полезность агента. Метод, основанный на HJB, обеспечивает последовательное решение, гарантируя, что оптимальные действия на каждом этапе учитывают будущие возможности и ограничения, возникающие из стохастической динамики богатства.

Влияние на распределение активов и потребление: Куда это всё ведёт?

Отношение потребления к богатству, являющееся ключевым показателем финансового поведения, непосредственно вытекает из функции ценности, отражая влияние индивидуальных предпочтений на уровень расходов. Данная зависимость выражается формулой $c<i>(t,y) = I0(y)/p̄(t,y)$ , где $c</i>(t,y)$ представляет оптимальный уровень потребления в момент времени t при заданном уровне богатства y, $I0(y)$ — функция, определяющая предпочтения индивида, а $p̄(t,y)$ — ценовой фактор. Таким образом, функция ценности позволяет понять, как изменения в предпочтениях, отраженные в $I0(y)$ , влияют на решения о потреблении, определяя, какую часть накопленного богатства индивид готов потратить в текущий момент времени.

Соотношение инвестиций к богатству, определяемое функцией ценности, раскрывает оптимальное поведение в отношении сбережений. Данная модель предполагает, что величина инвестиций $π*(t,y) = -θp̄y(t,y)/σp̄(t,y)$ напрямую зависит от параметров, отражающих неприятие риска (σ) и предпочтения, связанные с будущим потреблением (θ). Функция ценности, таким образом, позволяет понять, как индивид, стремясь максимизировать свою полезность, распределяет ресурсы между текущим потреблением и накоплениями для будущего. Более высокая склонность к сбережениям, отраженная в параметре θ, приводит к увеличению доли богатства, направляемой на инвестиции, в то время как повышенная неприятие риска (σ) может стимулировать более консервативные инвестиционные стратегии, направленные на сохранение капитала.

Предлагаемая модель обеспечивает более глубокое понимание распределения ресурсов индивидуумом во времени, учитывая динамику предпочтений. В отличие от традиционных подходов, предполагающих стабильность вкусов, данная структура позволяет анализировать, как меняющиеся жизненные обстоятельства и субъективные факторы влияют на решения о потреблении и сбережениях. Это позволяет более точно моделировать поведение людей в различных фазах жизненного цикла, а также учитывать индивидуальные особенности, такие как склонность к риску или горизонт планирования. В результате, становится возможным построение более реалистичных финансовых моделей и разработка персонализированных стратегий управления активами, адаптированных к конкретным предпочтениям и целям каждого человека. $c<i>(t,y) = I0(y)/p̄(t,y)$ и $π</i>(t,y) = -θp̄y(t,y)/σp̄(t,y)$ демонстрируют, как предпочтения, выраженные через функцию ценности, напрямую влияют на оптимальные уровни потребления и сбережений.

Предложенная методология не ограничивается общими принципами, но и позволяет разрабатывать разнообразные стратегии распределения активов, адаптированные к индивидуальным потребностям и предпочтениям. Основываясь на анализе функции ценности и оптимального поведения в отношении потребления и сбережений, становится возможным создание персонализированных финансовых планов. Данный подход учитывает не только текущее финансовое положение, но и долгосрочные цели, риск-профиль и горизонт планирования каждого конкретного инвестора. Это позволяет формировать портфели, которые максимизируют ожидаемую полезность, обеспечивая наиболее эффективное распределение ресурсов во времени и достижение желаемого уровня благосостояния. Таким образом, методология открывает новые возможности для более точного и индивидуализированного финансового планирования.

«`html

Исследование, представленное в работе, стремится к нахождению оптимальных стратегий управления портфелем во времени, учитывая непостоянные ставки дисконтирования. Эта погоня за совершенством, однако, неизбежно сталкивается с суровой реальностью: любая, даже самая элегантная теория, рано или поздно будет взломана практикой. Как говорил Нильс Бор: «Противоположности не противоречат друг другу, а дополняют». В контексте данной работы это означает, что стремление к теоретически оптимальной стратегии должно быть уравновешено признанием её уязвимости перед реальными рыночными условиями и неизбежным техническим долгом, который возникает при любой реализации. Идеальная стратегия, как мираж, всегда немного впереди, а задача практика — построить достаточно надежную систему, чтобы пережить её отсутствие.

Что дальше?

Представленная работа, конечно, элегантна. Найти связь между взвешенными дисконтами и подиграми совершенными стратегиями — это приятно. Но давайте будем честны: реальный мир не заботится об элегантности. Забудьте о гладких функциях полезности и постоянных дисконтах. Продакшен найдёт способ превратить любую, даже самую красивую теорию, в бесконечный поток тикетов в поддержку. Следующий шаг — это не усложнение модели, а её адаптация к хаосу. Необходимо исследовать робастность этих стратегий к шуму данных, ошибкам в оценке параметров и, что самое главное, к непредсказуемым действиям других участников рынка.

Особый интерес представляет вопрос о вычислительной сложности. Решение уравнения Гамильтона-Якоби-Беллмана — это всегда компромисс между точностью и временем вычислений. В реальности, портфельный управляющий должен принимать решения за доли секунды. Поэтому, следующий этап — это разработка приближённых методов, которые позволят получить достаточно хорошие решения за приемлемое время. Тесты, конечно, важны, но это лишь форма надежды, а не уверенности в том, что код не упадёт в самый неподходящий момент.

Автоматизация спасёт нас? Возможно. Но уже видела, как скрипт удалял прод. Будущие исследования должны сосредоточиться на создании систем, которые не только оптимизируют портфель, но и умеют адаптироваться к меняющимся условиям, обнаруживать и исправлять ошибки, и, главное, не падать по понедельникам. В конечном счёте, каждая «революционная» технология завтра станет техдолгом.

Оригинал статьи: https://arxiv.org/pdf/2602.18157.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2026-02-23 07:06