Единая модель – множество стратегий: прогнозирование спроса с учетом дефицита и затрат

Автор: Денис Аветисян


Новый подход к прогнозированию розничного спроса позволяет оптимизировать запасы и снизить общие затраты, учитывая риски возникновения дефицита товаров.

"Покупай на слухах, продавай на новостях". А потом сиди с акциями никому не известной биотех-компании. Здесь мы про скучный, но рабочий фундаментал.

Бесплатный Телеграм канал
Наблюдаемые ряды еженедельных продаж товаров в пяти магазинах демонстрируют разнообразие в масштабе, прерывистости, сезонности и задержке начала продаж, подчеркивая сложность анализа и прогнозирования потребительского спроса.
Наблюдаемые ряды еженедельных продаж товаров в пяти магазинах демонстрируют разнообразие в масштабе, прерывистости, сезонности и задержке начала продаж, подчеркивая сложность анализа и прогнозирования потребительского спроса.

В статье представлено решение-победитель конкурса VN2, демонстрирующее эффективность глобальной модели на основе CatBoost и стратегии учета затрат при формировании заказов.

Эффективное прогнозирование розничного спроса осложняется асимметрией дефицита и затратами на хранение запасов. В работе, озаглавленной ‘One Global Model, Many Behaviors: Stockout-Aware Feature Engineering and Dynamic Scaling for Multi-Horizon Retail Demand Forecasting with a Cost-Aware Ordering Policy (VN2 Winner Report)’, представлено решение-победитель конкурса VN2, основанное на единой глобальной модели прогнозирования, реализованной с помощью алгоритма CatBoost, и политике управления запасами, учитывающей издержки. Предложенный подход, включающий учет отсутствия товаров на складе и динамическое масштабирование временных рядов, позволил минимизировать общие затраты в условиях недельного цикла принятия решений. Можно ли адаптировать данную стратегию к реальным бизнес-сценариям с более сложными ограничениями и динамикой спроса?


Неуловимый Спрос: Вызовы Прерывистых Потоков

Традиционные методы управления запасами часто оказываются неэффективными при работе с товарами, характеризующимися нерегулярным и прерывистым спросом — явлением, широко распространенным в современной коммерции. В отличие от стабильного спроса, когда можно полагаться на статистические прогнозы, редкие заказы и длительные периоды отсутствия заказов приводят к значительным погрешностям в прогнозировании. Это создает серьезные трудности для предприятий, поскольку стандартные алгоритмы оптимизации запасов, рассчитанные на непрерывный поток заказов, не учитывают специфику такого спроса. В результате, компании сталкиваются с необходимостью поддерживать избыточные запасы для предотвращения дефицита, что приводит к увеличению затрат на хранение и риску устаревания продукции, или же несут убытки из-за упущенных продаж, когда товар отсутствует на складе.

Непредсказуемость спроса, характеризующаяся редкими, но значительными всплесками, приводит к серьезным ошибкам в прогнозировании. В результате, предприятия сталкиваются с дилеммой: избыточные запасы, требующие значительных затрат на хранение и приводящие к обесцениванию продукции, или же дефицит товаров, что неминуемо ведет к упущенной прибыли и недовольству клиентов. Такая ситуация особенно актуальна для товаров с длительным сроком хранения или ограниченным сроком годности, где точность прогнозирования напрямую влияет на финансовые показатели и репутацию компании. Эффективное управление запасами при нерегулярном спросе требует применения специализированных методов прогнозирования, учитывающих статистические особенности подобных данных, и адаптации стратегий пополнения запасов к конкретным условиям рынка.

Точное прогнозирование паттернов прерывистого спроса является ключевым фактором для оптимизации уровней запасов и минимизации общих затрат. Неспособность адекватно предсказать редкие, но необходимые поставки, приводит к избыточным запасам, замораживающим капитал и увеличивающим расходы на хранение, или же, наоборот, к упущенной выгоде из-за дефицита товара. Эффективное прогнозирование позволяет предприятиям поддерживать оптимальный баланс между доступностью продукции и снижением издержек, что особенно важно для товаров с низкой частотой заказов, где традиционные методы прогнозирования часто оказываются неэффективными. Внедрение специализированных алгоритмов и статистических моделей, учитывающих особенности прерывистого спроса, позволяет значительно повысить точность прогнозов и, как следствие, улучшить финансовые показатели компании.

Двухступенчатое Решение: Прогнозируем, Затем Оптимизируем

Мы используем двухэтапный конвейер “прогнозирование, затем оптимизация”, разделяя процесс прогнозирования спроса от процесса принятия решений о заказе. Такое разделение позволяет использовать специализированные модели, оптимизированные для каждой конкретной задачи. Первый этап фокусируется на предсказании будущего спроса, а второй — на определении оптимального объема заказов, учитывая прогнозы и другие факторы, такие как стоимость хранения и затраты на заказ. Это позволяет повысить точность прогнозов и гибкость системы управления запасами, поскольку изменения в прогнозах не требуют переработки всей системы принятия решений.

Разделение процесса прогнозирования от процесса принятия решений о заказе позволяет использовать специализированные модели, оптимизированные для каждой конкретной задачи. Использование отдельных моделей повышает точность прогнозов за счет фокусировки на специфических характеристиках данных и алгоритмов, подходящих для каждого этапа. Такой подход также улучшает оперативность системы, поскольку каждая модель может быть независимо обучена и обновлена, что позволяет быстрее реагировать на изменения спроса и корректировать заказы в соответствии с текущей ситуацией. Это обеспечивает более эффективное управление запасами и снижение затрат, связанных с избыточными или недостаточными запасами.

Прогнозирование спроса на начальном этапе осуществляется посредством ‘Глобальной Модели Прогнозирования’, которая одновременно оценивает спрос на все наименования товаров. Данный подход позволяет учесть взаимосвязи между различными позициями и избежать независимого прогнозирования для каждого товара в отдельности. Модель использует исторические данные о продажах, сезонность, промоакции и другие факторы для формирования единого прогноза спроса, охватывающего весь ассортимент. Это обеспечивает более целостную и точную картину ожидаемого спроса, необходимую для последующей оптимизации заказов.

Улучшение Точности Прогноза с Помощью Продвинутых Методик

В основе нашей модели прогнозирования лежит алгоритм CatBoost, представляющий собой метод градиентного бустинга на деревьях решений. CatBoost характеризуется высокой точностью и устойчивостью к переобучению благодаря использованию упорядоченного бустинга и эффективной обработке категориальных признаков. В отличие от других алгоритмов градиентного бустинга, CatBoost автоматически обрабатывает категориальные признаки, что упрощает процесс подготовки данных и повышает качество прогнозов. Данный алгоритм оптимизирован для работы с большими объемами данных и демонстрирует стабильно высокие результаты в задачах прогнозирования временных рядов.

Многошаговый прогноз (Multi-Horizon Forecasting) представляет собой метод, при котором модель предсказывает спрос на несколько будущих временных шагов одновременно, а не последовательно, шаг за шагом. В отличие от итеративных подходов, где ошибка на каждом шаге накапливается и влияет на последующие прогнозы, многошаговый прогноз обучает отдельную модель для каждого шага прогнозирования. Это позволяет учитывать взаимосвязи между различными временными горизонтами и значительно повышает точность прогнозирования на долгосрочной перспективе, что критически важно для оптимизации планирования запасов, производства и логистики. Применение данного метода позволяет более эффективно реагировать на изменения спроса и минимизировать риски, связанные с неточным прогнозированием.

В процессе построения прогнозов активно используется разработка признаков (feature engineering) для извлечения информативных сигналов из исходных данных. Особое внимание уделяется методу взвешивания наблюдений с учетом временного распада (Time-Decayed Observation Weighting), который позволяет придать больший вес недавним значениям спроса. Данный подход основан на предположении, что недавние данные более релевантны для прогнозирования будущего спроса, чем устаревшие. Вес каждого наблюдения экспоненциально уменьшается с течением времени, что позволяет модели более эффективно учитывать динамику спроса и повышает точность прогнозов.

Стоимостной Подход к Заказам для Оптимального Уровня Запасов

Разработанная политика управления заказами учитывает два ключевых типа затрат — затраты на хранение запасов и затраты, связанные с дефицитом товаров. Затраты на хранение включают в себя расходы на содержание склада, страхование, устаревание и порчу продукции. В то же время, затраты, возникающие из-за дефицита, охватывают упущенную прибыль от несбыта, а также потенциальный ущерб репутации компании из-за неспособности удовлетворить спрос клиентов. Оптимизируя баланс между этими двумя типами затрат, система позволяет определить оптимальный размер заказа, минимизируя общие издержки и обеспечивая эффективное управление запасами. Такой подход позволяет избежать как избыточного накопления товаров, приводящего к увеличению затрат на хранение, так и недостатка, который может негативно сказаться на объеме продаж и лояльности клиентов.

Данная методика управления запасами опирается на принципы задачи «Новостного торговца», позволяя эффективно сбалансировать риски, связанные с избытком и дефицитом товарных позиций. Суть подхода заключается в определении оптимального объема заказа, учитывающего вероятность потери прибыли из-за нераспроданного товара (переизбытка) и упущенной выгоды из-за невозможности удовлетворить спрос (дефицита). В рамках данной модели проводится оценка затрат, связанных с каждым из сценариев, и формируется стратегия, минимизирующая суммарные издержки. Использование этой концепции позволяет принимать взвешенные решения, адаптированные к конкретным условиям рынка и особенностям спроса, обеспечивая более эффективное управление запасами и снижение финансовых потерь.

Учет времени поставки и целевого уровня обслуживания является ключевым аспектом поддержания оптимального уровня запасов при минимальных затратах. Разработанная методика позволяет не только прогнозировать спрос, но и учитывать временные задержки в поставках, гарантируя наличие необходимого количества товара для удовлетворения потребностей клиентов. В ходе тестирования на VN2 benchmark, внедрение данной стратегии привело к значительному снижению общих затрат на 13.2%, уменьшив их с 4.334€ до 3.763€. Это свидетельствует об эффективности подхода в управлении запасами и его потенциале для оптимизации логистических процессов, обеспечивая баланс между издержками на хранение и риском дефицита.

Исследование демонстрирует, что создание единой, глобальной модели прогнозирования спроса, способной адаптироваться к различным временным горизонтам, является ключом к эффективному управлению запасами. Это особенно актуально в условиях, когда точность прогноза напрямую влияет на общую стоимость, включая затраты на хранение и упущенную выгоду от дефицита товаров. Как однажды заметил Пол Эрдёш: «Математика — это не просто язык, это вселенная идей». Эта фраза отражает суть подхода, представленного в работе: универсальная математическая модель, адаптированная к специфическим условиям розничной торговли, позволяет находить оптимальные решения для сложных задач планирования запасов. Успешное применение CatBoost в данной работе подчеркивает важность выбора подходящих алгоритмов машинного обучения для решения задач прогнозирования.

Куда же дальше?

Представленная работа демонстрирует эффективность глобальной модели прогнозирования спроса, обученной на алгоритме CatBoost, в контексте планирования запасов. Однако, триумф любой системы — это лишь временная стадия ее старения. Успешное решение одной задачи неизбежно выявляет новые, более тонкие аспекты проблемы. Очевидно, что текущий подход, хотя и эффективен, опирается на предположение о стационарности структуры ошибок. Но рынок, как известно, не любит стагнации. Будущие исследования должны быть направлены на адаптацию модели к меняющимся условиям, учитывая нелинейные зависимости и внешние факторы, которые сегодня остаются за кадром.

Особый интерес представляет вопрос о масштабируемости предложенного решения. Глобальная модель, безусловно, элегантна, но ее вычислительная сложность растет вместе с объемом данных и количеством SKU. Поиск баланса между точностью прогноза и скоростью вычислений — это постоянная дилемма, требующая инновационных подходов к архитектуре модели и оптимизации алгоритмов. К тому же, цензурирование данных о спросе, хоть и эффективно, скрывает информацию о реальном поведении потребителей. Изучение способов извлечения полезных сигналов из этой “тени” может привести к еще более точным прогнозам.

В конечном итоге, важно помнить: прогнозирование — это не попытка предсказать будущее, а скорее — попытка подготовиться к нему. Инциденты в цепочке поставок — это не провалы системы, а ее шаги к зрелости. Именно анализ этих “ошибок” и позволяет улучшать модель и повышать устойчивость к неопределенности. Время — это не метрика, а среда, в которой система учится и адаптируется.


Оригинал статьи: https://arxiv.org/pdf/2601.18919.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2026-01-28 13:14