Вступ
Минулого літа одна з регіональних мереж електроніки опинилася в складній ситуації з надлишковим запасом кількох моделей ноутбуків середнього класу. Водночас вони абсолютно недооцінили попит на висококласні ігрові ноутбуки, що призвело до майже постійного відсутності товару на складах. Причина? Їхній застарілий підхід до прогнозування попиту здебільшого покладався на прості рухомі середні, які не змінювались роками. Бажаючи вирішити цю проблему, роздрібний продавець вирушив у нову подорож: поєднання методів часових рядів, класичного машинного навчання та, зрештою, моделей глибинного навчання для створення точніших прогнозів попиту. Згідно з даними McKinsey & Company (2022), бізнеси, які використовують сучасне AI-прогнозування, можуть покращити операційні маржі на 10–15%, що показує, як важливим може бути правильне планування попиту.
У цій статті ми розглянемо основні техніки побудови прогнозів попиту — від традиційних методів часових рядів до більш просунутих підходів з використанням глибинного навчання, а також практичні поради щодо масштабування та впровадження.
1. Основи часових рядів
Класичні моделі
- ARIMA/SARIMA: Чудово підходять для стабільних, передбачуваних сезонних патернів. ARIMA захоплює автокореляції в даних, а SARIMA розширює цю здатність, обробляючи чіткі сезонні цикли (наприклад, піки під час свят).
- Holt-Winters: Особливо ефективна для чітко виражених трендів і сезонності, але менш гнучка при раптових змінах.
Коли використовувати
- Сценарії з одним продуктом або одиничним SKU, де є чітко визначена і стабільна сезонність.
- Коротші горизонти, де зовнішні фактори (акції, макроекономічні тренди) мають мінімальний вплив.
Плюси та мінуси
- Плюси: Проста в використанні, порівняно легка для інтерпретації, мінімальні вимоги до даних.
- Мінуси: Погано справляється з множинними факторами попиту або раптовими змінами (наприклад, зниження цін у конкурентів, розпродажі).
2. Класичне машинне навчання
Методи регресії та ансамблеві методи
- Лінійна регресія/Elastic Net: Виявляє зв'язки, такі як еластичність ціни. Добре працює з ретельно розробленими ознаками.
- Random Forests, XGBoost: Деревоподібні ансамблі можуть виявляти складні взаємодії (наприклад, місце розташування магазину x рекламна кампанія) з меншою кількістю вручну створених ознак.
Інженерія ознак
- Включіть прапорці свят, витрати на маркетинг, погоду, ціни конкурентів — будь-який фактор, що може вплинути на продажі.
- Дані вчені часто відзначають, що ретельно продумана інженерія ознак може перевершити більш складні моделі з поганими ознаками.
Плюси та мінуси
- Плюси: Краще справляється з багатофакторними даними, ніж прості методи часових рядів. Масштабується для багатьох SKU чи місць продажу.
- Мінуси: Потребує надійних потоків даних, більше налаштувань гіперпараметрів та знання предметної області для створення ефективних ознак.
3. Підходи з використанням глибинного навчання
RNN, LSTM та GRU
- Розроблені для послідовних даних, захоплюючи залежності на великі відстані. Особливо корисні, якщо минулі події (наприклад, маркетингова кампанія минулого року) все ще впливають на поточний попит.
Темпоральна конволюція та трансформери
- Темпоральні конволюційні мережі (TCN): Ще один варіант для послідовних моделей, який може обробляти довші історії більш паралельно.
- Трансформери: Відомі завдяки проривам у обробці природної мови, вони поступово адаптуються до методів часового ряду. Ідеальні для великих наборів даних з складними, багатовимірними сигналами.
Масштабування та навчання
- З ростом обсягів даних хмарні середовища (AWS, Azure) стають необхідними для розподіленого навчання.
- Байєсівська оптимізація може систематично налаштовувати гіперпараметри (наприклад, швидкість навчання, розміри шарів) без виснажливих вручну пошуків.
Плюси та мінуси
- Плюси: Може моделювати складні взаємозв'язки та великі набори даних, потенційно перевершуючи простіші моделі машинного навчання в динамічних середовищах.
- Мінуси: Вартість інфраструктури та необхідність високої кваліфікації можуть бути значними. Перевантаження, якщо ваша система даних маленька чи стабільна.
## Впровадження та реальний час інференс
Чому це важливо
- Деякі роздрібні продавці оновлюють ціни кілька разів на день або перераховують розподіл постачання в майже реальному часі. Затримки в прогнозуванні можуть призвести до невідповідності запасів або пропущених можливостей для знижок.
Поради по впровадженню
- Контейнеризація (Docker, Kubernetes) для забезпечення сталих середовищ, що дозволяє легко масштабувати вгору або вниз залежно від попиту.
- Моніторинг: Відстежуйте помилки прогнозування з часом. Зміни у споживчій поведінці або динаміці конкурентів можуть викликати відхилення моделей, що вимагає періодичного перепідготовки.
Висновок (Частина 1)
Вибір методу прогнозування залежить від складності даних, бізнес-вимог і доступних ресурсів. Хоча традиційні методи часових рядів все ще добре працюють у передбачуваних середовищах, класичне машинне навчання та методи глибинного навчання здатні виявляти багатофакторні патерни і масштабуватися до тисяч SKU. Під час впровадження цих моделей варто врахувати компроміс між складністю моделі та операційною здійсненністю — найкраще рішення часто знаходиться на перехресті точності та практичного впровадження.
Що відбувається після того, як ви створили чудову модель прогнозування попиту? У Частині 2 ми розглянемо, як узгодити ці моделі з стратегіями ціноутворення, рішеннями щодо запасів і плануванням асортименту — та як виміряти реальний вплив від їх впровадження.
Джерела (Частина 1)
- McKinsey & Company, Reimagining Retail Inventory, 2022
- Deloitte, AI in Supply Chain, 2023
Перекладено з: Part 1: From Time Series to Deep Learning — Building Demand Forecasting Models