У сучасному світі, де динаміка ринку роздрібної торгівлі розвивається з неймовірною швидкістю, здатність точно прогнозувати тенденції продажів стає ключовим фактором для успіху бізнесу. Застосування алгоритмів машинного навчання та аналізу часових рядів відкриває нові можливості для розуміння та передбачення ринкових тенденцій.
Актуальність теми роботи: В умовах зростаючої конкуренції та змін у споживчих попитах, прогнозування продажів стає критично важливим для бізнесу, дозволяючи оптимізувати запаси, планувати ресурси та забезпечити ефективне управління
В дослідженні [1] підкреслюється важливість точного прогнозування продажів для великих рітейлерів, таких як Walmart та Amazon. Використовуючи новий підхід, який враховує унікальний вплив компонентів тренду та сезонності на часові ряди, автори пропонують групувати часові ряди на основі цього показника.
В дослідженні [2] автор представляє гібридну модель, що поєднує переваги LightGBM та Prophet моделі. LightGBM використовується для виявлення складних нелінійних відносин у великих наборах даних.
Набір даних M5 Retail Forecasting, який використовується для роботи [3], є частиною M5 Forecasting Competition, організованої в рамках серії конкурсів з прогнозування Makridakis (M-competitions). Цей конкретний набір даних зосереджений на роздрібній торгівлі та включає такі характеристики:
•Джерело Даних: Дані надані Walmart, однією з найбільших роздрібних мереж у світі, що охоплюють продажі в США.
•Часовий Діапазон: Дані включають щоденні продажі протягом близько 1941 дня, починаючи з 2011 року.
•Продукти та Категорії: Набір даних охоплює продажі 3049 товарів, класифікованих у 3 категорії та 7 підкатегорій. Товари належать до різних відділів, які розміщені у 10 магазинах у трьох різних штатах.
В цій роботі я роботі я зосередився на спрощеному підході до прогнозування продажів, вибравши для аналізу продажі одного продукту в одному магазині з використанням базових методів ARIMA, декомпозиції тренду і сезонності з ARIMA, та LSTM. Ось основні аспекти цих методів:
•ARIMA (Авторегресійна Інтегрована Модель Ковзного Середнього): Це класичний статистичний метод для аналізу і прогнозування часових рядів, який враховує автокореляцію в даних. ARIMA ефективно використовується для прогнозування часових рядів, де не враховуються сезонні ефекти.
•Декомпозиція Тренду та Сезонності з ARIMA: Цей підхід включає розділення часових рядів на складові - тренд, сезонність, та залишкові компоненти. Після декомпозиції, модель ARIMA може бути застосована до окремих компонентів, що дозволяє більш точно моделювати й прогнозувати часові ряди з вираженими сезонними коливаннями.
•LSTM (Long Short-Term Memory): LSTM - це різновид рекурентної нейронної мережі (RNN), яка добре підходить для моделювання часових рядів, особливо коли в даних присутні довгострокові залежності.
Рис. 3 Моделювання ряду за допомогою LSTM
Висновок.
У цій роботі було проведено аналіз прогнозування продажів одного продукту за допомогою трьох різних підходів: ARIMA, прогнозування тренду з додаванням сезонності, та LSTM. В результаті отримано наступні метрики на тестовому наборі даних: ARIMA (MAPE: 37%, MAE: 0.26), прогнозування тренду з додаванням сезонності (MAPE: 30%, MAE: 0.21), і LSTM (MAPE: 118%, MAE: 0.92).
Список літератури
[1] T. Zhou, «Improved Sales Forecasting using Trend and Seasonality Decomposition with LightGBM», в 2023 6th International Conference on Artificial Intelligence and Big Data (ICAIBD), Трав 2023, с. 656–661. doi: 10.1109/ICAIBD57115.2023.10206380.
[2] M. R. Hasan, M. A. Kabir, R. A. Shuvro, і P. Das, «A Comparative Study on Forecasting of Retail Sales». arXiv, 14, Березень 2022. doi: 10.48550/arXiv.2203.06848.
[3] X. Han, T. Ren, J. Hu, J. Ghosh, і N. Ho, «Efficient Forecasting of Large Scale Hierarchical Time Series via Multilevel Clustering». arXiv, 27, Травень 2022. doi: 10.48550/arXiv.2205.14104.
|