В умовах економічної невизначеності, посиленої політичними кризами та військовим конфліктом, досить актуальним є питання розробки програмного додатку для прогнозування індексу споживчих цін (ІСЦ) [1]. Українська економіка, яка зазнає значних випробувань, вимагає точних і адаптивних інструментів для аналізу ІСЦ. У цій роботі пропонується алгоритм прогнозування індексу споживчих цін, що використовує комбінацію методів ARIMAX/SARIMAX та Gradient Boosting для виявлення лінійних та нелінійних залежностей в умовах нестабільності економічних процесів.
Алгоритм базується на аналізі трендів та впливу сезонності за допомогою використання методів ARIMAX та SARIMAX [2], що дозволяє врахувати вплив різних економічних чинників. Технологія Gradient Boosting застосовується для визначення залишкових компонентів для покращення моделювання нелінійних зв'язків [3]. Об'єднання прогнозів з цих моделей дозволяє підвищити точність визначення ІСЦ.
У сучасній економіці не рідко використовуються статистичні методи прогнозування, що ефективні для моделювання лінійних залежностей, але вони обмежені під час аналізу складних нелінійних трендів. Методи машинного навчання, здатні виявляти ці складні залежності, але часто вимагають великих обсягів даних та можуть бути складними для інтерпретації. Розробка алгоритму, що об’єднує методи ARIMAX та SARIMAX дозволить забезпечити більшу гнучкість та точність у прогнозуванні ІСЦ.
Визначення оптимального набору екзогенних змінних є критичним для точного прогнозування індексу споживчих цін, особливо у волатильному економічному середовищі. Екзогенні змінні повинні бути тісно пов'язані з ІСЦ, відображаючи зовнішні фактори, що мають прямий вплив на цінові зміни. Значущість таких змінних можна визначити через кореляційний та регресійний аналізи, щоб виявити лінійні залежності. Для виявлення нелінійних зв'язків варто використовувати більш складні методи, наприклад, машинне навчання [4].
Приклади важливих екзогенних змінних містять рівень заробітної плати, курси валют, кількість грошової маси тощо. Вони мають бути відібрані з урахуванням їх доступності, якості даних та відповідності українському контексту. Важливо, щоб ці змінні могли адекватно відображати внутрішньо економічні процеси та реагування на економічні шоки.
Пропонується алгоритм, що дозволяє комбінувати методи ARIMAX/SARIMAX з використанням Gradient Boosting. Даний алгоритм передбачає наступне (рисунок.1):
1. У блоці 1 алгоритму відбувається збір історичних даних ІСЦ та визначення екзогенних змінних. Далі відбувається первинний аналіз даних, що передбачає застосування тесту Дікі-Фуллера для перевірки стаціонарності часових рядів (блок 2). Наступним кроком є розкладання часових рядів, виділення тренда, сезонності та залишків (блок 3). У 4 блоці відбувається автокореляційний аналіз, ідентифікація зв'язків між часовими точками, вибір моделі прогнозування: або ARIMAX (блок 5), якщо виявлено відсутність сезонності, або SARIMAX (блок 6), якщо виявлено наявність сезонності. Блок 7 перевіряє на мультиколінеарність, використання варіаційного інфляційного фактору для аналізу екзогенних змінних. Навчання моделі на тренувальному наборі даних та валідація на тестовій вибірці здійснюються у блоках 8, 9. У блоці 10 відбувається вдосконалення прогнозу з Gradient Boosting, тобто відбувається виявлення нелінійних залежностей та уточнення прогнозу для залишкових компонентів. У блоці 11 здійснюється комбінація прогнозів і виведення результату для отримання кінцевого прогнозу ІСЦ.
Рисунок 1 - Алгоритм прогнозування індексу споживчих цін
Таким чином запропоновано алгоритм, що передбачає комбіноване застосування методів ARIMAX, SARIMAX у поєднані з Gradient Boosting. Даний алгоритм може стати гарним інструментом прогнозування ІСЦ у періоди економічної невизначеності, політичних криз і військових конфліктів.
Список літератури
1. Індекс споживчих цін: сприйняття та реальність: Посібник/Державний комітет статистики України. За редакцією Ю. М. Остапчука. – 2006. – 56 с. Режим доступу: https://www.lv.ukrstat.gov.ua/ukr/themes/13/posibnyk.pdf
2. Brendan Artley. Time Series Forecasting with ARIMAX, SARIMAX and SARIMAXX: [Електронний ресурс] / Brendan Artley // Сайт Towards Data Science. – Towards Data Science. – 2022 – Режим доступу: https://towardsdatascience.com/time-series-forecasting-with-Arimax-sArimax-and-sArimaxx-ee61099e78f6
3. Jason Brownlee. A Gentle Introduction to the Gradient Boosting Algorithm for Machine Learning:[Електронний ресурс]/ Jason Brownlee//Сайт Machine Learning Mastery - Machine Learning Mastery. – 2020 – Режим доступу: https://machinelearningmastery.com/gentle-introduction-gradient-boosting-algorithm-machine-learning/
4. Державний комітет статистики. Методика розрахунку базового індексу споживчих цін:[Електронний ресурс]//Сайт Liga Zakon - Liga Zakon. –2007 – Режим доступу: https://ips.ligazakon.net/document/FIN35565?an=357 /
|