:: ECONOMY :: ВИКОРИСТАННЯ АЛГОРИТМУ XGBOOST ДЛЯ ПРОГНОЗУВАННЯ ЧАСОВИХ РЯДІВ

:: ECONOMY :: ВИКОРИСТАННЯ АЛГОРИТМУ XGBOOST ДЛЯ ПРОГНОЗУВАННЯ ЧАСОВИХ РЯДІВ

UA PL EN

Світ наукових досліджень. Випуск 46

Термін подання матеріалів

19 листопада 2025

До початку конференції залишилось днів 22

Нові вимоги до публікацій результатів кандидатських та докторських дисертацій

Редакційна колегія. ГО «Наукова спільнота»

Договір про співробітництво з Wyzsza Szkola Zarzadzania i Administracji w Opolu

Календар конференцій

Наукові конференції

Конференції 2025

Конференції 2024

Конференції 2023

Світ наукових досліджень. Випуск 16 (16-17.02.2023)

Світ наукових досліджень. Випуск 17 (16-17.03.2023)

Світ наукових досліджень. Випуск 18 (20-21.04.2023)

Світ наукових досліджень. Випуск 19 (23-24.05.2023)

Світ наукових досліджень. Випуск 20 (20-21.06.2023)

Світ наукових досліджень. Випуск 21 (13-14.07.2023)

Світ наукових досліджень. Випуск 22 (27-28.09.2023)

Світ наукових досліджень. Випуск 23 (24-25.10.2023)

1. Економічні науки;

2. Інформаційні системи і технології;

3. Педагогічні науки;

4. Психологічні науки;

5. Юридичні науки;

6. Історичні науки;

7. Філософські науки;

8. Культурологія;

9. Філологічні науки;

10. Мистецтвознавство;

11. Географічні науки;

12. Національна безпека;

13. Соціологічні науки;

14. Політичні науки;

15. Фізичне виховання та спорт;

16. Державне управління;

17. Соціальні комунікації;

18. Медичні науки;

19. Фармацевтичні науки;

20. Ветеринарні науки;

21. Сільськогосподарські науки;

22. Хімічні науки;

23. Біологічні науки;

24. Геологічні науки;

25. Фізико-математичні науки;

26. Технічні науки;

27. Архітектура;

28. Військова справа

Світ наукових досліджень. Випуск 24 (21-22.11.2023)

Світ наукових досліджень. Випуск 25 (14-15.12.2023)

Конференції 2022

Конференції 2021

Конференції 2020

Конференції 2019

Конференції 2018

Конференції 2017

Конференції 2016

Конференції 2015

Конференції 2014

Конференції 2013

Конференції 2012

Конференції 2011

Конференції 2010

Наукові конференції

Наукова спільнота - інтернет конференції

Світ наукових досліджень www.economy-confer.com.ua

Голосування

Наша кнопка

Лічильники

ВИКОРИСТАННЯ АЛГОРИТМУ XGBOOST ДЛЯ ПРОГНОЗУВАННЯ ЧАСОВИХ РЯДІВ

23.10.2023 19:55

Автор: Чебан Костянтин Валерійович, магістр, Національний університет “Одеська Політехніка”; Шпінарева Ірина Михайлівна, кандидат технічних наук, Національний університет “Одеська Політехніка”; Рудніченко Микола Дмитрович, кандидат технічних наук, Національний університет “Одеська Політехніка”

[2. Інформаційні системи і технології;]

XGBoost (eXtreme Gradient Boosting) - це алгоритм з відкритим вихідним кодом, який реалізує дерева градієнтного бустінгу з додатковим покращенням для кращої продуктивності та швидкості. Алгоритм XGBoost був створений Ченом та іншими[1] у 2016 році. Він широко використовується в різних сценаріях інтелектуального аналізу даних та змаганнях алгоритмів. Алгоритм використовує свої основні переваги в точності, гнучкості та автоматичній обробці пропущених значень.

Швидка здатність алгоритму робити точні прогнози робить цю модель основною моделлю для вирішення багатьох задач у галузі Machine Learning.

Найпоширенішими випадками застосування XGBoost є класифікаційне прогнозування, наприклад, виявлення шахрайства, або регресійне прогнозування, наприклад, прогнозування цін на житло. Однак розширення алгоритму XGBoost для прогнозування даних часових рядів також можливе.

Прогнозування в науці про дані та машинному навчанні - це метод, який використовується для передбачення майбутніх числових значень на основі історичних даних, зібраних протягом певного часу через регулярні або нерегулярні інтервали. На відміну від звичайних навчальних даних для машинного навчання, де кожне спостереження не залежить від іншого, дані для прогнозування часових рядів повинні бути розташовані в послідовному порядку і пов'язані з кожною точкою даних. Наприклад, дані часових рядів можуть включати щомісячні запаси, щотижневу погоду, щоденні продажі тощо.

Почнемо з того, що таке Gradient Boosting, Gradient Boosting - це метод машинного навчання як лінійна адитивна модель, що складається з ансамблю

слабких моделей передбачення[2]. Для отримання повної моделі F, потрібно виконати M кроків. Модель F_m не буде оптимізована безпосередньо на кроці m+1. В іншому випадку базова модель h_m+1 (x) буде навчена і для обчислювання залишкового значення y-F_m для моделі прогнозування на кроці m+1, що наближається до значення y.

Тому обчислення цілі зводиться до того, щоб знайти h_m+1 (x)=F_m+1-F_m. Як правило, від'ємний градієнт цільової функції використовується як залишок для вивчення базової моделі h(x).

XGBoost - це реалізація градієнтного підсилення, яка об'єднує декілька слабких класифікаторів в один сильний класифікатор лінійним способом. XGBoost підтримує як CART, так і лінійні класифікатори як базові класифікатори, і виконує розкладання Тейлора другого порядку на функцію вартості, що виражає більш повну інформацію. З точки зору швидкості роботи, XGBoost підтримує паралельний вибір точок розбиття, а навчання моделі займає набагато менше часу. Основна ідея XGBoost полягає у безперервному додаванні слабких дерев з різною вагою до множини. Дерева у множині повинні максимально наближатися до залишків попереднього прогнозу, що виражається наступним чином:

У формулі вище ŷ є прогнозованим значенням, F це множина, що включає всі дерева регресії, f_k - одне з дерев регресії, K - кількість дерев регресії. Очікується, що прогнозоване значення ŷ_i буде якомога ближчим до істинного значення y_i, наскільки це можливо, і при цьому не втрачаючи своїх загальних можливостей.

Gradient Boosting в основному спрямований на покращення продуктивності моделей машинного навчання, і за допомогою нього з використанням XGBoost можливо прискорити цю процедуру, а також отримати кращі результати. Коли мова йде про сферу аналізу та прогнозування часових рядів, то використовуються традиційні моделі, такі як ARIMA[3] (autoregressive integrated moving average), де основна увага приділяється регресійному аналізу, і якщо можливо виконати цю регресію за допомогою такого програмного забезпечення та техніки, то також можливо досягти найсучаснішої продуктивності в моделюванні часових рядів. Ансамбль слабких моделей машинного навчання з регуляризованим градієнтним бустингом може допомогти покращити результати в кожному розділі науки про дані. Таким розділом також можуть бути часові ряди.

Висновки. Загалом для прогнозування часових рядів використовують більш прості моделі такі як ARIMA, FB Prophet, і т.д. Хоч XGBoost є складним у роботі і розумінні алгоритмом, але його переваги можна використати для покращення швидкості тренування та роботи моделі для прогнозування часових рядів.

Список використаних джерел

1. Chen T., Guestrin C. XGBoost: A Scalable Tree Boosting System, San Francisco California USA. New York, NY, USA, 2016. – 785 P.

2. Alhomsi M., Ahmed H. Forecasting of ExchangeRate: Autoregressive modelsvs. XGBoost : thesis. 2020. – 40 P.

3. Arumugam V., Natarajan V. Time Series Modeling and Forecasting Using Autoregressive Integrated Moving Average and Seasonal Autoregressive Integrated Moving Average Models. Instrumentation Mesure Métrologie. 2023. – PP.161-168.

Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License

Знайшли помилку? Виділіть помилковий текст мишкою і натисніть Ctrl + Enter

Інші наукові праці даної секції
	ЦИФРОВІЗАЦІЯ ТА ІНТЕГРАЦІЯ ІНФОРМАЦІЙНИХ СИСТЕМ В СФЕРУ КОМУНАЛЬНИХ РОЗРАХУНКІВ 24.10.2023 23:52
	ЗАСТОСУВАННЯ СКЛАДНИХ ІНФОРМАЦІЙНИХ ТЕХНОЛОГІЙ В ПРИВАТНОМУ САДІВНИЦТВІ 24.10.2023 23:32
	ЗАСТОСУВАННЯ ІНФОРМАЦІЙНИХ СИСТЕМ ДЛЯ ОЦІНКИ СПРОМОЖНОСТІ ПОКУПЦІВ 24.10.2023 23:20
	АКТУАЛЬНІСТЬ ЗАПРОВАДЖЕННЯ ІНФОРМАЦІЙНИХ ТЕХНОЛОГІЙ В СИСТЕМИ ПЕРВИННОЇ ДІАГНОСТІКИ ТЕХНІЧНИХ СИСТЕМ 24.10.2023 23:10
	ЗАСТОСУВАННЯ СКЛАДНИХ ІНФОРМАЦІЙНИХ РІШЕНЬ В ПРОЦЕДУРІ ПІДБОРУ ПЕРСОНАЛУ 24.10.2023 22:53
	ВПРОВАДЖЕННЯ ІНФОРМАЦІЙНИХ ТЕХНОЛОГІЙ В СУЧАСНУ ГАЛУЗЬ АГРОПРОМИСЛОВОГО ХОЗЯЙСТВА УКРАЇНИ 24.10.2023 20:45
	АКТУАЛЬНІСТЬ ІНТЕГРАЦІЇ ІНФОРМАЦІЙНИХ ТЕХНОЛОГІЙ В СИСТЕМИ ПІДБОРУ ЕНЕРГЕТИЧНОГО ОБЛАДНАННЯ 24.10.2023 20:39
	ЗАПРОВАДЖЕННЯ ІНФОРМАЦІЙНИХ МЕТОДІВ ДО ГАЛУЗІ ПРИВАТНОГО ФІНАНСОВОГО АНАЛІЗУ 24.10.2023 20:34
	АЛГОРИТМ АНАЛІЗУ КЛІЄНТСЬКОГО ПОТОКУ НА ПІДПРИЄМСТВІ РОЗДРІБНОЇ ТОРГІВЛІ 23.10.2023 20:48
	АНАЛІЗ ОСОБЛИВОСТЕЙ ЗАСТОСУВАННЯ МЕТОДІВ ПРОГНОЗУВАННЯ ПРИ АНАЛІЗІ ДАНИХ 23.10.2023 19:22

© 2010-2025 Всі права застережені	При використанні матеріалів сайту посилання на www.economy-confer.com.ua обов’язкове!
Час: 0.117 сек. / Mysql: 1862 (0.097 сек.)