:: ECONOMY :: МЕТОДИ ВІДНОВЛЕННЯ ТА ОЦІНКИ ЯКОСТІ ВЕЛИКИХ ДАНИХ НА ОСНОВІ НЕЙРОННИХ МЕРЕЖ

:: ECONOMY :: МЕТОДИ ВІДНОВЛЕННЯ ТА ОЦІНКИ ЯКОСТІ ВЕЛИКИХ ДАНИХ НА ОСНОВІ НЕЙРОННИХ МЕРЕЖ

UA PL EN

Світ наукових досліджень. Випуск 47

Термін подання матеріалів

16 грудня 2025

До початку конференції залишилось днів 16

Нові вимоги до публікацій результатів кандидатських та докторських дисертацій

Редакційна колегія. ГО «Наукова спільнота»

Договір про співробітництво з Wyzsza Szkola Zarzadzania i Administracji w Opolu

Календар конференцій

Наукові конференції

Конференції 2025

Конференції 2024

Світ наукових досліджень. Випуск 26 (24-25.01.2024)

Світ наукових досліджень. Випуск 27 (22-23.02.2024)

Світ наукових досліджень. Випуск 28 (21-22.03.2024)

Світ наукових досліджень. Випуск 29 (23-24.04.2024)

Світ наукових досліджень. Випуск 30 (24-25.05.2024)

Світ наукових досліджень. Випуск 31 (20-21.06.2024)

Світ наукових досліджень. Випуск 32 (16-17.07.2024)

Світ наукових досліджень. Випуск 33 (19-20.09.2024)

Світ наукових досліджень. Випуск 34 (22-23.10.2024)

Світ наукових досліджень. Випуск 35 (20-21.11.2024)

1. Економічні науки;

2. Інформаційні системи і технології;

3. Педагогічні науки;

4. Психологічні науки;

5. Юридичні науки;

6. Історичні науки;

7. Філософські науки;

8. Культурологія;

9. Філологічні науки;

10. Мистецтвознавство;

11. Географічні науки;

12. Національна безпека;

13. Соціологічні науки;

14. Політичні науки;

15. Фізичне виховання та спорт;

16. Державне управління;

17. Соціальні комунікації;

18. Медичні науки;

19. Фармацевтичні науки;

20. Ветеринарні науки;

21. Сільськогосподарські науки;

22. Хімічні науки;

23. Біологічні науки;

24. Геологічні науки;

25. Фізико-математичні науки;

26. Технічні науки;

27. Архітектура;

28. Військова справа

Світ наукових досліджень. Випуск 36 (17-18.12.2024)

Конференції 2023

Конференції 2022

Конференції 2021

Конференції 2020

Конференції 2019

Конференції 2018

Конференції 2017

Конференції 2016

Конференції 2015

Конференції 2014

Конференції 2013

Конференції 2012

Конференції 2011

Конференції 2010

Наукові конференції

Наукова спільнота - інтернет конференції

Світ наукових досліджень www.economy-confer.com.ua

Голосування

Наша кнопка

Лічильники

МЕТОДИ ВІДНОВЛЕННЯ ТА ОЦІНКИ ЯКОСТІ ВЕЛИКИХ ДАНИХ НА ОСНОВІ НЕЙРОННИХ МЕРЕЖ

21.11.2024 22:16

Автор: Гончар Ярослав Андрійович, магістрант, Західноукраїнський національний університет, м. Тернопіль; Єфанов Дмитро Сергійович, магістрант, Західноукраїнський національний університет, м. Тернопіль

[2. Інформаційні системи і технології;]

У сучасному цифровому світі великі дані стали основою для прийняття рішень у різних галузях, таких як медицина, фінанси, транспорт та промисловість. Проте значна частина даних часто є неповною, пошкодженою або має низьку якість через технічні збої, людські помилки або обмеження сенсорних пристроїв. Відсутність або низька якість даних може суттєво впливати на точність моделей аналізу і прогнозування, що ускладнює їх використання в критично важливих задачах.

Нейронні мережі та методи глибокого навчання відкривають нові можливості для автоматизованого відновлення даних, виявлення аномалій та оцінки якості великих даних. Вони дозволяють виявляти приховані закономірності, відновлювати втрачені значення та забезпечувати комплексну оцінку даних з високим рівнем адаптивності [1, 2].

Одна з поширених проблем у роботі з даними – це наявність пропущених значень, що може створити проблеми під час аналізу. Такі пропущені дані трапляються в різних сферах, таких як аналіз експресії генів, контроль дорожнього руху, промислові інформаційні системи, обробка зображень і розробка програмного забезпечення. Якщо цю проблему не врахувати під час аналізу, це може призвести до неправильних висновків і результатів. Тому важливо підвищити якість даних, обробляючи пропущені значення належним чином.

Існують два основні традиційні методи обробки пропущених даних. Перший метод полягає в тому, щоб просто видалити всі записи, де відсутні якісь дані. Другий метод полягає в тому, щоб замінити пропущені значення на якісь припустимі значення. Крім того, існують методи імпутації (заміщення) даних, які використовують машинне навчання. Наприклад, до таких методів належать метод найближчих сусідів (KNN), рекурентні нейронні мережі (RNN), і генеративні змагальні мережі для імпутації даних (GAIN) [3-5].

За останні кілька років глибоке навчання стало широко використовуватися для вирішення різних задач, включаючи заміщення пропущених даних. Використання великих обсягів навчальних даних дозволило значно покращити результати імпутації. Зокрема, генеративні змагальні мережі (GAN) показали великі успіхи у вирішенні цієї задачі. Наприклад, один із методів імпутації на основі GAN вимагав налаштування гіперпараметрів для регулювання функції втрат і швидкості роботи дискримінатора. В іншому підході GAN використовував генератор і дискримінатор окремо для навчання структури і розподілу пропущених даних. Хоча ці методи дають чудові результати, вони часто занадто складні для практичного використання через велику кількість налаштувань [1, 2].

Для отримання достовірних і якісних результатів при використанні інформаційних технологій важливе значення мають не лише методи, способи та засоби обробки даних, але й якість самих вихідних даних. Від таких характеристик, як повнота, точність і змістовність, безпосередньо залежить результативність застосованих технологій. Деякі з цих характеристик можуть мати більшу вагу в конкретному контексті, але разом вони формують основу для оцінки якості результатів, отриманих із цих даних.

Проте, у процесі використання інформаційних технологій часто виникають проблеми, пов’язані з наявністю неповних або надлишкових даних. Такі ситуації потребують оцінки якості початкових даних, оскільки вони безпосередньо впливають на кінцевий результат. Сучасні технології обробки даних зазвичай працюють із великими обсягами різнотипних даних, які, хоча й численні, можуть не відповідати вимогам якості.

Особливо це актуально для глибокого навчання, яке використовує штучні нейронні мережі. Ці моделі вимагають великих і якісних наборів даних для формування потужних абстракцій. Однак навіть у сценаріях із великими даними їх якість може бути недостатньою для ефективного навчання. Невеликі варіації, несподівані особливості чи неповнота початкових даних здатні суттєво порушити баланс у навчальних моделях нейронних мереж, що негативно впливає на їхню точність і стабільність.

Враховуючи ці виклики, необхідність початкової оцінки якості великих даних є критичною. Зокрема, це особливо важливо для інформаційних технологій, побудованих на сучасних методах, таких як інтелектуальні та еволюційні алгоритми. Оцінка якості даних дозволяє забезпечити їх відповідність вимогам і знизити ризик виникнення помилок у процесі аналізу та прогнозування.

Отже, методи відновлення та оцінки якості великих даних на основі нейронних мереж дозволять забезпечити високу точність і адаптивність у роботі з неповними та низькоякісними даними, що є критично важливим для сучасних інформаційних технологій. Використання глибокого навчання, зокрема автоенкодерів та генеративних змагальних мереж, дозволить ефективно заповнювати пропущені дані та оцінювати їх якість, мінімізуючи ризик помилок у моделюванні. Ці підходи відкривають нові можливості для підвищення надійності аналізу даних у різних галузях.

Література

1. Choudhury S.J., Pal N.R. Imputation of missing data with neural networks for classification. Knowledge-Based System. 2019. 182. 104838.

2. Lai, X., Wu, X., Zhang, L., Lu, W., Zhong, C. Imputations of missing values using a tracking-removed autoencoder trained with incomplete data. Neurocomputing. 2019. 366. 54–65.

3. Bertsimas, D., Pawlowski, C., Zhuo, Y.D. From predictive methods to missing data imputation: an optimization approach. J. Mach. Learn. Res. 2017. 18(1). 7133–7171.

4. Cheng, C.-H., Chan, C.-P., Sheu, Y.-J. A novel purity-based k nearest neighbors imputation method and its application in financial distress prediction. Eng. Appl. Artif. Intell. 2019. 81. 283–299.

5. Tang, F., Ishwaran, H. Random forest missing data algorithms. Statistical Analysis and Data Mining: The ASA Data Sci. J. 2017. 10(6). 363–377.

Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License

Знайшли помилку? Виділіть помилковий текст мишкою і натисніть Ctrl + Enter

Інші наукові праці даної секції
	АНАЛІЗ СТРІМІНГОВИХ ПРОТОКОЛІВ ДЛЯ ОЦІНКИ ПРОДУКТИВНОСТІ СИСТЕМИ ПОТОКОВОГО ВІДЕО 22.11.2024 15:13
	AN OVERVIEW OF PROCESS FOR ESTABLISHING THE PROJECT MANAGEMENT OFFICE IN ORGANIZATION 21.11.2024 23:31
	ІНТЕЛЕКТУАЛЬНІ АВТОМАТИЗОВАНІ СИСТЕМИ НА ОСНОВІ МАШИННОГО НАВЧАННЯ 21.11.2024 22:12
	РОЗПОДІЛЕНІ ОБЧИСЛЕННЯ ТА МЕТОДИ ГЛИБОКОГО НАВЧАННЯ ДЛЯ ЗАБЕЗПЕЧЕННЯ НАДІЙНОСТІ ТА ЕФЕКТИВНОСТІ КОМП’ЮТЕРНИХ МЕРЕЖ ТА IоT-ІНФРАСТРУКТУРИ 21.11.2024 22:09
	ЕВОЛЮЦІЙНІ АЛГОРИТМИ ТА ГЛИБОКЕ НАВЧАННЯ: ІННОВАЦІЙНІ МЕТОДИ КЛАСИФІКАЦІЇ ТА ПРОГНОЗУВАННЯ ДАНИХ 21.11.2024 22:03
	РОЗПОДІЛ ОБЧИСЛЮВАЛЬНИХ РЕСУРСІВ МІЖ СИСТЕМАМИ ТУМАННИХ ОБЧИСЛЕНЬ ТА IoT-ПРИСТРОЯМИ 21.11.2024 21:56
	ІНТЕЛЕКТУАЛЬНІ РІШЕННЯ НА ОСНОВІ ГЛИБОКИХ НЕЙРОННИХ МЕРЕЖ ДЛЯ ЗАДАЧ РОЗПІЗНАВАННЯ ЗОБРАЖЕНЬ 21.11.2024 21:53
	ЕВОЛЮЦІЯ ПІДХОДІВ ДО ОЦІНКИ ВАРТОСТІ ПРОГРАМНОГО ЗАБЕЗПЕЧЕННЯ: ІНТЕГРАЦІЯ КЛАСИЧНИХ МОДЕЛЕЙ І МЕТОДІВ МАШИННОГО НАВЧАННЯ 21.11.2024 21:51
	СУЧАСНІ ПІДХОДИ ДО УПРАВЛІННЯ ПРОЄКТАМИ: МАШИННЕ НАВЧАННЯ ТА БЛОКЧЕЙН-ТЕХНОЛОГІЇ 21.11.2024 21:47
	СИМУЛЯТОР КОРЕГУВАННЯ АРТИЛЕРІЙСЬКОГО ВОГНЮ 21.11.2024 20:22

© 2010-2025 Всі права застережені	При використанні матеріалів сайту посилання на www.economy-confer.com.ua обов’язкове!
Час: 0.141 сек. / Mysql: 1920 (0.118 сек.)