Дослідження реляційних баз даних як відмовостійкого компонента високонавантаженого бізнесу є дуже актуальною і важливою для сучасного IT-середовища. Дослідженням баз даних приділяли увагу багато вітчизняних та закордонних вчених. Серед них варто визначити: Зінов’єва І. С. та Артемчука В. О. , які досліджували сучасні підходи до подальшої еволюції концепції баз даних [1], Березький О. М., який займався розробленням реляційної бази даних інтелектуальної системи [2], Мулеса О.Ю., визначала методики вивчення реляційних без даних [3], Брацький,В. О., та М’якшило, О. М. досліджували особливості застосування реляційних і нереляційних баз даних на прикладі SQL Server та MongoDB [4].
База даних є фундаментальним інструментом в сучасному інформаційному світі, який дозволяє зберігати, організовувати та отримувати доступ до великих обсягів даних, тому, необхідно розробити математичний інструментарій прийняття рішення стосовно вибору типу бази даних, яку буде використовувати високонавантажений бізнес.
Використовуючи фактори впливу: питому вага SELECT запитів серед усіх запитів, максимальну кількість запитів, яка може витримати один фізичний сервер проекту, бажану кількість запитів, яку має тримати проект без лага, розробимо комплексну формулу прийняття рішення про вибір бази даних, що має числові та параметричні компоненти:
SEL - (select coefficient) питома вага SELECT запитів серед усіх запитів;
SMQPS - (server max queries per second) максимальна кількість запитів, яка може витримати 1 фізичний сервер проекту;
QPS - (queries per seconds) бажана кількість запитів, яку має тримати проект без лага;
R - (relational coefficient) коефіцієнт, що дає зрозуміти яку базу даних вибрати. Якщо число позитивне, то реляційна база даних буде краще під проект, якщо негативне, значить краще вибирати NoSQL базу даних. Значення за | 10 | < 10, говорять про те, що допустимо обидва варіанти, і немає однозначної відповіді.
Кількість SELECT-запитів може впливати на можливість та ефективність реплікації бази даних у реляційних системах. Реплікація - це процес створення копій даних і їх збереження на різних серверах для покращення доступності, продуктивності та надійності системи [5].
Встановлено, що реплікація добре працює з select навантаженням, оскільки розпаралелює виконання на різних вузлах, але update навантаження не буде прискорене, тому що всім подібним запитам доведеться виконуватися на всіх вузлах системи.
Розраховані значення R допоможуть обрати базу даних (реляційний чи не реляційний) (Рис. 1):
Рис.1 Вибір бази даних в залежності від розрахунку R (коефіцієнту, що дає зрозуміти яку базу даних вибрати)
Для врахування різниці в навантаженні в різні часи доби, формулу для прийняття рішення про вибір бази даних, що має числові та параметричні компоненти, буде мати наступний вигляд:
де:
F - це фактор, який враховує різницю в навантаженні в залежності від часу доби. Причому, цей фактор можливо визначати на основі аналізу навантаження в різні часові періоди. Наприклад, якщо навантаження зазвичай знижується вночі, то F може бути менше 1, щоб зменшити вагу навантаження в цей період.
Таким чином, врахування F фактору допоможе при прийняття рішення про виборі між реляційними та NoSQL базами даних враховувати динаміку навантаження.
Список літератури:
1.Зінов’єва, І. С., Артемчук, В. О. Сучасні підходи до подальшої еволюції концепції баз даних. In: III International scientific and practical conference «Dynamics of the development of world science», Canada. 2019. p. 34-44.
2.Березький, О. М., et al. Розроблення реляційної бази даних інтелектуальної системи автоматизованої мікроскопії. Науковий вісник НЛТУ України, 2017, 27.5: 125-129.
3.Мулеса О.Ю., et al. Місце теми «Інструкція SELECT» в змістовому модулі «Реляційні бази даних» та методика її навчання. Физико-математическое образование, 2018, 1 (15): 260-263.
4.Брацький,В. О., М’якшило, О. М. Дослідження особливостей застосування реляційних і нереляційних баз даних на прикладі SQL Server та MongoDB. Наукові праці Національного університету харчових технологій, 2016, 22,№ 5: 15-24.
5.SHAPIRO, Jeffrey. SQL Server 2000: the complete reference. McGraw-Hill, Inc., 2002.
___________________________________________
Науковий керівник: Приходченко Сергій Дмитрович, доцент, кандидат технічних наук, Національний технічний університет «Дніпровська політехніка», м. Дніпро
|