Відмовостійкість, як основа для забезпечення надійності, є важливою характеристикою в комп’ютерних системах реального часу (КСРЧ). Ці системи використовуються в багатьох критичних інфраструктурах, де вимагається точність та надійність в роботі. Вихід з ладу такої системи в управлянні авіацією чи медичному обладнанні може мати серйозні наслідки. Тому забезпечення відмовостійкості є головним завданням при проектуванні КСРЧ [1, c. 5].
КСРЧ, як визначив її Дональд Гілліс, це система, в якій правильність функціонування залежить не тільки від логічної правильності обчислень, але й від часу, за який було отримано результат. Якщо часові обмеження системи не виконуються, то кажуть, що відбувся системний збій.
КСРЧ поділяють на системи жорсткого реального часу і системи м’якого реального часу. Системи жорсткого реального часу мають жорсткі часові межі. Недотримання визначеного кінцевого терміну в системах жорсткого часу означає вихід системи з ладу. Системи м’якого реального часу менш вимогливі до часових вимог. Затримка відгуку не призведе до повної відмови системи, але її робота погіршиться, якщо відгук системи не відбудеться в зазначений час.
Відмовостійкість, як здатність системи продовжувати виконувати свої функції після відмови, є критично важливою для КСРЧ. Вона забезпечує надійну та точну роботу системи навіть при наявності відмов з боку апаратного чи програмного забезпечення, що дозволяє КСРЧ дотримуватись визначених часових вимог [2, с. 201].
В залежності від призначення КСРЧ, перед нею ставляться різні вимоги до відмовостійкості. Наприклад, в фінансовій сфері може допускатись короткочасна відмова, але система повинна мати високий рівень відновлення, в той час як, в медичній сфері, в апаратах моніторингу стану пацієнта, нульовий терпимий час до відмов, оскільки вихід обладнання з ладу, навіть на короткий час, може призвести до погіршення стану здоров’я людини. Оцінка вимог до відмовостійкості дозволить спроектувати надійну систему, що забезпечить її тривале функціонування.
Важливим інструментом для оцінки відмовостійкості є її показники. Всі показники для кількісної оцінки, можна поділити на три групи:
- показники, що характеризують ймовірність відмови;
- показники, що характеризують відновлення системи після відмови;
- показники, що характеризують тривалість безвідмовної роботи.
Загалом, показниками відмовостійкості є показники безвідмовності з застосуванням умовної вірогідності. Умовою, за якої обчислюється вірогідність, є збій в програмному або апаратному забезпеченні. Різні системи мають різні показники відмовостійкості, але основними показниками є середнє напрацювання між відмовами, середній час відновлення та середній час до відмови [3, с. 144].
Середнє напрацювання між відмовами, або MTBF (з англ. Mean time between failures) це показник який вказує на середній час між відновленнями після відмови комп’ютерної системи. Цей показник використовується для відстеження надійності систем, оскільки чим більше часу проходить між відмовами, тим надійніша система. Як правило, система складається з декількох елементів, в цьому випадку MTBF знаходиться за формулою:
де λΣ – інтенсивність відмов кожного елемента системи [4, c. 3].
Cередній час відновлення, або MTTR (англ. Mean time to repair) вказує на час, необхідний для відновлення системи після виникнення відмови. Для будь-якої КСРЧ, даний показник є важливим для забезпечення мінімального впливу відмови на продуктивність та функціонування системи [5, c. 2]. MTTR для одного елемента системи знаходиться за формулою:
де tвід.i – час відновлення після -ї відмови;
n – число відмов.
Ще одним основним показником є середній наробіток до відмови, або MTTF (з англ. Mean operating time to first failure). Цей показник визначає середній час, протягом якого система буде працювати без відмов. MTTF для одного елемента системи знаходиться за формулою:
де ti – час безвідмовної роботи КСРЧ між (і-1)-ю та i -ю відмовами;
n – число відмов.
При виборі показників відмовостійкості важливо враховувати багато різних факторів. З всіх вимог до відмовостійкості КСРЧ, можна виділити дві головні, з яких потім виникають інші. Першою, на яку потрібно звернути увагу, є критичність системи для безпеки або життєзабезпечення. Якщо в сфері застосування системи неможна допускати відмов, то така система повинна бути здатною запобігати помилок, або мінімізувати їх вплив та забезпечити безперебійну роботу у разі виникнення відмови. В таких системах можна використати показник ймовірності відновлення системи після відмови одного або декількох елементів системи. Не менш важливим для оцінки відмовостійкості є час відновлення. Для систем жорсткого часу, в яких час відновлення важливий, система повинна швидко відновлюватись, тому ефективним показником для неї буде середній час відновлення після відмови [6, с. 868].
Таким чином, відмовостійкість є важливою характеристикою для КСРЧ, які використовуються в багатьох критичних інфраструктурах. Залежно від сфери застосування КСРЧ, до відмовостійкості висуваються різні вимоги, тому потрібно проводити оцінку для вибору показників, щоб забезпечити безперебійну роботу системи та мінімізувати вплив на продуктивність системи.
Список літератури:
1. Wang, K.C. Embedded and Real-Time Operating Systems: monography. 2nd ed. Springer, 2023. 866 p.
2. Єфімова Т.І., Мудла Б.Г., Шалейко О.М. Відмовостійкість програмного забезпечення гарантоздатних комп’ютерних систем. Мат. машини і системи. 2009. № 4. С. 200–209.
3. Янко A. С., Краснобаєв В. А., Сабельнікова П. С. Математична модель надійності компютерних систем, функціонуючих в модулярній системі числення по основі використання принципу пасивної відмовостійкост. Системи управління, навігації та зв’язку. 2023. № 3(73). С. 144–147. DOI: 10.26906/SUNZ.2023.3.144.
4. Reliability Testing of Wind Farm Devices Based on the Mean Time to Failures / J. Paś et al. Energies. 2023. No. 16(6). 2827. DOI: 10.3390/en16062827.
5. Alfionita S., Alifin F. Preventive Maintenance Analysis Based on Mean Time Between Failure (MTBF) and Mean Time to Repair (MTTR). Angkasa: Jurnal Ilmiah Bidang Teknologi. Vol. 15, no. 15. DOI: 201. 10.28989/angkasa.v15i2.1833.
6. Dhandha A., Pillai A. S. Performance Evaluation of Primary Backup Fault Tolerant Scheduling for Single Processor Systems. 2018 Second International Conference on Intelligent Computing and Control Systems (ICICCS), Madurai, 14-15 June 2023. 2018. P. 866–871. DOI: 10.1109/ICCONS.2018.8663173.
|