Існує багато класичних алгоритмів ранніх років, таких як k-середні [1], кластеризація на основі ЕМ із сумішами гаусів [2], які кластеризації наближаються до групових ознак із вивченими параметричними або непараметричними густинами; Нормалізований розріз запропонував парний потенціальний метод, який виконує дискримінацію фігури-основи шляхом кластеризації ознак на основі парних витрат; Сегментація вододілу [3] розглядає величину градієнта зображення як топографічної поверхні, пікселі з найвищою інтенсивністю величини градієнта відповідають лініям вододілу, які представляють межі області. Наведені вище алгоритми являють собою неконтрольовану сегментацію, яка підтримує зручність використання, але важко впоратися з деякими складними випадками, такими як сегментація об’єктів. Тому були також запропоновані інтерактивні алгоритми сегментації.
Запропонований алгоритм аналізу клієнтського використовується для побудови фонової моделі з довгих вхідних послідовностей і використовує техніку квантування для мінімізації необхідної пам’яті. Для кожного пікселя алгоритм створює кодову книгу, що складається з одного або кількох кодових слів. Зразки в кожному пікселі квантуються в набір кодових слів на основі інформації про колір і яскравість. Потім фон кодується попіксельно.
Нехай X — навчальна послідовність для одного пікселя, що складається з nx RGB-векторів: ={ 1,…, x }, і нехай ۱ — кодова книга для пікселя, що складається з n-кодових слів. Кожен піксель має різний розмір кодової книги на основі його варіації вибірки. Кожна кодова книга c,i=1,…,складається з вектора RGB кодового слова i, T і T позначають порогові значення для вектора RGB, позначають максимальну негативну довжину прогону (MNRL), яка визначається як найдовший інтервал протягом періоду навчання, протягом якого кодове слово не повторювалося, позначає час останнього доступу, коли кодове слово з’явилося, і є частотою, з якою кодове слово виникає.
Після побудови кодова книга [4] може бути значною, оскільки вона містить усі кодові слова, які можуть включати рухомі об’єкти переднього плану та шум. Тому кодову книгу вдосконалено шляхом усунення кодових слів, які містять рухомі об’єкти переднього плану. MNRL у книзі кодів використовується для усунення кодових слів, які включають рухомі об’єкти, на основі припущення, що пікселі рухомих об’єктів переднього плану з’являються рідше, ніж рухомі фону. Таким чином, кодові слова, що мають великий, усуваються за допомогою наступного рівняння: ={ | א۱ר }, де позначає фонову модель, яка є уточненою кодовою книгою, і позначає граничне значення. В експериментах встановлювалося рівним половині кількості навчальних кадрів.
У разі використання алгоритмів на основі кодової книги важко використовувати MRF, оскільки MRF не оцінює ймовірності, а обчислює відстань від векторів RGB і яскравість кодових слів.
Щоб оцінити ймовірності з кодових книг, вибирається суміш K розподілів Гауса, запропонована Стауффером і Грімсоном [2], щоб змоделювати недавню історію кожного пікселя, який входить до тих самих кодових слів. де K – число ймовірності спостереження поточного значення пікселя t is ( t)=σi=1 wi,t , כ (xt,ૄ , ,σi,t) =1, розподіли, ૄ , є оцінкою вага i-го гаусса в суміші в момент часу t, ૄ і є середнім значенням і коваріаційною матрицею, відповідно, i-го гаусса в суміші в момент часу t і є функцією щільності ймовірності Гаусса. В експериментах K визначається кількістю кадрів, що використовуються для фонового моделювання, а коваріаційна матриця вважається такою:ȭk, t ɐ 2۷.
Список використаних джерел
1.Shapiro, Linda G.; Stockman, George C. Computer Vision. Upper Saddle River, NJ: Prentice Hall. ISBN 0130307963, 2001.
2.C. Carson, P. H. Torr, H. Greenspan, and J. Malik, “Blob world: Image Segmentation Using EM and Its Application to Image Querying,” IEEE Trans.on Pattern Analysis and Machine Intelligence, 24(8): 1026-1038, 2002.
3.Olsen, O. and Nielsen, M.”Multi-scale gradient magnitude watershed segmentation,” Proc. of ICIAP 97, Florence, Italy, Lecture Notes in Computer Science, pages 6–13. Springer Verlag, September 1997.
4.Anjin Park, Keechul Jung and Takeshi Kurata, “Codebook-based Background Subtraction to Generate Photorealistic Avatars in a Walkthrough Simulator,”Advances in Visual Computing, 5th International Symposium, ISVC,Proceedings, Part I,pp500-510, La
__________________________________________
Науковий керівник: Олексій Ілліч Полікаровський, професор