:: ECONOMY :: СТВОРЕННЯ МОБІЛЬНОГО ЗАСТОСУНКУ ДЛЯ КЕРОВАНОГО СИНТЕЗУ ФОТОРЕАЛІСТИЧНИХ ЗОБРАЖЕНЬ

:: ECONOMY :: СТВОРЕННЯ МОБІЛЬНОГО ЗАСТОСУНКУ ДЛЯ КЕРОВАНОГО СИНТЕЗУ ФОТОРЕАЛІСТИЧНИХ ЗОБРАЖЕНЬ

UA PL EN

Світ наукових досліджень. Випуск 43

Термін подання матеріалів

15 липня 2025

До початку конференції залишилось днів 12

Нові вимоги до публікацій результатів кандидатських та докторських дисертацій

Редакційна колегія. ГО «Наукова спільнота»

Договір про співробітництво з Wyzsza Szkola Zarzadzania i Administracji w Opolu

Календар конференцій

Наукові конференції

Конференції 2025

Конференції 2024

Світ наукових досліджень. Випуск 26 (24-25.01.2024)

Світ наукових досліджень. Випуск 27 (22-23.02.2024)

Світ наукових досліджень. Випуск 28 (21-22.03.2024)

Світ наукових досліджень. Випуск 29 (23-24.04.2024)

Світ наукових досліджень. Випуск 30 (24-25.05.2024)

1. Економічні науки;

2. Інформаційні системи і технології;

3. Педагогічні науки;

4. Психологічні науки;

5. Юридичні науки;

6. Історичні науки;

7. Філософські науки;

8. Культурологія;

9. Філологічні науки;

10. Мистецтвознавство;

11. Географічні науки;

12. Національна безпека;

13. Соціологічні науки;

14. Політичні науки;

15. Фізичне виховання та спорт;

16. Державне управління;

17. Соціальні комунікації;

18. Медичні науки;

19. Фармацевтичні науки;

20. Ветеринарні науки;

21. Сільськогосподарські науки;

22. Хімічні науки;

23. Біологічні науки;

24. Геологічні науки;

25. Фізико-математичні науки;

26. Технічні науки;

27. Архітектура;

28. Військова справа

Світ наукових досліджень. Випуск 31 (20-21.06.2024)

Світ наукових досліджень. Випуск 32 (16-17.07.2024)

Світ наукових досліджень. Випуск 33 (19-20.09.2024)

Світ наукових досліджень. Випуск 34 (22-23.10.2024)

Світ наукових досліджень. Випуск 35 (20-21.11.2024)

Світ наукових досліджень. Випуск 36 (17-18.12.2024)

Конференції 2023

Конференції 2022

Конференції 2021

Конференції 2020

Конференції 2019

Конференції 2018

Конференції 2017

Конференції 2016

Конференції 2015

Конференції 2014

Конференції 2013

Конференції 2012

Конференції 2011

Конференції 2010

Наукові конференції

Наукова спільнота - інтернет конференції

Світ наукових досліджень www.economy-confer.com.ua

Голосування

Наша кнопка

Лічильники

СТВОРЕННЯ МОБІЛЬНОГО ЗАСТОСУНКУ ДЛЯ КЕРОВАНОГО СИНТЕЗУ ФОТОРЕАЛІСТИЧНИХ ЗОБРАЖЕНЬ

21.05.2024 13:16

Автор: Яворський Марк Володимирович, студент, Київський національний університет імені Тараса Шевченка

[2. Інформаційні системи і технології;]

Штучний Інтелект (ШІ), Машинне Навчання (МН) та доступністю великих наборів даних обумовили найкращі показники інноваційної динаміки, процесів структурних трансформацій та бізнес-впровадженнь у сфері генерації реалістичних зображень [4-7]. Перспективність та важливість досліджуваних технологій також обумовлена широкими можливостями мультимодальності, шляхом креації нейронними мережами зображень на основі різних типів даних (текстових, аудіо, відео або сенсорних даних) [2, 4].

Сучасна проблематика інноваційних та корисних для широкого кола користувачів нами вбачається у пропозиції конкретних рішень для мобільних пристроїв, оскільки такі переважно призначені для використання на стаціонарних комп'ютерах або серверах. Як наслідок, існує проблема обмеження доступності та практичного використання можливостей ШІ для звичайних користувачів [4]. Таким чином, створення мобільного застосунку для керованого синтезу фотореалістичних зображень з використанням дифузійних моделей є актуальним, зокрема у сфері рекламної діяльності, кіноіндустрії, відеоігор та соціальних медіа.

Варто зазначити, що на сьогодні нейромережі ControlNet та Stable Diffusion визначені нами як провідні або ключові нашої системи. ControlNet, характеризуючись доволі високим ступенем гнучкості та широкими можливостями контролю результату процесу генерації реалістичних зображень, використовує текстові вхідні дані. Stable Diffusion використовується для нівелювання шуму у зображеннях та власне з метою підвищення чіткості й якості зображень.

Наступним етапом процесу креації якісного зображення є процес декодування. Мета такого у генерації читабельного для людського ока зображенні (в піксельному просторі). Отже, нами вбачається можливість удосконалення моделі ШІ на телефононах, дронах, планшетах та інших мобільних пристроях з малими обчислювальними можливостями та переважно занизькими продуктивними можливостями, завдяки оптимізації шарів моделі, перетворень та оптимізації моделі, і збереженні такої в пам'ять.

За результатами практично-пошукової роботи, нами сформована послідовність використання моделей ШІ для керованого синтезу фотореалістичних зображень, із можливим збереженням проміжних результатів в файлові структури даних: центрування, обрізання, сегментації та генерації.

В процесі дослідження також були визначені ключові функції досліджуваної моделі на основі результатів аналізу потреб користувачів та конкурентних переваг, а також проведено ретельний аналіз вимог до функціоналу застосунку та здійснено перевірку на відповідність стандартам безпеки та якості.

На основі сценаріїв використання застосунку та ключових функцій ControlNet та Stable Diffusion запропоновано структуру застосунку із поділом на три основні модулі (модуль з моделями ШІ, модуль для налаштування гіперпараметрів генеративної нейромоделі та перегляду згенерованого зображення та модуль для зберігання налаштувань користувача та згенерованих зображень). Розроблено лаконічний дизайн користувацького інтерфейсу та потрібні елементи для взаємодії користувача з програмою, які включені в допоміжні модулі.

Результати роботи можуть бути поширені та використані спільнотою розробників та дослідників у галузі комп'ютерного зору та машинного навчання для подальшого дослідження використання генеративного ШІ на мобільних пристроях. Розробка мобільного застосунку з використанням генеративних нейромоделей для синтезу фотореалістичних зображень має значимість у галузі комп'ютерного зору. Вона допомагає розширити можливості синтезу зображень та прискорити процес оптимізації якості фотографії та відео. Розроблений мобільний застосунок має значний потенціал для користувачів у різних сферах, включаючи фотографію, рекламу, кіноіндустрію, відеоігри та соціальні медіа. Він дозволяє створювати нові та цікаві зображення з різними ефектами, що покращує якість та творчість медіа-продукції. Pезультати роботи були розміщені у відкритому доступі на веб-сервісі GitHub, що сприяє співпраці, обміну знаннями та використанню результатів роботи спільнотою розробників. Це сприяє прискоренню інновацій та розвитку галузі комп'ютерного зору.

Список літератури:

1. Brownlee J. A Gentle Introduction to Generative Adversarial Networks (GANs). URL: https://machinelearningmastery.com/what-are-generative-adversarial-networks-gans/ (дата звертання 03.05.2024).

2. Hu L. Generative AI and Future. URL: https://pub.towardsai.net/generative-ai-and-future-c3b1695876f2 (дата звертання 08.05.2024).

3. Goodfellow I., Jean P.-A., Mehdi M., Bing X., David W.-F., Sherjil O., Aaron ., Yoshua B. Generative Adversarial Networks // Advances in neural information processing systems, 2014. № 27. P. 67-84.

4. Moroney L. AI and Machine Learning for On-Device Development: A Programmer's Guide // O'Reilly Media, 2021. № 7. P. 1196-1199.

5. Prafulla D., Nichol A. Diffusion Models Beat GANs on Image Synthesis // Advances in neural information processing systems, 2021. № 34. P. 8780-8794.

6. Sohl-Dickstein J., Weiss E., Maheswaranathan N., Ganguli S. Deep Unsupervised Learning using Nonequilibrium Thermodynamics // International conference on machine learning, 2015. № 6. Р. 2256-2265.

______________________

Науковий керівник: Шкільняк Оксана Степанівна, кандидат фізико-математичних наук, доцент, Київський національний університет імені Тараса Шевченка

Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License

Знайшли помилку? Виділіть помилковий текст мишкою і натисніть Ctrl + Enter

Інші наукові праці даної секції
	ОСНОВНІ ПРИНЦИПИ ТРИВИМІРНОГО МОДЕЛЮВАННЯ 28.05.2024 00:18
	ОСОБЛИВОСТІ ТЕХНІЧНОГО ЗАХИСТУ АВТОРСЬКИХ ПРАВ ЗА ДОПОМОГОЮ ВИКОРИСТАННЯ СТЕГАНОГРАФІЇ (НА ПРИКЛАДІ КОМП’ЮТЕРНИХ ІГОР) 27.05.2024 18:03
	ВИКОРИСТАННЯ ПОТОЧНОГО СТАНУ ТА ПЕВНИХ ТЕНДЕНЦІЙ У ІНФОРМАЦІЙНИХ ТЕХНОЛОГІЯХ ДЛЯ ПРОГНОЗУ 27.05.2024 16:36
	ВИЗНАЧЕННЯ ТИПУ ДАНИХ ЗА ДОПОМОГОЮ НЕЙРОННИХ МЕРЕЖ 22.05.2024 12:14
	РОЛЬ ШТУЧНОГО ІНТЕЛЕКТУ ЗАДЛЯ ЕФЕКТИВНОГО МЕНЕДЖМЕНТУ IT КОМПАНІЙ 21.05.2024 13:03
	МЕТОДИКА ВИЯВЛЕННЯ DDOS-АТАК НА ОСНОВІ АЛГОРИТМУ ДЕНДРИТНИХ КЛІТИН 17.05.2024 16:23
	МЕХАНІЗМИ ПОБУДОВИ ВІДМОВОСТІЙКОГО КЛАСТЕРУ І БЕКАПУВАННЯ БАЗ ДАНИХ 14.05.2024 13:15

© 2010-2025 Всі права застережені	При використанні матеріалів сайту посилання на www.economy-confer.com.ua обов’язкове!
Час: 0.244 сек. / Mysql: 1804 (0.193 сек.)