Системи оброблення неструктурованої мультимедійної інформації
DOI:
https://doi.org/10.18523/2617-3808.2023.6.62-68Ключові слова:
системи пошуку зображень, комп’ютерний зір, виявлення об’єктів, текстовий опис зображеньАнотація
У роботі представлено огляд систем пошуку зображень і методів, які використовують для вирішення проблем комп’ютерного зору. У першій частині увагу зосереджено на потребах користувачів і вимогах до систем пошуку зображень, після чого розглянуто наявні системи, як-от Google Photos, Apple Photos, Amazon Photos, Microsoft Photos і Flickr, оцінено їхні переваги та недоліки та обговорено запропоновані шляхи вирішення виявлених недоліків. Детально проаналізовано запропоновані методи комп’ютерного зору, зокрема виявлення об’єктів (облич) і текстовий опис зображень.
Посилання
- Cheney, J., Klein, B., Jain, A. K., & Klare, B. (2015). Unconstrained face detection: State of the art baseline and challenges. 2015 International Conference on Biometrics (ICB). https://doi.org/10.1109/icb.2015.7139089.
- Datta, R., Joshi, D., Li, J., & Wang, J. (2008). Image retrieval. ACM Computing Surveys, 40 (2), 1–60. https://doi.org/10.1145/1348246.1348248.
- Image Captioning. (n.d.). Captioning. http://shikib.com/captioning.html.
- Lew, M. S., Sebe, N., Djeraba, C., & Jain, R. (2006). Content-based multimedia information retrieval. ACM Transactions on Multimedia Computing, Communications, and Applications, 2 (1), 1–19. https://doi.org/10.1145/1126004.1126005.
- Litjens, G., Kooi, T., Bejnordi, B. E., Setio, A. A. A., Ciompi, F., Ghafoorian, M., Van Der Laak, J., Van Ginneken, B., & Sánchez, C. I. (2017). A survey on deep learning in medical image analysis. Medical Image Analysis, 42, 60–88. https://doi.org/10.1016/j.media.2017.07.005.
- Murali, S. (2018, June 17). An analysis on computer vision problems – Shravan’s Blog - Medium. Medium. https://medium.com/deep-dimension/an-analysis-on-computer-vision-problems-6c68d56030c3.
- Nikulin, D. (2022, July 7). What is Multimedia Data? DEV Community. https://dev.to/dimanikulin/what-is-multimedia-data-111f.
- Papers with Code - Image Captioning. (n.d.). https://paperswithcode.com/task/image-captioning.
- Raikote, P. (2021, May 18). Object Detection – Part 1: Introduction. Applied Singularity. https://appliedsingularity.com/2021/05/18/object-detection/.
- Sivic, & Zisserman. (2003). Video Google: a text retrieval approach to object matching in videos. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2. https://doi.org/10.1109/iccv.2003.1238663.
- Smeulders, A., Worring, M., Santini, S., Gupta, A., & Jain, R. (2000). Content-based image retrieval at the end of the early years. IEEE Transactions on Pattern Analysis and Machine Intelligence, 22(12), 1349–1380. https://doi.org/10.1109/34.895972.
- Varun. (2023, May 9). What is Face Detection? Ultimate Guide 2023 + Model Comparison. LearnOpenCV – Learn OpenCV, PyTorch, Keras, Tensorflow with examples and tutorials. https://learnopencv.com/what-is-face-detection-the-ultimate-guide/.
- Vinyals, O., Toshev, A., Bengio, S., Erhan, D., & Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR). (2015). Show and Tell: a neural Image caption generator. These CVPR 2015 Papers Are the Open Access Versions, Provided by the Computer Vision Foundation.
- Wikipedia contributors. (2023, November 6). Multimedia. Wikipedia. https://en.wikipedia.org/wiki/Multimedia.
- Yak pratsiuie OSINT-rozvidka? Vid biznes-analizu do oborony Ukrainy, (2022, September 20). ISSP Training. https://www.issp.training/post/yak-pratsyuye-osint-rozvidka-vid-biznesanalizu-do-oborony-ukrayiny.
- Zou, Z., Chen, K., Shi, Z., Guo, Y., & Guo, Y. (2023). Object Detection in 20 years: A survey. Proceedings of the IEEE, 111(3), 257–276. https://doi.org/10.1109/jproc.2023.3238524.
##submission.downloads##
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія
Авторське право (c) 2023 B. Pukhalskyi, O. Kyriienko
Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.
Автори, які публікуються у цьому журналі, погоджуються з такими умовами:
а) Автори зберігають за собою авторські права на твір на умовах ліцензії CC BY 4.0 Creative Commons Attribution International License, котра дозволяє іншим особам вільно поширювати (копіювати і розповсюджувати матеріал у будь-якому вигляді чи форматі) та змінювати (міксувати, трансформувати, і брати матеріал за основу для будь-яких цілей, навіть комерційних) опублікований твір на умовах зазначення авторства.
б) Журнал дозволяє автору (авторам) зберігати авторські права без обмежень.
в) Автори мають право укладати самостійні додаткові угоди щодо поширення твору (наприклад, розміщувати роботу в електронному репозитарії), за умови збереження посилання на його першу публікацію. (Див. Політика Самоархівування)
г) Політика журналу дозволяє розміщення авторами в мережі Інтернет (наприклад, у репозитаріях) тексту статті, як до подання його до редакції, так і під час його редакційного опрацювання, оскільки це сприяє виникненню продуктивної наукової дискусії та позитивно позначається на оперативності та динаміці цитування опублікованої роботи (див. The Effect of Open Access).