Системи оброблення неструктурованої мультимедійної інформації

Автор(и)

  • Богдан Мирославович Пухальський Національний університет «Києво-Могилянська академія», Україна
  • Оксана Валентинівна Кирієнко Національний університет «Києво-Могилянська академія», Україна

DOI:

https://doi.org/10.18523/2617-3808.2023.6.62-68

Ключові слова:

системи пошуку зображень, комп’ютерний зір, виявлення об’єктів, текстовий опис зображень

Анотація

У роботі представлено огляд систем пошуку зображень і методів, які використовують для вирішення проблем комп’ютерного зору. У першій частині увагу зосереджено на потребах користувачів і вимогах до систем пошуку зображень, після чого розглянуто наявні системи, як-от Google Photos, Apple Photos, Amazon Photos, Microsoft Photos і Flickr, оцінено їхні переваги та недоліки та обговорено запропоновані шляхи вирішення виявлених недоліків. Детально проаналізовано запропоновані методи комп’ютерного зору, зокрема виявлення об’єктів (облич) і текстовий опис зображень.

Біографії авторів

Богдан Мирославович Пухальський, Національний університет «Києво-Могилянська академія»

Магістр програми «Інженерія програмного забезпечення» факультету інформатики Національного університету «Києво-Могилянська академія», bohdan.pukhalskyi@ukma.edu.ua

Оксана Валентинівна Кирієнко, Національний університет «Києво-Могилянська академія»

Старший викладач факультету інформатики Національного університету «Києво-Могилянська академія», o.kyriienko@ukma.edu.ua

Посилання

  1. Cheney, J., Klein, B., Jain, A. K., & Klare, B. (2015). Unconstrained face detection: State of the art baseline and challenges. 2015 International Conference on Biometrics (ICB). https://doi.org/10.1109/icb.2015.7139089.
  2. Datta, R., Joshi, D., Li, J., & Wang, J. (2008). Image retrieval. ACM Computing Surveys, 40 (2), 1–60. https://doi.org/10.1145/1348246.1348248.
  3. Image Captioning. (n.d.). Captioning. http://shikib.com/captioning.html.
  4. Lew, M. S., Sebe, N., Djeraba, C., & Jain, R. (2006). Content-based multimedia information retrieval. ACM Transactions on Multimedia Computing, Communications, and Applications, 2 (1), 1–19. https://doi.org/10.1145/1126004.1126005.
  5. Litjens, G., Kooi, T., Bejnordi, B. E., Setio, A. A. A., Ciompi, F., Ghafoorian, M., Van Der Laak, J., Van Ginneken, B., & Sánchez, C. I. (2017). A survey on deep learning in medical image analysis. Medical Image Analysis, 42, 60–88. https://doi.org/10.1016/j.media.2017.07.005.
  6. Murali, S. (2018, June 17). An analysis on computer vision problems – Shravan’s Blog - Medium. Medium. https://medium.com/deep-dimension/an-analysis-on-computer-vision-problems-6c68d56030c3.
  7. Nikulin, D. (2022, July 7). What is Multimedia Data? DEV Community. https://dev.to/dimanikulin/what-is-multimedia-data-111f.
  8. Papers with Code - Image Captioning. (n.d.). https://paperswithcode.com/task/image-captioning.
  9. Raikote, P. (2021, May 18). Object Detection – Part 1: Introduction. Applied Singularity. https://appliedsingularity.com/2021/05/18/object-detection/.
  10. Sivic, & Zisserman. (2003). Video Google: a text retrieval approach to object matching in videos. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2. https://doi.org/10.1109/iccv.2003.1238663.
  11. Smeulders, A., Worring, M., Santini, S., Gupta, A., & Jain, R. (2000). Content-based image retrieval at the end of the early years. IEEE Transactions on Pattern Analysis and Machine Intelligence, 22(12), 1349–1380. https://doi.org/10.1109/34.895972.
  12. Varun. (2023, May 9). What is Face Detection? Ultimate Guide 2023 + Model Comparison. LearnOpenCV – Learn OpenCV, PyTorch, Keras, Tensorflow with examples and tutorials. https://learnopencv.com/what-is-face-detection-the-ultimate-guide/.
  13. Vinyals, O., Toshev, A., Bengio, S., Erhan, D., & Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR). (2015). Show and Tell: a neural Image caption generator. These CVPR 2015 Papers Are the Open Access Versions, Provided by the Computer Vision Foundation.
  14. Wikipedia contributors. (2023, November 6). Multimedia. Wikipedia. https://en.wikipedia.org/wiki/Multimedia.
  15. Yak pratsiuie OSINT-rozvidka? Vid biznes-analizu do oborony Ukrainy, (2022, September 20). ISSP Training. https://www.issp.training/post/yak-pratsyuye-osint-rozvidka-vid-biznesanalizu-do-oborony-ukrayiny.
  16. Zou, Z., Chen, K., Shi, Z., Guo, Y., & Guo, Y. (2023). Object Detection in 20 years: A survey. Proceedings of the IEEE, 111(3), 257–276. https://doi.org/10.1109/jproc.2023.3238524.

##submission.downloads##

Опубліковано

2024-03-24

Як цитувати

[1]
Б. М. Пухальський і О. В. Кирієнко, «Системи оброблення неструктурованої мультимедійної інформації», NRPCOMP, т. 6, с. 62–68, Бер 2024.