Аналіз і синтез технологій класифікації текстової інформації

Автор(и)

  • Vladyslav Kuznetsov Інститут кібернетики імені В. М. Глушкова НАН України, Україна https://orcid.org/0000-0002-1068-769X
  • Iurii Krak Київський національний університет імені Тараса Шевченка; Інститут кібернетики імені В. М. Глушкова НАН України, Україна https://orcid.org/0000-0002-8043-0785
  • Volodymyr Lіashko Національний університет «Києво-Могилянська академія», Україна
  • Veda Kasianiuk Київський національний університет імені Тараса Шевченка, Україна https://orcid.org/0000-0003-3268-303X

DOI:

https://doi.org/10.18523/2617-3808.2022.5.49-53

Ключові слова:

оброблення текстів, видобуток ознак, візуальна аналітика, алгоритми класифікації, зменшення розмірності ознак

Анотація

Розглянуто задачу якісного аналізу процесу перетворення текстової інформації на набір ознак і відповідно перетворення цих ознак на набір, зручний для візуального аналізу. Розглянуто структуру типової технології з аналізу текстової інформації та визначено її основні елементи. Детально наведено опис кожного елементу технології аналізу та класифікації текстової інформації із залученням методів класифікації та групування ознак. Проведено експериментальні випробування окремих компонентів цієї технології.

Біографії авторів

Vladyslav Kuznetsov, Інститут кібернетики імені В. М. Глушкова НАН України

Кузнєцов Владислав Олександрович – кандидат технічних наук, науковий співробітник Інституту кібернетики імені В. М. Глушкова НАН України, kuznetsow.wlad@gmail.com

Iurii Krak, Київський національний університет імені Тараса Шевченка; Інститут кібернетики імені В. М. Глушкова НАН України

Крак Юрій Васильович – доктор фізико-математичних наук, професор, член-кореспондент НАН України, завідувач кафедри теоретичної кібернетики Київського національного університету імені Тараса Шевченка, провідний науковий співробітник Інституту кібернетики імені В. М. Глушкова НАН України (за сумісництвом), yuri.krak@gmail.com

Volodymyr Lіashko, Національний університет «Києво-Могилянська академія»

Ляшко Володимир Іванович – кандидат фізико-математичних наук, доцент кафедри інформатики Національного університету «Києво-Могилянська академія», v.lyashko@ukr.net

Veda Kasianiuk, Київський національний університет імені Тараса Шевченка

Касянюк Вєда Станіславівна – кандидат фізико-математичних наук, завідувач лабораторії теоретичної кібернетики Київського національного університету імені Тараса Шевченка, veda.kasianiuk@gmail.com

Посилання

  1. Aloysius, N., & Geetha, M. (2017). A review on deep convolutional neural networks. In International Conference on Communication and Signal Processing (ICCSP), 0588–0592. https://doi.org/10.1109/ICCSP.2017.8286426
  2. Alzubaidi, L., Zhang, J., Humaidi, A. J., et al. (2021). Review of deep learning: concepts, CNN ar-chitectures, challenges, applications, future directions. Journal of Big Data, 8 (53), 1–74. https://doi.org/10.1186/s40537-021-00444-8
  3. Chan, D. M., & Rao, R. & Huang, F., & Canny, J. F. (2018). T-SNE-CUDA: GPU-Accelerated T-SNE and its Applications to Modern Data. In 30th International Symposium on Computer Architecture and High Performance Computing (SBAC-PAD), 330–338. https://doi.org/10.1109/CAHPC.2018.8645912
  4. Kirichenko, N., & Krivonos, Yu., & Lepekha, N. (2007). Synthesis of systems of neurofunctional transducers in solving classification problems. Cybernetics and systems analysis, 3, 47–57.
  5. Krak, I., & Barmak, O., & Manziuk, E. (2020). Using visual analytics to develop human and machine-centric models: A review of approaches and proposed information technology. Computational Intelligence, 1–26. https://doi.org/10.1111/coin.12289
  6. Krak, I., Barmak, O., Manziuk, E., & Kulias, A. (2020). Data Classification Based on the Features Reduction and Piecewise Linear Separation. Advances in Intelligent Systems and Computing, 1072, 282–289. https://doi.org/10.1007/978-3-030-33585-4_28
  7. Menardi, G., & Torelli, N. (2014). Training and assessing classification rules with imbalanced data. In Data Mining and Knowledge Discovery, 28, 92–122. https://core.ac.uk/download/pdf/41172947.pdf
  8. Vahdat, A., & Kautz, J. (2020). NVAE: A Deep Hierarchical Variational Autoencoder. In 34th Conference on Neural Information Processing Systems (NeurIPS 2020). https://doi.org/10.48550/arXiv.2007.03898
  9. Zhang, G., & Chen, Y. (2020). More Informed Random Sample Consensus. https://doi.org/10.48550/arXiv.2011.09116
  10. Zhou, N., & Shi, W., & Liang, R., & Zhong, N. (2022). TextRank Keyword Extraction Algorithm Using Word Vector Clustering Based on Rough Data-Deduction. Computational Intelligence and Neuroscience. https://doi.org/10.1155/2022/5649994

##submission.downloads##

Опубліковано

2023-02-24

Як цитувати

[1]
V. Kuznetsov, I. Krak, Lіashko V., і V. Kasianiuk, «Аналіз і синтез технологій класифікації текстової інформації», NRPCOMP, т. 5, с. 49–53, Лют 2023.