Analysis and Synthesis of Technology for Textual Information Classification

Vladyslav Kuznetsov; Iurii Krak; Volodymyr Lіashko; Veda Kasianiuk

doi:10.18523/2617-3808.2022.5.49-53

Аналіз і синтез технологій класифікації текстової інформації

Автор(и)

Vladyslav Kuznetsov Інститут кібернетики імені В. М. Глушкова НАН України, Україна https://orcid.org/0000-0002-1068-769X
Iurii Krak Київський національний університет імені Тараса Шевченка; Інститут кібернетики імені В. М. Глушкова НАН України, Україна https://orcid.org/0000-0002-8043-0785
Volodymyr Lіashko Національний університет «Києво-Могилянська академія», Україна
Veda Kasianiuk Київський національний університет імені Тараса Шевченка, Україна https://orcid.org/0000-0003-3268-303X

DOI:

https://doi.org/10.18523/2617-3808.2022.5.49-53

Ключові слова:

оброблення текстів, видобуток ознак, візуальна аналітика, алгоритми класифікації, зменшення розмірності ознак

Анотація

Розглянуто задачу якісного аналізу процесу перетворення текстової інформації на набір ознак і відповідно перетворення цих ознак на набір, зручний для візуального аналізу. Розглянуто структуру типової технології з аналізу текстової інформації та визначено її основні елементи. Детально наведено опис кожного елементу технології аналізу та класифікації текстової інформації із залученням методів класифікації та групування ознак. Проведено експериментальні випробування окремих компонентів цієї технології.

Біографії авторів

Vladyslav Kuznetsov, Інститут кібернетики імені В. М. Глушкова НАН України

Кузнєцов Владислав Олександрович – кандидат технічних наук, науковий співробітник Інституту кібернетики імені В. М. Глушкова НАН України, kuznetsow.wlad@gmail.com

Iurii Krak, Київський національний університет імені Тараса Шевченка; Інститут кібернетики імені В. М. Глушкова НАН України

Крак Юрій Васильович – доктор фізико-математичних наук, професор, член-кореспондент НАН України, завідувач кафедри теоретичної кібернетики Київського національного університету імені Тараса Шевченка, провідний науковий співробітник Інституту кібернетики імені В. М. Глушкова НАН України (за сумісництвом), yuri.krak@gmail.com

Volodymyr Lіashko, Національний університет «Києво-Могилянська академія»

Ляшко Володимир Іванович – кандидат фізико-математичних наук, доцент кафедри інформатики Національного університету «Києво-Могилянська академія», v.lyashko@ukr.net

Veda Kasianiuk, Київський національний університет імені Тараса Шевченка

Касянюк Вєда Станіславівна – кандидат фізико-математичних наук, завідувач лабораторії теоретичної кібернетики Київського національного університету імені Тараса Шевченка, veda.kasianiuk@gmail.com

Посилання

Aloysius, N., & Geetha, M. (2017). A review on deep convolutional neural networks. In International Conference on Communication and Signal Processing (ICCSP), 0588–0592. https://doi.org/10.1109/ICCSP.2017.8286426
Alzubaidi, L., Zhang, J., Humaidi, A. J., et al. (2021). Review of deep learning: concepts, CNN ar-chitectures, challenges, applications, future directions. Journal of Big Data, 8 (53), 1–74. https://doi.org/10.1186/s40537-021-00444-8
Chan, D. M., & Rao, R. & Huang, F., & Canny, J. F. (2018). T-SNE-CUDA: GPU-Accelerated T-SNE and its Applications to Modern Data. In 30th International Symposium on Computer Architecture and High Performance Computing (SBAC-PAD), 330–338. https://doi.org/10.1109/CAHPC.2018.8645912
Kirichenko, N., & Krivonos, Yu., & Lepekha, N. (2007). Synthesis of systems of neurofunctional transducers in solving classification problems. Cybernetics and systems analysis, 3, 47–57.
Krak, I., & Barmak, O., & Manziuk, E. (2020). Using visual analytics to develop human and machine-centric models: A review of approaches and proposed information technology. Computational Intelligence, 1–26. https://doi.org/10.1111/coin.12289
Krak, I., Barmak, O., Manziuk, E., & Kulias, A. (2020). Data Classification Based on the Features Reduction and Piecewise Linear Separation. Advances in Intelligent Systems and Computing, 1072, 282–289. https://doi.org/10.1007/978-3-030-33585-4_28
Menardi, G., & Torelli, N. (2014). Training and assessing classification rules with imbalanced data. In Data Mining and Knowledge Discovery, 28, 92–122. https://core.ac.uk/download/pdf/41172947.pdf
Vahdat, A., & Kautz, J. (2020). NVAE: A Deep Hierarchical Variational Autoencoder. In 34th Conference on Neural Information Processing Systems (NeurIPS 2020). https://doi.org/10.48550/arXiv.2007.03898
Zhang, G., & Chen, Y. (2020). More Informed Random Sample Consensus. https://doi.org/10.48550/arXiv.2011.09116
Zhou, N., & Shi, W., & Liang, R., & Zhong, N. (2022). TextRank Keyword Extraction Algorithm Using Word Vector Clustering Based on Rough Data-Deduction. Computational Intelligence and Neuroscience. https://doi.org/10.1155/2022/5649994

##submission.downloads##

Опубліковано

2023-02-24

Як цитувати

Kuznetsov, V., Krak, I., Lіashko V., & Kasianiuk, V. (2023). Аналіз і синтез технологій класифікації текстової інформації. Наукові записки НаУКМА. Комп’ютерні науки, 5, 49–53. https://doi.org/10.18523/2617-3808.2022.5.49-53

Завантажити посилання

Номер

Том 5 (2022): Наукові записки НаУКМА. Комп’ютерні науки

Розділ

Програмна інженерія

Ліцензія

Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.

Автори, які публікуються у цьому журналі, погоджуються з такими умовами:

а) Автори зберігають за собою авторські права на твір на умовах ліцензії CC BY 4.0 Creative Commons Attribution International License, котра дозволяє іншим особам вільно поширювати (копіювати і розповсюджувати матеріал у будь-якому вигляді чи форматі) та змінювати (міксувати, трансформувати, і брати матеріал за основу для будь-яких цілей, навіть комерційних) опублікований твір на умовах зазначення авторства.

б) Журнал дозволяє автору (авторам) зберігати авторські права без обмежень.

в) Автори мають право укладати самостійні додаткові угоди щодо поширення твору (наприклад, розміщувати роботу в електронному репозитарії), за умови збереження посилання на його першу публікацію. (Див. Політика Самоархівування)

г) Політика журналу дозволяє розміщення авторами в мережі Інтернет (наприклад, у репозитаріях) тексту статті, як до подання його до редакції, так і під час його редакційного опрацювання, оскільки це сприяє виникненню продуктивної наукової дискусії та позитивно позначається на оперативності та динаміці цитування опублікованої роботи (див. The Effect of Open Access).