Аналіз і синтез технологій класифікації текстової інформації
DOI:
https://doi.org/10.18523/2617-3808.2022.5.49-53Ключові слова:
оброблення текстів, видобуток ознак, візуальна аналітика, алгоритми класифікації, зменшення розмірності ознакАнотація
Розглянуто задачу якісного аналізу процесу перетворення текстової інформації на набір ознак і відповідно перетворення цих ознак на набір, зручний для візуального аналізу. Розглянуто структуру типової технології з аналізу текстової інформації та визначено її основні елементи. Детально наведено опис кожного елементу технології аналізу та класифікації текстової інформації із залученням методів класифікації та групування ознак. Проведено експериментальні випробування окремих компонентів цієї технології.
Посилання
- Aloysius, N., & Geetha, M. (2017). A review on deep convolutional neural networks. In International Conference on Communication and Signal Processing (ICCSP), 0588–0592. https://doi.org/10.1109/ICCSP.2017.8286426
- Alzubaidi, L., Zhang, J., Humaidi, A. J., et al. (2021). Review of deep learning: concepts, CNN ar-chitectures, challenges, applications, future directions. Journal of Big Data, 8 (53), 1–74. https://doi.org/10.1186/s40537-021-00444-8
- Chan, D. M., & Rao, R. & Huang, F., & Canny, J. F. (2018). T-SNE-CUDA: GPU-Accelerated T-SNE and its Applications to Modern Data. In 30th International Symposium on Computer Architecture and High Performance Computing (SBAC-PAD), 330–338. https://doi.org/10.1109/CAHPC.2018.8645912
- Kirichenko, N., & Krivonos, Yu., & Lepekha, N. (2007). Synthesis of systems of neurofunctional transducers in solving classification problems. Cybernetics and systems analysis, 3, 47–57.
- Krak, I., & Barmak, O., & Manziuk, E. (2020). Using visual analytics to develop human and machine-centric models: A review of approaches and proposed information technology. Computational Intelligence, 1–26. https://doi.org/10.1111/coin.12289
- Krak, I., Barmak, O., Manziuk, E., & Kulias, A. (2020). Data Classification Based on the Features Reduction and Piecewise Linear Separation. Advances in Intelligent Systems and Computing, 1072, 282–289. https://doi.org/10.1007/978-3-030-33585-4_28
- Menardi, G., & Torelli, N. (2014). Training and assessing classification rules with imbalanced data. In Data Mining and Knowledge Discovery, 28, 92–122. https://core.ac.uk/download/pdf/41172947.pdf
- Vahdat, A., & Kautz, J. (2020). NVAE: A Deep Hierarchical Variational Autoencoder. In 34th Conference on Neural Information Processing Systems (NeurIPS 2020). https://doi.org/10.48550/arXiv.2007.03898
- Zhang, G., & Chen, Y. (2020). More Informed Random Sample Consensus. https://doi.org/10.48550/arXiv.2011.09116
- Zhou, N., & Shi, W., & Liang, R., & Zhong, N. (2022). TextRank Keyword Extraction Algorithm Using Word Vector Clustering Based on Rough Data-Deduction. Computational Intelligence and Neuroscience. https://doi.org/10.1155/2022/5649994
##submission.downloads##
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія
Авторське право (c) 2023 Vladyslav Kuznetsov, Iurii Krak, Volodymyr Lіashko, Veda Kasianiuk
Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.
Автори, які публікуються у цьому журналі, погоджуються з такими умовами:
а) Автори зберігають за собою авторські права на твір на умовах ліцензії CC BY 4.0 Creative Commons Attribution International License, котра дозволяє іншим особам вільно поширювати (копіювати і розповсюджувати матеріал у будь-якому вигляді чи форматі) та змінювати (міксувати, трансформувати, і брати матеріал за основу для будь-яких цілей, навіть комерційних) опублікований твір на умовах зазначення авторства.
б) Журнал дозволяє автору (авторам) зберігати авторські права без обмежень.
в) Автори мають право укладати самостійні додаткові угоди щодо поширення твору (наприклад, розміщувати роботу в електронному репозитарії), за умови збереження посилання на його першу публікацію. (Див. Політика Самоархівування)
г) Політика журналу дозволяє розміщення авторами в мережі Інтернет (наприклад, у репозитаріях) тексту статті, як до подання його до редакції, так і під час його редакційного опрацювання, оскільки це сприяє виникненню продуктивної наукової дискусії та позитивно позначається на оперативності та динаміці цитування опублікованої роботи (див. The Effect of Open Access).