Аналізування українськомовних віршів засобами обробки природної мови

Автор(и)

  • Олег Русланович Смиш Національний університет «Києво-Могилянська академія», Україна https://orcid.org/0000-0002-8074-9745
  • Дмитро Віталійович Швець Національний університет «Києво-Могилянська академія», Україна https://orcid.org/0009-0002-7681-9744

DOI:

https://doi.org/10.18523/2617-3808.2025.8.213-224

Ключові слова:

обробка природної мови, парсер, мовний аналізатор, великі мовні моделі, вебзастосунок, українська мова, вірш, аналіз вірша, троп, художній засіб, віршовий розмір, рима, спосіб римування

Анотація

У статті описано розроблення та застосування парсера для комплексного аналізування українськомовних віршів. Створено механізми визначення віршового розміру, рим і способів римування, що ґрунтуються на побудові схем наголошування. Парсер дає змогу виявляти входження 16 художніх засобів на трьох рівнях оброблення тексту. На фонологічному рівні застосовано rule-based підходи в аналізуванні тексту, на морфосинтаксичному — оброблення даних формату CoNLL-U, сформованих із результатів роботи трьох мовних аналізаторів, а для виявлення тропів на семантичному рівні — використано велику мовну модель.
Створено вебзастосунок для наочної взаємодії з функціями парсера. Розроблений інструмент застосовано для аналізування трьох українськомовних збірок віршів.

Біографії авторів

Олег Русланович Смиш, Національний університет «Києво-Могилянська академія»

доктор філософії з комп’ютерних наук, старший викладач кафедри мультимедійних систем факультету інформатики Національного університету «Києво-Могилянська академія», o.smysh@ukma.edu.ua, https://orcid.org/0000-0002-8074-9745

Дмитро Віталійович Швець, Національний університет «Києво-Могилянська академія»

студент бакалаврської програми «Інженерія програмного забезпечення» факультету інформатики Національного університету «Києво-Могилянська академія», d.shvets@ukma.edu.ua, https://orcid.org/0009-0002-7681-9744

Посилання

  1. Claude. Anthropic. https://claude.ai.
  2. CoNLL-U Format. Universal Dependencies. https://universaldependencies.org/format.html.
  3. FastAPI. https://fastapi.tiangolo.com.
  4. Gemini. Google AI. https://gemini.google.com.
  5. GitHub - lang-word-stress: uk/ukrainianAdds word stress to Ukrainian texts. GitHub. https://github.com/lang-uk/ukrainian-word-stress.
  6. GitHub - techwithanirudh/gpt4free: The official gpt4free. GitHub. https://github.com/techwithanirudh/gpt4free.
  7. Kovaliv, Yu. I. (2007a). Literaturoznavcha entsyklopediia (T. 1). VTs “Akademiia” [in Ukrainian].
  8. Kovaliv, Yu. I. (2007b). Literaturoznavcha entsyklopediia (T. 1). VTs “Akademiia” [in Ukrainian].
  9. Liddy, E. (2001). Natural Language Processing. Library and Information Science (2nd ed.). Marcel Decker, Inc, NY, USA.
  10. OpenAI. (2023). GPT-4 Technical Report. Computation and Language. https://doi.org/10.48550/arXiv.2303.08774.
  11. Prohrama ZNO z ukrainskoi movy i literatury 2025 roku. (2025). Osvita.UA. https://osvita.ua/test/program_zno/946 [in Ukrainian].
  12. SpaCy · Industrial-strength Natural Language Processing in Python. SpaCy. https://spacy.io.
  13. Stanza Overview. Stanza. https://stanfordnlp.github.io/stanza.
  14. UDPipe. CZ. LINDAT / CLARIAH. https://lindat.mff.cuni.cz/services/udpipe.
  15. Ukrainian speaking countries. Worlddata.info. https://www.worlddata.info/languages/ukrainian.php.

##submission.downloads##

Опубліковано

2025-11-26