Структурований оптимізований пошук у неструктурованих даних для задачі аналізу меню
DOI:
https://doi.org/10.18523/2617-3808.2024.7.63-69Ключові слова:
обробка природної мови, цифрове меню, заклад харчування, місто Київ, пошуковик, ресторанний бізнес, класифікація текстів, видобування інформації, фільтрація даних, структурований пошук, база даних, база знань, онтологія, Protégé, OWL, SWRL, Pellet, різонер, Retrieval-Augmented Generation, інформаційні технології, інформаційна система, великі мовні моделіАнотація
У статті представлено розроблення пошукової системи для цифрових меню закладів харчування Києва українською мовою. Проєкт реалізовано з використанням сучасних методів обробки природної української мови, зокрема для завдань лематизації, класифікації текстів і фільтрації даних. Основну увагу приділено розробленню алгоритмів, які забезпечують пошук інформації про складники страв, харчові обмеження, алергени та інші ключові характеристики.
У рамках дослідження здійснено аналіз цифрових меню київських закладів, що надало змогу сформувати цілісну картину сучасного стану ресторанного бізнесу в Україні. Результати роботи демонструють можливість структурованого та оптимізованого пошуку в неструктурованих даних меню українською мовою, що дає змогу користувачам легко обирати страви, які розміщено ресторанами.
Посилання
- Chan, J. (2018). SQL: Learn SQL (using MySQL) in One Day and Learn It Well. SQL for Beginners with Hands-on Project. (Learn Coding Fast with Hands-On Project. LCF Publishing.
- ChoiceQR — onlain QR meniu dlia zakladiv. (n.d.). ChoiceQR — Smart solutions for modern restaurants. https://choiceqr.com/uk/.
- Kharchovi alerheny v meniu restoranu: yak zrobyty vash zaklad bezpechnym? — Bloh ChoiceQR. (2023, 23 November). ChoiceQR — Smart solutions for modern restaurants. https://choiceqr.com/uk/news/harchovi-alergeny-v-menyu-restoranu-yak-zrobyty-vash-zakladbezpechnym.
- Pellet — Semantic Web Standards. (2011, 9 January). W3C. https://www.w3.org/2001/sw/wiki/Pellet.protégé. (n.d.). protégé. https://protege.stanford.edu/.
- Sabry, F. (2023). Information Extraction. One Billion Knowledgeable.
- Siddharth, L., & Jianxi, L. (2024). Retrieval augmented generation using engineering design knowledge. Knowledge-Based Systems. https://doi.org/10.1016/j.knosys.2024.112410.
- Straka, M. (2018). UDPipe 2.0 Prototype at CoNLL 2018 UD Shared Task. Proceedings of CoNLL 2018: The SIGNLL Conference on Computational Natural Language Learning, 197–207.
- SWRL: A Semantic Web Rule Language Combining OWL and RuleML. (2004, 21 May). W3C. https://www.w3.org/submissions/SWRL/.
##submission.downloads##
Опубліковано
Номер
Розділ
Ліцензія
Авторське право (c) 2024 O. Smysh, A. Chyzhova

Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.
Автори, які публікуються у цьому журналі, погоджуються з такими умовами:
а) Автори зберігають за собою авторські права на твір на умовах ліцензії CC BY 4.0 Creative Commons Attribution International License, котра дозволяє іншим особам вільно поширювати (копіювати і розповсюджувати матеріал у будь-якому вигляді чи форматі) та змінювати (міксувати, трансформувати, і брати матеріал за основу для будь-яких цілей, навіть комерційних) опублікований твір на умовах зазначення авторства.
б) Журнал дозволяє автору (авторам) зберігати авторські права без обмежень.
в) Автори мають право укладати самостійні додаткові угоди щодо поширення твору (наприклад, розміщувати роботу в електронному репозитарії), за умови збереження посилання на його першу публікацію. (Див. Політика Самоархівування)
г) Політика журналу дозволяє розміщення авторами в мережі Інтернет (наприклад, у репозитаріях) тексту статті, як до подання його до редакції, так і під час його редакційного опрацювання, оскільки це сприяє виникненню продуктивної наукової дискусії та позитивно позначається на оперативності та динаміці цитування опублікованої роботи (див. The Effect of Open Access).