Автоматизована система виявлення аномалій у бізнес-даних
DOI:
https://doi.org/10.18523/2617-3808.2025.8.158-166Ключові слова:
виявлення аномалій, програмна система, вимоги до системи, архітектура, технології, вебдодаток, FastAPI, Celery, REST API, PandasАнотація
У статті описано проведений аналіз процесу виявлення аномалій у бізнес-даних, відомі програмні рішення, сформульовано вимоги до системи та описано розроблену автоматизовану програмну систему виявлення аномалій. Ця система складається з програмних модулів, має високу адаптивність, є легкою до модифікації і зручною у використанні.
Розроблена система повністю відповідає поставленим раніше вимогам: легкість у налаштуванні забезпечується інтерфейсом користувача і інтерактивним процесом, гнучкість і легкість кастомізації — обраними технологіями та архітектурними абстракціями, надійність — розділенням компонентів через чергу задач, функціональні вимоги — розробленими складовими модулями. Система виконує поставлену задачу автоматизованого виявлення аномалій у бізнес-даних і відповідає сучасним стандартам у галузі даних.
Посилання
- Arthur, C. (2013). Tech giants may be huge, but nothing matches big data. The Guardian. https://www.theguardian.com/technology/2013/aug/23/tech-giants-data.
- Brownlow, J., et al. (2015). Data-driven business models: A blueprint for innovation. https://doi.org/10.13140/RG.2.1.2233.2320.
- Chandola, V., Banerjee, A., & Kumar, V. (2009). Anomaly detection: A survey. ACM Computing Surveys, 41 (3), 1–58. https://doi.org/10.1145/1541880.1541882.
- Edgeworth, F. Y. (1887). On discordant observations. The London, Edinburgh, and Dublin Philosophical Magazine and Journal of Science, 23 (143), 364–375. https://doi.org/10.1080/14786448708628471.
- Features — FastAPI. FastAPI. https://fastapi.tiangolo.com/features.
- GitHub — chaos-genius/chaos_genius: ML powered analytics engine for outlier detection and root cause analysis. GitHub. https://github.com/chaosgenius/chaos_genius.
- GitHub — cuebook/CueObserve: Timeseries anomaly detection and root cause analysis on data in SQL data warehouses and databases. GitHub. https://github.com/cuebook/CueObserve.
- GitHub — elementary-data/elementary: The dbt-native data observability solution for data & analytics engineers. Monitor your data pipelines in minutes. Available as self-hosted or cloud service with premium features. GitHub. https://github.com/elementary-data/elementary.
- Grubbs, F. E. (1969). Procedures for detecting outlying observations in samples. Technometrics, 11 (1), 1–21.
- Hawkins, D. M. (1980). Identification of outliers. Springer Netherlands. https://doi.org/10.1007/978-94-015-3994-4.
- Ravishankar, D. T. N. (2022). Application of time series analysis for better decision making in business. Technoarete Transactions on Intelligent Data Mining and Knowledge Discovery, 2 (4). https://doi.org/10.36647/ttidmkd/02.04.a005.
##submission.downloads##
Опубліковано
Номер
Розділ
Ліцензія
Авторське право (c) 2025 M. Postnikov, S. Gorokhovsky

Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.
Автори, які публікуються у цьому журналі, погоджуються з такими умовами:
а) Автори зберігають за собою авторські права на твір на умовах ліцензії CC BY 4.0 Creative Commons Attribution International License, котра дозволяє іншим особам вільно поширювати (копіювати і розповсюджувати матеріал у будь-якому вигляді чи форматі) та змінювати (міксувати, трансформувати, і брати матеріал за основу для будь-яких цілей, навіть комерційних) опублікований твір на умовах зазначення авторства.
б) Журнал дозволяє автору (авторам) зберігати авторські права без обмежень.
в) Автори мають право укладати самостійні додаткові угоди щодо поширення твору (наприклад, розміщувати роботу в електронному репозитарії), за умови збереження посилання на його першу публікацію. (Див. Політика Самоархівування)
г) Політика журналу дозволяє розміщення авторами в мережі Інтернет (наприклад, у репозитаріях) тексту статті, як до подання його до редакції, так і під час його редакційного опрацювання, оскільки це сприяє виникненню продуктивної наукової дискусії та позитивно позначається на оперативності та динаміці цитування опублікованої роботи (див. The Effect of Open Access).

