Статья посвящена применению алгоритма Isolation Forest для выявления аномалий в данных мониторинга серверов SaaS проекта. Основная гипотеза исследования заключается в том, что алгоритм может обнаруживать ранние признаки деградации производительности и потенциальные сбои, анализируя базовые метрики, такие как загрузка процессора, использование оперативной памяти, сетевого трафика и дискового пространства. В исследовании тестировались два подхода: первый предполагал анализ каждой метрики отдельно, второй — агрегирование всех метрик в единый показатель для оценки общего состояния системы. Результаты экспериментов показали, что Isolation Forest демонстрирует высокую чувствительность к резким изменениям метрик, что приводит к значительному числу ложных срабатываний. Это особенно актуально при краткосрочных всплесках метрик, которые не обязательно свидетельствуют о реальных проблемах в системе. В статье рассматриваются ограничения этого подхода, включая необходимость точной настройки гиперпараметров, а также предложены возможные решения для улучшения точности выявления аномалий, такие как предварительная обработка данных и комбинирование с другими методами. Данное исследование подчеркивает важность применения продвинутых методов машинного обучения для мониторинга производительности серверов, особенно в условиях ограниченных метрик, характерных для систем с закрытым исходным кодом.
КЕРЕЕВ А.К.
PhD, доцент кафедры Информатики и информационных технологий, Актюбинский региональный университет им. К. Жубанова, Актобе, Казахстан
Е-mail: akereyev@zhubanov.edu.kz, https://orcid.org/0000-0002-8283-5807
МИХЕЛЬСОН О.Ю.
Старший инженер инфраструктуры,ActivSoft, Актобе, Казахстан
Е-mail: miol@activsoft.kz, https://orcid.org/0009-0009-6753-3120
- Ronchieri E. Anomaly Detection in Data Center IT & Physical Infrastructure / Elisabetta Ronchieri, Luca Giommi, Luigi Benedettto Scarponi, Luca Torzi, Alessandro Costantini, Doina Cristina Duma, Davide Salomoni // EPJ Web of Conf. 295 07004 (2024) DOI: 10.1051/epjconf/202429507004 DOI: https://doi.org/10.1051/epjconf/202429507004
- Bursic S. Anomaly Detection from Log Files Using Unsupervised Deep Learning. / Bursic Sathya, Cuculo Vittorio, D'Amelio Alessandro // Formal Methods. FM 2019 International Workshops. FM 2019. Lecture Notes in Computer Science (), vol 12232. Springer, Cham. DOI: 10.1007/978-3-030-54994-7_15 DOI: https://doi.org/10.1007/978-3-030-54994-7_15
- Gu W. Performance Issue Identification in Cloud Systems with Relational-Temporal Anomaly Detection / Wenwei Gu, Jinyang Liu, Zhuangbin Chen, Jianping Zhang, Yuxin Su, Jiazhen Gu, Cong Feng, Zengyin Yang, Michael Lyu // arXiv, 2023. https://arxiv.org/abs/2307.10869
- Liu F. "Isolation Forest" / Fei Tony Liu, Kai Ming Ting, Zhi-Hua Zhou // 2008 Eighth IEEE International Conference on Data Mining, Pisa, Italy, 2008, pp. 413-422, DOI: 10.1109/ICDM.2008.17. DOI: https://doi.org/10.1109/ICDM.2008.17
- Prometheus. Prometheus documentation. [Электронный ресурс]. – Режим доступа: https://prometheus.io/docs/ (дата обращения: 07.10.2024).
- Scikit Learn. Scikit Learn user guide. [Электронный ресурс]. – Режим доступа: https://scikit-learn.org/stable/user_guide.html (дата обращения: 07.10.2024).