Моделі машинного навчання для автоматизації генерації та пріоритезації тестових сценаріїв програмного забезпечення

Олексій Миколайович Лопуга

doi:10.32347/2412-9933.2026.65.141-149

Автор(и)

Олексій Миколайович Лопуга Київський національний університет будівництва і архітектури, Київ, Україна https://orcid.org/0000-0001-6397-2710

DOI:

https://doi.org/10.32347/2412-9933.2026.65.141-149

Ключові слова:

тестування програмного забезпечення, генерація тестів, пріоритезація тестів, градієнтне прискорення, машинне навчання, ітеративне навчання, безперервна інтеграція

Анотація

Досліджено можливості застосування моделей машинного навчання для автоматизації процесів генерації та пріоритезації тестових сценаріїв програмного забезпечення (ПЗ) у динамічному середовищі безперервної інтеграції (CI/CD). Актуальність роботи зумовлена необхідністю швидкого формування висновків щодо якості програмних систем в умовах експоненційного зростання кількості критичних додатків. Наукова новизна дослідження полягає у розробці гібридного підходу, що вперше об’єднує ансамблеві моделі градієнтного бустингу (GBDT) для прогнозування дефектів із алгоритмами навчання з підкріпленням (Q-learning) для адаптивної пріоритезації тестів. Формалізовано задачу пріоритезації як задачу комбінаторної оптимізації з ваговою функцією та визначено ключові метрики оцінки якості: APFD (Average Percentage of Faults Detected) та її модифіковану версію NAPFD, яка враховує часові витрати. Розроблено оригінальну онтологічну модель факторів впливу на якість ПЗ, що структурує внутрішні (складність коду), зовнішні (інфраструктура) та людські чинники (кваліфікація розробників). Для агента навчання з підкріпленням запропоновано модифіковану функцію винагороди, яка збалансовано враховує факт виявлення дефекту, тривалість тесту та його історичну ефективність. Експериментальну валідацію проведено на основі еталонних наборів даних із репозиторію AEEEM, що охоплюють реальні дані про дефекти п’яти відкритих проєктів екосистеми Eclipse: JDT Core, Equinox, Lucene, Mylyn та PDE. Результати порівняльного аналізу засвідчили, що інтеграція GBDT з Q-learning забезпечує підвищення метрики APFD на 8,1% порівняно з найкращим базовим методом XGBoost та на 4,6% порівняно з існуючим методом RETECS. Це підтверджує високу ефективність запропонованого підходу для оптимізації тестових запусків при обмеженому часовому бюджеті. Час навчання гібридної моделі становить 163,2 с, що є цілком прийнятним для практичного впровадження у промислові pipeline-процеси розробки програмного забезпечення.

Біографія автора

Олексій Миколайович Лопуга, Київський національний університет будівництва і архітектури, Київ

Аспірант кафедри інформаційних технологій

Посилання

Stack Overflow. (2024). Developer Survey 2024. URL: https://survey.stackoverflow.co/2024/.

Paskov, R. M., & Terenchuk, S. A. (2019). Modeling an intelligent software testing support system. In: Proceedings of the International Scientific and Practical Conference “Actual Issues of Test Automation”. Kyiv: KNUBA, pp. 429–432. [Ukrainian source in Ukraine].

Alagarsamy, S., Tantithamthavorn, C., & Aleti, A. (2024). A3Test: Assertion-Augmented Automated Test Case Generation. Information and Software Technology, vol. 176, art. 107565, pp. 1–15. URL: https://doi.org/10.1016/j.infsof.2024.107565.

A Review of Large Language Models for Automated Test Case Generation. (2025). Machine Learning and Knowledge Extraction, vol. 7(3), art. 97, pp. 1120–1145. URL: https://doi.org/10.3390/make7030097.

Spieker, H., Gotlieb, A., Marijan, D., & Mossige, M. (2017). Reinforcement learning for automatic test case prioritization and selection in continuous integration. In: Proceedings of the 26th ACM SIGSOFT International Symposium on Software Testing and Analysis, pp. 12–22. URL: https://doi.org/10.1145/3092703.3092709.

Abualigah, L. et al. (2024). Software Defect Prediction Using Extreme Gradient Boosting (XGBoost). AL-Rafidain Journal of Computer Sciences and Mathematics, vol. 18(1), pp. 154–168. URL: https://doi.org/10.33899/csmj.2024.49564.

Hu, Y., Wu, L., Li, N., & Zhao, T. (2024). Multi-Agent Decision-Making in Construction Engineering and Management: A Systematic Review. Sustainability, vol. 16, p. 7132. URL: https://doi.org/10.3390/su16167132.

GeeksforGeeks. (n.d.). F1 Score in Machine Learning. URL: https://www.geeksforgeeks.org/f1-score-in-machinelearning/.

Ke, G., Meng, Q., Finley, T., Wang, T., Chen, W., Ma, W., Ye, Q., & Liu, T.-Y. (2017). LightGBM: A Highly Efficient Gradient Boosting Decision Tree. In: Advances in Neural Information Processing Systems, pp. 3149–3157.

GeeksforGeeks. (n.d.). Categorical Cross-Entropy in Multi-Class Classification. URL: https://www.geeksforgeeks.org/categorical-cross-entropy-in-multi-class-classification/.

Bertolino, A., Guerriero, A., Miranda, B. et al. (2020). Learning-to-rank vs ranking-to-learn: Strategies for regression testing in continuous integration. In: Proceedings of ICSE, pp. 1–12.

Watkins, C. J. C. H., & Dayan, P. (1992). Q-learning. Machine Learning, vol. 8, pp. 279–292.

Yang, Y., Li, Z., He, L., & Zhao, R. (2020). A systematic study of reward for reinforcement learning-based continuous integration testing. Journal of Systems and Software, vol. 170, art. 110787. URL: https://doi.org/10.1016/j.jss.2020.110787.

D’Ambros, M., Lanza, M., & Robbes, R. (2010). An extensive comparison of bug prediction approaches. In: Mining Software Repositories (MSR), pp. 31–41.

Chen, T., & Guestrin, C. (2016). XGBoost: A Scalable Tree Boosting System. In: Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, pp. 785–794. URL: https://doi.org/10.1145/2939672.2939785.

Qian, Z. et al. (2025). Reinforcement learning for test case prioritization based on LLEed K-means clustering. Information and Software Technology, vol. 179, pp. 107–121. URL: https://doi.org/10.1016/j.infsof.2024.107654.

Software Defect Prediction Using Stacking Generalization of Optimized Tree-Based Ensembles. (2022). Applied Sciences, vol. 12(9), art. 4577, pp. 1–22. URL: https://doi.org/10.3390/app12094577.

Wang, H. et al. (2024). A software defect prediction method using binary gray wolf optimizer and ML algorithms. Computers & Electrical Engineering, vol. 118, pp. 109–125. URL: https://doi.org/10.1016/j.compeleceng.2024.109336.

Baqar, M. (2024). The Future of Software Testing: AI-Powered Test Case Generation and Validation. arXiv preprint. URL: https://arxiv.org/abs/2409.05808.

Моделі машинного навчання для автоматизації генерації та пріоритезації тестових сценаріїв програмного забезпечення

Автор(и)

DOI:

Ключові слова:

Анотація

Біографія автора

Олексій Миколайович Лопуга, Київський національний університет будівництва і архітектури, Київ

Посилання

##submission.downloads##

Опубліковано

Як цитувати

Номер

Розділ

Ліцензія

##plugins.block.developedBy.blockTitle##

Мова

Інформація