Managerial aspects of reinforcement learning for infection control in Ukraine: A Q-training approach

Денис Володимирович Невінський; Ярослав Ігорович Виклюк

doi:10.32347/2412-9933.2026.65.88-96

Автор(и)

Денис Володимирович Невінський Національний університет «Львівська політехніка», Львів, Україна https://orcid.org/0000-0002-0962-072X
Ярослав Ігорович Виклюк Національний університет «Львівська політехніка», Львів, Україна https://orcid.org/0000-0003-4766-4659

DOI:

https://doi.org/10.32347/2412-9933.2026.65.88-96

Ключові слова:

профілактика інфекцій, навчання з підкріпленням, Q-навчання, математичне моделювання, інфекційний контроль, оптимізація медичних ресурсів

Анотація

Розглянуто критично важливе завдання оптимізації управлінських рішень для контролю поширення вірусних інфекцій – проблема, що набула глобального значення після пандемії COVID-19. Основною метою дослідження є розробка та впровадження системи на основі навчання з підкріпленням для динамічного управління обмежувальними заходами (такими як самоізоляція, масковий режим та закриття установ) задля мінімізації кількості критичних випадків за одночасного зменшення економічних і соціальних втрат. Методологія поєднує епідеміологічну модель SEIR із комплексною мультиагентною системою. Середовище моделювання складається з функціональних блоків, включаючи будівлі (будинки, школи, офіси, магазини та ресторани), та агентів, класифікованих за віком і соціальними ролями. Для оптимізації стратегій обмежень застосовано підхід Q-навчання. Функція винагороди для моделі навчання ретельно розроблена для збалансування трьох ключових цілей: мінімізації суворості обмежень, забезпечення плавних переходів між рівнями карантину та скорочення загальної кількості критично хворих пацієнтів. Система була протестована з використанням геопросторових і демографічних даних міста Києва (Україна) для симуляції популяції чисельністю приблизно 20 000 осіб. Було проаналізовано три сценарії: базовий без обмежень, сценарій із заздалегідь встановленими статичними обмеженнями та підхід динамічного управління на основі навчання з підкріпленням. Результати демонструють, що динамічна стратегія значно перевершує традиційні підходи. Зокрема, запропонована модель навчання з підкріпленням забезпечила зниження максимальної кількості критичних випадків у Києві на 14,43% порівняно зі сценарієм статичних обмежень. Крім того, дослідження надає візуалізацію динаміки інфекції на цифровій карті, що дозволяє спостерігати за переміщенням агентів та зміною їхніх станів (сприйнятливі, інфіковані, одужалі та критичні) у режимі реального часу. Отримані результати свідчать про те, що розроблена система є потужним інструментом для органів охорони здоров'я та державного управління під час планування ефективних превентивних заходів проти майбутніх епідеміологічних загроз. Попри обмежений час навчання, модель виявилася здатною до автономної генерації стратегій, що підкреслює її потенціал для адаптивного управління пандеміями.

Біографії авторів

Денис Володимирович Невінський, Національний університет «Львівська політехніка», Львів

Кандидат технічних наук, доцент кафедри електронних засобів інформаційно-комп'ютерних технологій

Ярослав Ігорович Виклюк, Національний університет «Львівська політехніка», Львів

Доктор технічних наук, професор кафедри штучного інтелекту

Посилання

Viral disease. Wikipedia. Sep. 16, 2022. Accessed: Oct. 31, 2024. [Online]. Available: https://en.wikipedia.org/w/index.php?title=Viral_disease&oldid=1110529921

COVID-19 Coronavirus Infection. Public Health Center of Ukraine. Accessed: Oct. 31, 2024. [Online]. Available: https://phc.org.ua/kontrol-zakhvoryuvan/inshi-infekciyni-zakhvoryuvannya/koronavirusna-infekciya-covid-19

Impact of the coronavirus pandemic on the global economy - Statistics & Facts. Statista. Accessed: Oct. 31, 2024. [Online]. Available: https://www.statista.com/topics/6139/covid-19-impact-on-the-global-economy/#editorsPicks

SmythOS. Examples of Multi-Agent Systems in Action: Key Use Cases Across Industries. Accessed: Nov. 08, 2024. [Online]. Available: https://smythos.com/artificial-intelligence/multi-agent-systems/examples-of-multi-agent-systems/

Gressman, P. T., & Peck, J. R. (2020). Simulating COVID-19 in a university environment. Mathematical Biosciences, 328, 108436. https://doi.org/10.1016/j.mbs.2020.108436

Batista, B., Dickenson, D., Gurski, K., Kebe, M., & Rankin, N. (2020). Minimizing disease spread on a quarantined cruise ship: A model of COVID-19 with asymptomatic infections. Mathematical Biosciences, 329, 108442. https://doi.org/10.1016/j.mbs.2020.108442

Mettler, S. K., et al. (2021). The importance of timely contact tracing – A simulation study. International Journal of Infectious Diseases, 108, 309–319. https://doi.org/10.1016/j.ijid.2021.04.029

Xu, Z., Wu, B., & Topcu, U. (2021). Control strategies for COVID-19 epidemic with vaccination, shield immunity and quarantine: A metric temporal logic approach. PLoS One, 16 (3), e0247660. https://doi.org/10.1371/journal.pone.0247660

Engbert, R., Rabe, M. M., Kliegl, R., & Reich, S. (2021). Sequential Data Assimilation of the Stochastic SEIR Epidemic Model for Regional COVID-19 Dynamics. Bulletin of Mathematical Biology, 83 (1), 1. https://doi.org/10.1007/s11538-020-00834-8

Reinforcement learning. GeeksforGeeks. Accessed: Apr. 22, 2024. [Online]. Available: https://www.geeksforgeeks.org/what-is-reinforcement-learning/

Baz, D. E., & Doncescu, A. (2023). Fuzzy Multi-Agent Simulation of COVID-19 Pandemic Spreading. arXiv. https://doi.org/10.48550/ARXIV.2310.17986

Lazebnik, T., & Spiegel, O. (2023). Individual Variation Affects Outbreak Magnitude and Predictability in an Extended Multi-Pathogen SIR Model of Pigeons Vising Dairy Farms. arXiv. https://doi.org/10.48550/ARXIV.2310.08613

Deshkar, G., Kshirsagar, J., Hayatnagarkar, H., & Venugopalan, J. (2023). Epidemic Control on a Large-Scale-AgentBased Epidemiology Model using Deep Deterministic Policy Gradient. arXiv. https://doi.org/10.48550/ARXIV.2304.04475

Yang, Q., Chu, S. C., Pan, J. S., Chou, J. H., & Watada, J. (2024). Dynamic multi-strategy integrated differential evolution algorithm based on reinforcement learning for optimization problems. Complex and Intelligent Systems, 10 (2), 1845–1877. https://doi.org/10.1007/s40747-023-01243-9

Zhang, W., Valencia, A., & Chan, N. B. (2023). Synergistic Integration Between Machine Learning and Agent-Based Modeling: A Multidisciplinary Review. IEEE Transactions on Neural Networks and Learning Systems, 34 (5), 2170–2190. https://doi.org/10.1109/TNNLS.2021.3106777

Vyklyuk, Y., Nevinskyi, D., & Hazdiuk, K. (2024). Continuous-discrete GeoSEIR(D) model for modelling and analysis of geo spread COVID-19. Intelligence-Based Medicine, 10, 100155. https://doi.org/10.1016/j.ibmed.2024.100155

Vyklyuk, Y., Nevinskyi, D., Chopyak, V., Škoda, M., Golubovska, O., & Hazdiuk, K. (2023). A Managerial Approach towards Modeling the Different Strains of the COVID-19 Virus Based on the Spatial GeoCity Model. Viruses, 15 (12), 2299. https://doi.org/10.3390/v15122299

Vyklyuk, Y., Manylich, M., Škoda, M., Radovanović, M. M., & Petrović, M. D. (2021). Modeling and analysis of different scenarios for the spread of COVID-19 by using the modified multi-agent systems – Evidence from the selected countries. Results in Physics, 20, 103662. https://doi.org/10.1016/j.rinp.2020.103662

Vyklyuk, Y., Nevinskyi, D., & Boyko, N. (2023). GEOCITY – A NEW DYNAMIC-SPATIAL MODEL OF URBAN ECOSYSTEM. Journal of the Geographical Institute Jovan Cvijic SASA, 73 (2), 187–203. https://doi.org/10.2298/IJGI2302187V.

Allioui, H., et al. (2022). A Multi-Agent Deep Reinforcement Learning Approach for Enhancement of COVID-19 CT Image Segmentation. Journal of Personalized Medicine, 12 (2), 309. https://doi.org/10.3390/jpm12020309

Управлінські аспекти навчання з підкріпленням для контролю інфекцій в Україні: Підхід на основі Q-навчання

Автор(и)

DOI:

Ключові слова:

Анотація

Біографії авторів

Денис Володимирович Невінський, Національний університет «Львівська політехніка», Львів

Ярослав Ігорович Виклюк, Національний університет «Львівська політехніка», Львів

Посилання

##submission.downloads##

Опубліковано

Як цитувати

Номер

Розділ

Ліцензія

##plugins.block.developedBy.blockTitle##

Мова

Інформація