Дослідження та вибір великих мовних моделей для автоматизації міграції АВАР-коду
DOI:
https://doi.org/10.32347/2412-9933.2025.63.191-200Ключові слова:
ERP-система, міграція ABAP-коду, велика мовна модель, критерії вибору, метод AHP-TOPSISАнотація
Досліджено проблему міграції програмного коду при переході зі старої версії системи SAP ERP 6.0 на сучасні ERP-платформи, зокрема SAP S/4HANA. Обґрунтовано необхідність автоматизації процесу міграції з використанням методів та засобів штучного інтелекту. Комплексний аналіз існуючих академічних та промислових тематичних досліджень підтвердив доцільність використання великих мовних моделей для міграції коду. Виявлено низку переваг підходу на основі великих мовних моделей, зокрема здатність обробляти різноманітні сценарії міграції. Виділено ключові ризики та обмеження, поширені в корпоративному середовищі, зокрема: безпеку даних, конфіденційність, високу вартість викликів та обмежені знання моделей щодо предметної області. Розроблено метод вибору великої мовної моделі з відкритим вихідним кодом, яка може безпечно використовуватися в ландшафті підприємства, тим самим зменшуючи ризики, пов'язані з хмарними рішеннями. Метод базується на розробленій системі критеріїв, що включає: розмір моделі, розмір контекстного вікна, тип ліцензії, підтримку навчання з точним налаштуванням, орієнтацію на якість коду (виміряну за допомогою еталонного набору даних), підтримку квантування моделі та підтримку спільноти. Для систематичного ранжування моделей-кандидатів запропоновано використання гібридного методу AHP-TOPSIS. Метод AHP використовувався для перевірки ваг критеріїв, тоді як TOPSIS використовувався для ранжування моделей на основі їх близькості до ідеального рішення. На основі розробленого методу було обрано три великі мовні моделі: Qwen 2.5 Coder 14B, DeepSeek-Coder-V2 16B та Llama 3.1 8B. Розроблено план комплексного тестування обраних моделей для подальших експериментальних досліджень. Наукова новизна роботи полягає в розробці методу вибору великих мовних моделей для задач міграції користувацького коду, що відрізняється від існуючих методів системою критеріїв вибору моделі та застосуванням гібридного підходу AHP-TOPSIS для ранжування моделей-кандидатів. Практична цінність роботи полягає в тому, що розроблений метод дозволяє обрати модель з урахуванням обмежень корпоративного середовища та вимог інформаційної безпеки, що дозволить підвищити рівень автоматизації міграції ABAP-коду під час переходу на нові версії ERP-систем від компанії SAP SE. Розроблений метод може застосовуватися для вибору великих мовних моделей під час модернізації інших великих комп’ютерних систем, розроблених як на мовах програмування з відкритим вихідним кодом, так і на пропрієтарних мовах.
Посилання
SAP S/4HANA cloud is a leader in 2024 gartner® magic quadrant™ for cloud ERP for service-centric enterprises and 2024 gartner® magic quadrant™ for cloud ERP for product-centric enterprises. (2024). https://news.sap.com/2024/11/sap-a-leader-2024-gartner-magic-quadrant-cloud-erp-for-service-centric-enterprises-product-centric-enterprises/).
Hardy, P. (2020). Migrating custom code to SAP S/4HANA. Rheinwerk Publishing Inc. 978-1-4932-1994-0.
Pozdnyakov, O. A., & Parkhomenko, A. V. (2024). Custom code migration in intelligent reengineering of complex computer systems. Modern problems and achievements in radio engineering, telecommunications and information technologies: XII International Scientific and Practical Conference, Zaporizhzhia, December 10-12, 2024: Abstracts (pp. 493–495). NUZP.
Bushuiev, D. A., & Lobok, Y. A. (2025). A systematic approach to creating innovative projects and products based on artificial intelligence applications. Management of Development of Complex Systems, 61, 35–41. https://dx.doi.org/10.32347/2412-9933.2025.61.35-41.
Ziftci, C., Nikolov, S., Sjövall, A., Kim, B., Codecasa, D., & Kim, M. (2025). Migrating code at scale with LLMs at Google. ArXiv. https://doi.org/10.48550/arXiv.2504.09691.
Cheng, K., Shen, X., Yang, Y., Wang, T., Cao, Y., Ali, M. A., Wang, H., Hu, L., & Wang, D. (2025). CODEMENV: Benchmarking large language models on code migration. ArXiv. https://doi.org/10.48550/arXiv.2506.00894.
Amazon Web Services. (2024, August 2). Amazon Q Developer just reached a $260 million dollar milestone. https://aws.amazon.com/blogs/devops/amazon-q-developer-just-reached-a-260-million-dollar-milestone/.
Almeida, A., Xavier, L., & Valente, M. T. (2024). Automatic library migration using large language models: First results. Proceedings of the 18th ACM/IEEE International Symposium on Empirical Software Engineering and Measurement (ESEM '24) (pp. 427-433). Association for Computing Machinery. https://doi.org/10.1145/3674805.3690746.
Suárez, J. M., Bibbó, L. M., Bogado, J., & Fernandez, A. (2025). Automatic Qiskit code refactoring using large language models. ArXiv. https://doi.org/10.48550/arXiv.2506.14535.
Chirapurath, J. G. (2024). SAP build's next leap: generative AI and ABAP. https://news.sap.com/2024/10/sap-build-generative-ai-abap/.
Metomic. (n.d.). Is ChatGPT a security risk to your business? Metomic. https://www.metomic.io/resource-centre/is-chatgpt-a-security-risk-to-your-business.
Gururangan, S., Marasović, A., Swayamdipta, S., Lo, K., Beltagy, I., Downey, D., & Smith, N. A. (2020). Don't stop pretraining: adapt language models to domains and tasks. ArXiv. https://doi.org/10.48550/arXiv.2004.10964.
OpenAI. (n.d.). How much does GPT-4 cost? https://help.openai.com/en/articles/7127956-how-much-does-gpt-4-cost.
Omidvar Tehrani, B., Ishaani, M., & Anubhai, A. (2024). Evaluating human‑AI partnership for LLM‑based code migration. Extended abstracts of the CHI Conference on Human Factors in Computing Systems (pp. 1–8). ACM. https://doi.org/10.1145/3613905.3650896.
Yao, Y., Duan, J., Xu, K., Cai, Y., Sun, Z., & Zhang, Y. (2024). A survey on large language model (LLM) security and privacy: The good, the bad, and the ugly. High‑Confidence Computing, 4 (2), 100211. https://doi.org/10.1016/j.hcc.2024.100211.
Chen, M., Tworek, J., Jun, H., Yuan, Q., Ponde de Oliveira Pinto, H., Kaplan, J., Edwards, H., Burda, Y., Joseph, N., Brockman, G., Zaremba, W. (2021). Evaluating large language models trained on code. ArXiv. https://doi.org/10.48550/arXiv.2107.03374.
Lang, J., Guo, Z., & Huang, S. (2024). A comprehensive study on quantization techniques for large language models. ArXiv. https://doi.org/10.48550/arXiv.2411.02530.
Wang, L., Chen, S., Jiang, L., Pan, S., Cai, R., Yang, S., & Yang, F. (2024). Parameter‑efficient fine‑tuning in large models: A survey of methodologies. ArXiv. https://doi.org/10.48550/arXiv.2410.19878.
QwenLM. (n.d.). Qwen2.5-Coder [Source code]. GitHub. https://github.com/QwenLM/Qwen2.5-Coder.
Deepseek-ai. (n.d.). DeepSeek-Coder-V2 [Source code]. GitHub. https://github.com/deepseek-ai/DeepSeek-Coder-V2.
DeepMind. (n.d.).). Gemma 3 [Model card]. DeepMind. https://deepmind.google/models/gemma/gemma-3/.
Meta. (n.d.). CodeLlama [Source code]. GitHub. https://github.com/meta-llama/codellama.
Meta. (n.d.). LLaMA 3.1 [Model page]. https://www.llama.com/llama3_1/.
Mistral AI. (n.d.). Mistral Nemo [News page]. https://mistral.ai/news/mistral-nemo.
Microsoft. (n.d.). Phi-3 medium 128k instruct [Model card]. Hugging Face. https://huggingface.co/microsoft/Phi-3-medium-128k-instruct.
Edwards, W., & Barron, F. H. (1994). SMARTs and SMARTER: Improved simple methods for multiattribute utility measurement. Organizational Behavior and Human Decision Processes, 60(3), 306–325. https://doi.org/10.1006/obhd.1994.1087.
Mateo, J. R. S. C. (2012). Weighted sum method and weighted product method. Multi criteria analysis in the renewable energy industry (pp. 19–22). Springer London. https://doi.org/10.1007/978-1-4471-2346-0_4.
Saaty, T. L., & Vargas, L. G. (2012). Models, methods, concepts & applications of the analytic hierarchy process (2nd ed.). Springer.
Pandey, V., Komal, & Dincer, H. (2023). A review on TOPSIS method and its extensions for different applications with recent development. Soft Computing, 27 (23), 18011–18039. https://doi.org/10.1007/s00500-023-09011-0.
Sivalingam, C., & Subramaniam, S. K. (2024). Cobot selection using hybrid AHP-TOPSIS based multi-criteria decision making technique for fuel filter assembly process. Heliyon, 10(4), Article e26374. https://doi.org/10.1016/j.heliyon.2024.e26374.
##submission.downloads##
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія
Авторське право (c) 2025 Андрій Олександрович Білощицький

Ця робота ліцензується відповідно до Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.