Розробка моделі системи уникнення ефекту «Бульбашки» в соціальних мережах

Автор(и)

  • Олексій Андрійович Стецик Київський національний університет будівництва і архітектури, Київ, Україна, Ukraine https://orcid.org/0000-0002-1061-0465
  • Світлана Анатоліївна Теренчук Київський національний університет будівництва і архітектури, Київ, Україна, Ukraine https://orcid.org/0000-0001-6527-4123

DOI:

https://doi.org/10.32347/2412-9933.2024.57.77-82

Ключові слова:

алгоритм K-середніх, соціальна бульбашка, Kafka, кластеризація, масштабованість, PostgreSQL, рекурентна нейронна мережа

Анотація

У статті розглянуто можливості сучасних соціальних медіа та проблем, що з’являються в процесі розвитку соціальних мереж. Фокус дослідження спрямовано на ефект «бульбашки» в різних соціальних мережах. З’ясовано, що ефект «бульбашки» є результатом роботи глибинної нейронної мережі, яка аналізує інтереси і пріоритет кожного користувача соціальної мережі, перевіряє інші подібні публікації та пріоритети інших користувачів, після чого формує «коло» однодумців для кожного користувача. Таким чином в соціальних мережах з’являються кластери користувачів, які мають однакову думку щодо суперечливої теми. «Соціальні бульбашки» з’являються, коли кількість з'єднань між користувачами одного кластера величезна, а з’єднання між користувачами різних кластерів рідкісні. Отже, основним недоліком стандартного алгоритму генерації контенту є добірка лише публікацій і коментарів, що підтримують позицію користувача. Метою дослідження є архітектура програмного забезпечення для вирішення проблеми «бульбашки» у високонавантажених соціальних мережах у реальному часі. Основна ідея полягала в кластеризації думок у суперечливих темах і включення у вміст контенту користувача думок користувачів з різних кластерів. Дані щодо суперечливих тем збираються з новин, наукових статей, публікацій і коментарів із хеш тегами. Зібрані теми кластеризуються за допомогою алгоритму K-середніх. Для знаходження оптимальної кількості кластерів використовується метод «ліктя». Потім у різних кластерах користувачів розміщуються тексти з різними думками щодо певних тем. Результати кластеризації думок за темою надаються як вхідні дані для генерації стрічки новин рекурентною нейронною мережею. Отже, алгоритм генерації контенту вибрано як основний компонент вирішення проблеми виникнення «соціальної бульбашки». При цьому запропоновано удосконалити алгоритм генерації стрічки новин за допомогою машинного навчання і нейронних мереж. Також в цій статті запропоновано ефективну архітектуру системи для генерації стрічки новин. У системі використовується Kafka як посередник повідомлень між мікросервісами і Ажур блоб-сховище для зберігання публікацій і коментарів. Обидва рішення обґрунтовані високою масштабованістю. Реляційна база даних PostgreSQL використовується для метаданих публікацій, коментарів, користувачів та зв’язків між користувачами. При розробці архітектури системи передбачено виникнення певних проблем і окреслено шляхи їх вирішення. Наприклад, якщо в майбутньому виникнуть проблеми з масштабованістю, то для їх вирішення можна використати шардинг за user_id; якщо будуть виникати проблеми, спричинені затримкою запитів, то можна використовувати індекси бази даних на основі B-дерева або Log-Structured Merge-дерева, залежно від того, чи буде більше запитів на читання, чи на запис.

Біографії авторів

Олексій Андрійович Стецик, Київський національний університет будівництва і архітектури, Київ, Україна

Аспірант кафедри інформаційних технологій проєктування та прикладної математики

Світлана Анатоліївна Теренчук, Київський національний університет будівництва і архітектури, Київ, Україна

Кандидат фізико-математичних наук, доцент кафедри інформаційних технологій проєктування та прикладної математики

Посилання

Adisa, D. (2023, October 30). Everything you need to know about social media algorithms. Sprout Social. URL: https://sproutsocial.com/insights/social-media-algorithms/

Lada, A., Wang, M., & Yan, T. (2021, January 26). How machine learning powers Facebook’s News Feed ranking algorithm. Core Infra, ML Applications. URL: https://engineering.fb.com/2021/01/26/ml-applications/news-feed-ranking/

Koumchatzky, N., & Andryeyev, A. (2017, May 9). Using deep learning at scale in Twitter’s timelines. Twitter Engineering Blog. URL: https://blog.twitter.com/engineering/en_us/topics/insights/2017/using-deep-learning-at-scale-in-twitterstimelines.

Hetler, A. (2023, January 30). 6 common social media privacy issues. TechTarget. URL: https://www.techtarget.com/whatis/feature/6-common-social-media-privacy-issues.

Stetsyk, O., Pasieka, P., & Yeremenko, B. (2023). Designing an Effective System Architecture for Detecting Propaganda and Spam in Social Media News Feed. In 2023 IEEE 4th KhPI Week on Advanced Technology (KhPIWeek). IEEE. DOI: https://doi.org/10.1109/khpiweek61412.2023.10312932.

Peebles, E. (2014). Cyberbullying: Hiding behind the screen. Paediatrics & Child Health, 19(10), 527–528. DOI: https://doi.org/10.1093/pch/19.10.527.

Pantic, I. (2014). Online social networking and mental health. Cyberpsychology, Behavior, and Social Networking, 17(10). DOI: https://doi.org/10.1089/cyber.2014.0070.

Alatawi, F.H., Cheng, L., Tahir, A., Karami, M., Jiang, B., Black, T., & Liu, H. (2021). A Survey on Echo Chambers on Social Media: Description, Detection and Mitigation DOI: https://doi.org/10.48550/arXiv.2112.05084.

Cinelli, M., De Francisci Morales, G., Galeazzi, A., Quattrociocchi, W., & Starnini, M. (2021). The echo chamber effect on social media. Proceedings of the National Academy of Sciences, 118(9), Article e2023301118. DOI: https://doi.org/10.1073/pnas.2023301118.

Moehring, A. (2022). News Feeds and User Engagement: Evidence from the Reddit News Tab. Massachusetts Institute of Technology (MIT) - Sloan School of Management. pp. 4–6.

Garimella, K., De Francisci Morales, G., Gionis, A., & Mathioudakis, M. (2018). Political Discourse on Social Media. In the 2018 World Wide Web Conference. ACM Press. DOI: https://doi.org/10.1145/3178876.3186139.

Du, S., & Gregory, S. (2016). The Echo Chamber Effect in Twitter: does community polarization increase? In Studies in Computational Intelligence (pp. 373–378). Springer International Publishing. DOI: https://doi.org/10.1007/978-3-319-50901-3_30.

Choi, D., Chun, S., Oh, H., Han, J., & Kwon, T. (2020). Rumor Propagation is Amplified by Echo Chambers in Social Media. Scientific Reports, 10 (1). DOI: https://doi.org/10.1038/s41598-019-57272-3.

Baumann, F., Lorenz-Spreen, P., Sokolov, I. M., & Starnini, M. (2020). Modeling Echo Chambers and Polarization Dynamics in Social Networks. Physical Review Letters, 124(4), 048301. DOI: https://doi.org/10.1103/PhysRevLett.124.048301.

Khuong, B. (2019, June 24). The basics of recurrent neural networks (RNNs). Towards AI. Retrieved July 25, 2023, URL: https://towardsai.net/p/machine-learning/the-basics-of-recurrent-neural-networks-rnns.

Ahmed, M., Seraj, R., & Islam, S. M. S. (2020). The k-means Algorithm: A Comprehensive Survey and Performance Evaluation. Electronics, 9(8), 1295. DOI: https://doi.org/10.3390/electronics9081295.

Umargono, E., Suseno, J. E., & Gunawan, S. K. V. (2020). K-Means Clustering Optimization Using the Elbow Method and Early Centroid Determination Based on Mean and Median Formula. In Proceedings of the 2nd International Seminar on Science and Technology (ISSTEC 2019). DOI: https://doi.org/10.2991/assehr.k.201010.019.

John, V., & Liu, X. (2017, April 3). A Survey of Distributed Message Broker Queues. arXiv:1704.00411. https://doi.org/10.48550/arXiv.1704.00411.

Stetsyk, O. & Terenchuk, S. (2021). Comparative analysis of NoSQL databases architecture. Management of Development of Complex Systems, 47, 78–82, dx.doi.org10.32347/2412-9933.2021.47.78-82.

Microsoft Azure. (n.d.). What is Azure Blob storage? Retrieved February 27, 2024, URL: https://learn.microsoft.com/enus/azure/storage/blobs/storage-blobs-introduction

##submission.downloads##

Опубліковано

2024-03-29

Як цитувати

Стецик, О. А., & Теренчук, С. А. (2024). Розробка моделі системи уникнення ефекту «Бульбашки» в соціальних мережах. Управління розвитком складних систем, (57), 77–82. https://doi.org/10.32347/2412-9933.2024.57.77-82

Номер

Розділ

ІНФОРМАЦІЙНІ ТЕХНОЛОГІЇ УПРАВЛІННЯ