КОМБІНОВАНІ МЕТОДИ ІДЕНТИФІКАЦІЇ НЕПОВНИХ ДУБЛІКАТІВ У НАУКОВИХ ПУБЛІКАЦІЯХ
DOI:
https://doi.org/10.32347/2412-9933.2021.48.85-94Ключові слова:
неповні дублікати, послідовності збігів, плагіат, наукове дослідження, наукова публікаціяАнотація
Розглянуто розпізнавання неповних дублікатів зображень та таблиць. З метою розпізнавання графічних даних (для класифікації та стиснення зображень) використовується вейвлет-аналіз з набором класичних характеристичних функцій: вейвлети Морле і Хаара, вейвлет мексиканський капелюх тощо. Застосовуються також особливі види фільтрів, що будуються на основі так званих риджлет-, курвлет- та бимлет-перетворень. Розглянуто основні класичні методи кластеризації колекції зображень, що можуть бути використані для пошуку неповних дублікатів у графічних даних електронних документів. Проаналізовано метод Гарріса, який дає змогу визначати опорні точки зображень за рахунок вимірювання інтенсивності яскравості зображення. Також проаналізовано технологію SIFT (масштабно-інваріантне перетворення ознак), яка є потужним засобом формування системи інваріантних структурних ознак, розглянуто ще один клас методів, які вирізняються простотою реалізації та застосування для виявлення неповних дублікатів зображень – хеш-методи. Описано, що для RGB-зображення існує три таких сигнали: яскравість у каналах Red, Green та Blue. В обробці сигналів і суміжних галузей перетворення Фур'є зазвичай розглядається декомпозиція сигналу на частоти та амплітуди. Розглянуто метод виявлення контекстно-залежних значень та індексації текстових даних, який допомагає знаходити неповні дублікати в таблицях з урахуванням текстового і числового представлення даних. Аналогічно за описаним методом можна провести індексацію даних числового і текстового типів, якщо вони розміщуються не в таблиці, а всередині контенту електронного документа. Результати дослідження використовуються в комплексі із системою виявлення неповних дублікатів у наукових документах, зокрема дисертаціях на здобуття наукового ступеня.
Посилання
Hawkins J. On Intelligence [Text] / Jeff Hawkins. Times Books, 2004. 272 p.
Ту Дж., Гонсалес Р. Принципы распознавания образов. Москва: Мир, 1978. 411 с.
Яне Б. Цифровая обработка зображений. Москва: Техносфера, 2007. 587 с.
Гонсалес Г., Вудс Г. Цифровая обработка зображений. Москва: Техносфера, 2005. 1072 с.
Павлидис Т. Алгоритмы машинной графики и обработки зображений. Москва: Радио и связь, 1986. 400 с.
Сироджа И. Б. Квантовые модели и методы искусственного интеллекта для принятия решений и управления. Київ: Наукова думка, 2002. 420 с.
Фу К., Гонсалес, К. Ли. Робототехника. [пер. с англ. А. А. Сорокина, А. В. Градецкого, М. Ю. Рачкова; под. ред. В. Г. Градецкого]. Москва: Мир. 1989. 624 с.
Пименов В. Ю. Простые методы поиска изображений по содержанию. Труды РОМИП, 2010. URL: http://romip.ru/ru/2010/.
Mojsilović R., Kovačević J., Hu J., Safranek R. J., Ganapathy S. K. Matching and retrieval based on the vocabulary and grammar of color patterns. IEEE Trans. Image Processing, 2000, volume 9, pp. 38-54.
Tamura H., Mori S., Yamawaki T. Texture features corresponding to visual perception. IEEE Transactions on System, Man and Cybernatic. 1978, volume 8(6), pp. 460–473.
Zhang D., Lu G. Content-Based Shape Retrieval Using Different Shape Descriptors: A Comparative Study. In IEEE International Conference on Multimedia and Expo, 2001, pp. 289–293.
Quack T., Monich U., Thiele L., Manjunath B. A System for Largescale, Contentbased Web Image Retrieval. MM’04, October 1016, 2004, New York, USA. P. 120–123.
Волосных Д. Ф Использование визуальных особенностей восприятия компонент цветовой модели HSI при поиске изображений по содержанию. Труды РОМИ 2010. URL: http://romip.ru/ru/2010/.
Васильева Н., Гладышева Ю. Взвешенный CombMNZ для комбинирования результатов поиска изображений по цветовым признакам. Труды РОМИП 2010. URL: http://romip.ru/ru/2010/
Мельниченко А., Гончаров А. ЛММИИ на РОМИП-2009: Методы поиска изображений по визуальному подобию и детекции нечетких дубликатов изображений. Труды РОМИП 2009. URL: http://romip.ru/ru/2009/.
Стадник А. С. Анализ кадров видеоряда и вычисление продолжительности сцены используя алгоритм перцептивного хэша Информатика и компьютерные технологии-2011. URL: http://ea.donntu.edu.ua:8080/jspui/bitstream/123456789/3955/1/4_%D0%A1%D1%82%D0%B0%D0%B4%D0%BD%D0%B8%D0%BA.pdf
Чалая Л. Э., Попаденко П. Ю. Поиск неполных дубликатов в системах анализа цифровых зображений. Вісник Кременчуцького національного університету імені Михайла Остроградського. 2014. Вип. 5. С. 42 – 47.
Lizunov P., Biloshchytskyi A., Kuchansky A., Biloshchytska S., Chala L. Detection of near duplicates in tables based on the locality-sensitive hashing method and the nearest neighbor method. Eastern-European Journal of Enterprise Technologies. 2016, Vol. 6, Issue 4 (84), P. 4–10.
##submission.downloads##
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія
Авторське право (c) 2021 Петро Лізунов , Андрій Білощицький , Олександр Кучанський , Юрій Андрашко
Ця робота ліцензується відповідно до Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.