Метод семантической сегментации изображений на основе нейронной сети с использованием фильтров Габора
- Авторы: Мурин Е.А.1, Сорокин Д.В.1, Крылов А.С.1
 - 
							Учреждения: 
							
- Факультет вычислительной математики и кибернетики Московский государственный университет имени М. В. Ломоносова
 
 - Выпуск: № 3 (2025)
 - Страницы: 54–62
 - Раздел: КОМПЬЮТЕРНАЯ ГРАФИКА И ВИЗУАЛИЗАЦИЯ
 - URL: https://jdigitaldiagnostics.com/0132-3474/article/view/688121
 - DOI: https://doi.org/10.31857/S0132347425030052
 - EDN: https://elibrary.ru/GRGMFQ
 - ID: 688121
 
Цитировать
Полный текст
Аннотация
Статья посвящена использованию фильтров Габора для повышения эффективности сверточных нейронных сетей (CNN) в задачах анализа изображений, в частности сегментации. Рассматривается применение фильтров Габора как адаптивного компонента на начальных слоях CNN, что позволяет улучшить выделение текстурных и структурных признаков. Для достижения оптимального баланса между числом обучаемых параметров и точностью предложены адаптивные фильтры Габора, которые увеличивают количество каналов на входе без значительного усложнения модели. Проведен сравнительный анализ архитектур с использованием PSPNet для сегментации изображений, модифицированной адаптивными фильтрами Габора. Рассмотрены ограничения на размер фильтров, обеспечивающие устойчивость к вычислительным затратам. Подтверждена актуальность подхода на наборе данных для сегментации изображений, демонстрирующего улучшение точности при минимальном увеличении числа параметров.
Полный текст
Об авторах
Е. А. Мурин
Факультет вычислительной математики и кибернетики Московский государственный университет имени М. В. Ломоносова
														Email: kryl@cs.msu.ru
				                					                																			                								
лаборатория математических методов обработки изображений
Россия, 119991 Москва, Ленинские горы, д. 1, стр. 52Д. В. Сорокин
Факультет вычислительной математики и кибернетики Московский государственный университет имени М. В. Ломоносова
														Email: dsorokin@cs.msu.ru
				                					                																			                								
лаборатория математических методов обработки изображений
Россия, 119991 Москва, Ленинские горы, д. 1, стр. 52А. С. Крылов
Факультет вычислительной математики и кибернетики Московский государственный университет имени М. В. Ломоносова
							Автор, ответственный за переписку.
							Email: kryl@cs.msu.ru
				                					                																			                								
лаборатория математических методов обработки изображений
Россия, 119991 Москва, Ленинские горы, д. 1, стр. 52Список литературы
- Fogel Itzhak, Sagi Dov. Gabor filters as texture discriminator // Biological cybernetics. 1989. Vol. 61. No. 2. P. 103–113.
 - Coding facial expressions with Gabor wavelets / Michael Lyons, Shigeru Akamatsu, Miyuki Kamachi, Jiro Gyoba // Proceedings Third IEEE international conference on automatic face and gesture recognition // IEEE. 1998. P. 200–205.
 - Kwolek Bogdan. Face detection using convolutional neural networks and Gabor filters // Artificial Neural Networks: Biological Inspirations – ICANN 2005: 15th International Conference, Warsaw, Poland, September 11–15, 2005. Proceedings, Part I 15 / Springer. – 2005. P. 551–556.
 - Calderon Andres, Roa Sergio, Victorino Jorge. Handwritten digit recognition using convolutional neural networks and Gabor filters // Proc. Int. Congr. Comput. Intell. 2003. P. 1–9.
 - Chang Shuo-Yiin, Morgan Nelson. Robust CNN-based speech recognition with Gabor filter kernels // Fifteenth annual conference of the international speech communication association. 2014. P. 905–909.
 - Sarwar Syed Shakib, Panda Priyadarshini, Roy Kaushik. Gabor filter assisted energy efficient fast learning convolutional neural net-works // 2017 IEEE/ACM International Symposium on Low Power Electronics and Design (ISLPED) / IEEE. 2017. P. 1–6.
 - Gabor convolutional networks / Shangzhen Lu-an, Chen Chen, Baochang Zhang et al. // IEEE Transactions on Image Processing. 2018. Vol. 27. No. 9. P. 4357–4366.
 - Adaptive Gabor convolutional networks / Ye Yuan, Li-Na Wang, Guoqiang Zhong et al. // Pattern Recognition. 2022. Vol. 124. P. 108495.
 - Learnable Gabor Convolutional Networks / Guoqiang Zhong, Wei Gao, Wencong Jiao et al. // International Conference on Neural Information Processing / Springer. 2019. P. 305–313.
 - Residual Gabor convolutional network and FV-Mix exponential level data augmentation strategy for finger vein recognition / Yifan Wang, Huimin Lu, Xiwen Qin, Jianwei Guo // Expert Systems with Applications. 2023. Vol. 223. P. 119874.
 - Learning Gabor texture features for fine-grained recognition / Lanyun Zhu, Tianrun Chen, Jianxiong Yin et al. // Proceedings of the IEEE/CVF International Conference on Computer Vision. 2023. P. 1621–1631.
 - Osa Priscilla Indira, Zerubia Josiane, Kato Zoltan. AYANet: A Gabor Wavelet-Based and CNN-Based Double Encoder for Building Change Detection in Remote Sensing // Pattern Recognition / Ed. by Apostolos Antonacopoulos, Subhasis Chaudhuri, Rama Chellappa et al. Cham: Springer Nature Switzerland, 2025. P. 131–146.
 - Gabor D. Theory of communication: Journal of the Institute of Electrical Engineers // London. 1946. Vol. 93. P. 429–457.
 - Krizhevsky Alex, Sutskever Ilya, Hinton Geof-frey E. Imagenet classification with deep convolutional neural networks // Communications of the ACM. 2017. Vol. 60. No. 6. P. 84–90.
 - Fast and efficient facial expression recognition using a Gabor convolutional network / Ping Jiang, Bo Wan, Quan Wang, Jiang Wu // IEEE Signal Processing Letters. 2020. Vol. 27. P. 1954–1958.
 - Мурин Е.А., Сорокин Д.В., Крылов А.С. Методы классификации гистологических изображений на основе сверточных нейронных сетей с фильтром Габора // GRAPHICON 2024. Материалы 34-й Международной конференции по компьютерной графике и машинному зрению. Омск: Омский государственный технический университет, 2024. С. 656–668.
 - Deep residual learning for image recognition / Kaiming He, Xiangyu Zhang, Shaoqing Ren, Jian Sun // Proceedings of the IEEE conference on computer vision and pattern recognition. 2016. P. 770–778.
 - Pyramid scene parsing network / Heng-shuang Zhao, Jianping Shi, Xiaojuan Qi et al. // Proceedings of the IEEE conference on computer vision and pattern recognition. 2017. P. 2881–2890.
 - Gradient-based learning applied to document recognition / Yann LeCun, L´eon Bottou, Yoshua Bengio, Patrick Haffner // Proceedings of the IEEE. 1998. Vol. 86. No. 11. P. 2278–2324.
 - The cityscapes dataset for semantic urban scene understanding / Marius Cordts, Mohamed Omran, Sebastian Ramos et al. // Proceedings of the IEEE conference on computer vision and pattern recognition. 2016. P. 3213–3223.
 
Дополнительные файлы
				
			
						
						
						
					
						
									










