Разработка алгоритма сегментации гиперспектральных изображений
- Authors: 1
-
Affiliations:
- Самарский национальный исследовательский университет имени академика С.П. Королева
- Issue: Vol 1 (2025)
- Pages: 351-352
- Section: ЧАСТЬ I. Информационные технологии и техническая кибернетика
- Submitted: 26.05.2025
- Accepted: 20.06.2025
- Published: 02.11.2025
- URL: https://jdigitaldiagnostics.com/osnk-sr2025/article/view/680708
- ID: 680708
Cite item
Full Text
Abstract
Обоснование. Сегментация гиперспектральных изображений представляет собой сложную задачу, связанную с высокой размерностью данных, наличием пропущенных значений, а также значительными вычислительными затратами. Для решения этих проблем требуется использование эффективных методов машинного обучения и статистического анализа. В частности, методы кластеризации, такие как K-средних (K-means), являются популярными инструментами для сегментации гиперспектральных изображений, поскольку они позволяют разделить данные на несколько кластеров, основываясь на сходстве их спектральных характеристик.
Цель — разработать алгоритм сегментации гиперспектральных изображений.
Методы. Для разработки алгоритма сегментации гиперспектральных изображений были изучены методы K-средних [1–4], метод главных компонент, был изучен подсчет евклидова расстояния для гиперспектральных изображений.
Результаты. В качестве набора данных были выгруженны изображения Самарской области в летний период времени со спутника Sentinel-2. Изображения представлены в формате TIFF.
Для сравнительного анализа было реализовано два алгоритма сегментации. Один с помощью готового метода K-средних из библиотеки sklearn [1], а второй был реализован вручную.
Перейдем к описанию ручного алгоритма. Для начала происходит считывание гиперспектральных изображений. Следующим шагом преобразовываем гиперспектральное изображение в двумерный массив, где каждая строка содержит спектральные значения одного пикселя. Для уменьшения размерности используется метод главных компонент, который сокращает заданное число спектральных каналов до заданного. При работе алгоритма K-средних для ускорения вычислений берется случайная подвыборка данных. Центроиды инициализируются методом K-средних++ для равномерного распределения [2]. Для каждой точки в данных вычисляется минимальное расстояние до любого из уже выбранных центроидов. Это минимальное расстояние показывает, насколько каждая точка «удалена» от ближайшего кластера. Вероятности для каждой точки вычисляются как нормализация этих расстояний: более удаленные точки имеют больший шанс быть выбраны. Следующий центроид выбирается с учетом этих вероятностей. Вычисляются расстояния от каждой точки до всех центроидов [3]. Точка назначается ближайшему центроиду. Для каждого кластера вычисляется среднее значение точек, принадлежащих этому кластеру. Если кластер пуст, выбирается случайная точка как новый центроид. Если все центроиды почти не изменились, алгоритм завершает работу. Последние шаги выполняются в цикле, пока не достигнуто максимальное число или пока сходимость не произойдет. Отдельная функция анализирует каждый кластер [4]. Для этого извлекаются все пиксели, принадлежащие конкретному кластеру, и вычисляется средний спектр для этих пикселей. Средние спектры позволяют интерпретировать, какие объекты представлены в каждом сегменте. В результате работы алгоритмов были получены следующие данные, изображенные на рис. 1.
Рис. 1. Сегментированные изображения
Из полученных данных можно сделать вывод, что разработанный алгоритм и готовый одинаково различают построенные здания и воду, по графикам также видно, что различают только количество таких объектов. Различия происходят в определении зеленой растительности, сухой и грунта. Скорее всего, ошибка происходит из-за схожести объектов.
В целом по изображениям разработанный алгоритм не уступает готовому, если мы используем такой алгоритм на изображении с различными типами объектов.
Выводы. В результате предложенный подход сегментации гиперспектральных изображений на основе k-средних показал свою эффективность в задачах обработки и анализа гиперспектральных изображений. Алгоритм обеспечил качественную сегментацию изображений и предоставил возможность для дальнейшего анализа объектов, таких как вода, растительность, грунт и постройки. Систему можно адаптировать для различных типов гиперспектральных данных и использовать в реальных приложениях, таких как мониторинг окружающей среды, сельское хозяйство, картография и т. д.
Full Text
Обоснование. Сегментация гиперспектральных изображений представляет собой сложную задачу, связанную с высокой размерностью данных, наличием пропущенных значений, а также значительными вычислительными затратами. Для решения этих проблем требуется использование эффективных методов машинного обучения и статистического анализа. В частности, методы кластеризации, такие как K-средних (K-means), являются популярными инструментами для сегментации гиперспектральных изображений, поскольку они позволяют разделить данные на несколько кластеров, основываясь на сходстве их спектральных характеристик.
Цель — разработать алгоритм сегментации гиперспектральных изображений.
Методы. Для разработки алгоритма сегментации гиперспектральных изображений были изучены методы K-средних [1–4], метод главных компонент, был изучен подсчет евклидова расстояния для гиперспектральных изображений.
Результаты. В качестве набора данных были выгруженны изображения Самарской области в летний период времени со спутника Sentinel-2. Изображения представлены в формате TIFF.
Для сравнительного анализа было реализовано два алгоритма сегментации. Один с помощью готового метода K-средних из библиотеки sklearn [1], а второй был реализован вручную.
Перейдем к описанию ручного алгоритма. Для начала происходит считывание гиперспектральных изображений. Следующим шагом преобразовываем гиперспектральное изображение в двумерный массив, где каждая строка содержит спектральные значения одного пикселя. Для уменьшения размерности используется метод главных компонент, который сокращает заданное число спектральных каналов до заданного. При работе алгоритма K-средних для ускорения вычислений берется случайная подвыборка данных. Центроиды инициализируются методом K-средних++ для равномерного распределения [2]. Для каждой точки в данных вычисляется минимальное расстояние до любого из уже выбранных центроидов. Это минимальное расстояние показывает, насколько каждая точка «удалена» от ближайшего кластера. Вероятности для каждой точки вычисляются как нормализация этих расстояний: более удаленные точки имеют больший шанс быть выбраны. Следующий центроид выбирается с учетом этих вероятностей. Вычисляются расстояния от каждой точки до всех центроидов [3]. Точка назначается ближайшему центроиду. Для каждого кластера вычисляется среднее значение точек, принадлежащих этому кластеру. Если кластер пуст, выбирается случайная точка как новый центроид. Если все центроиды почти не изменились, алгоритм завершает работу. Последние шаги выполняются в цикле, пока не достигнуто максимальное число или пока сходимость не произойдет. Отдельная функция анализирует каждый кластер [4]. Для этого извлекаются все пиксели, принадлежащие конкретному кластеру, и вычисляется средний спектр для этих пикселей. Средние спектры позволяют интерпретировать, какие объекты представлены в каждом сегменте. В результате работы алгоритмов были получены следующие данные, изображенные на рис. 1.
Рис. 1. Сегментированные изображения
Из полученных данных можно сделать вывод, что разработанный алгоритм и готовый одинаково различают построенные здания и воду, по графикам также видно, что различают только количество таких объектов. Различия происходят в определении зеленой растительности, сухой и грунта. Скорее всего, ошибка происходит из-за схожести объектов.
В целом по изображениям разработанный алгоритм не уступает готовому, если мы используем такой алгоритм на изображении с различными типами объектов.
Выводы. В результате предложенный подход сегментации гиперспектральных изображений на основе k-средних показал свою эффективность в задачах обработки и анализа гиперспектральных изображений. Алгоритм обеспечил качественную сегментацию изображений и предоставил возможность для дальнейшего анализа объектов, таких как вода, растительность, грунт и постройки. Систему можно адаптировать для различных типов гиперспектральных данных и использовать в реальных приложениях, таких как мониторинг окружающей среды, сельское хозяйство, картография и т. д.
About the authors
Самарский национальный исследовательский университет имени академика С.П. Королева
Author for correspondence.
Email: daria180301@gmail.com
студентка, группа 6404-010302D, институт информатики и кибернетики
Russian Federation, СамараReferences
- Симаков, В. Кластеризация изображений / В. Симаков // YouTube: [сайт]
- Зимичев Е.А., Казанский Н.Л., Серафимович П.Г. Пространственная классификация гиперспектральных изображений с использованием метода кластеризации K-MEANS++ // Компьютерная оптика. 2014. Т. 38, № 2. С. 281–286. doi: 10.18287/0134-2452-2014-38-2-281-286 EDN: SFAZCJ
- Хотилин М.И., Кравцова Н.С., Рыцарев И.А., Куприянов А.В. Классификация объектов натурных гиперспектральных изображений // Информационные технологии и нанотехнологии. 2020. Т. 4. С. 86–90. EDN: EMMBJD
- Юдаков А.А. Алгоритмы сегментации объектов земной поверхности по данным гиперспектральной съемки: автореф. дис. ... канд. техн. наук. Рязань: РГРТУ, 2013. 16 с.
Supplementary files




