ISSN 0236-235X (P)
ISSN 2311-2735 (E)

Journal influence

Higher Attestation Commission (VAK) - К1 quartile
Russian Science Citation Index (RSCI)

Bookmark

Next issue

4
Publication date:
09 December 2024

A control pixel clustering algorithm for assessing the chemical pollution impact on forest tracts from satellite photographic images

Date of submission article: 26.07.2022
UDC: 632.151+630*587+004
The article was published in issue no. № 3, 2022 [ pp. 458-465 ]
Abstract:The paper proposes an original adaptive control pixel clustering algorithm for "controlled cluster anal-ysis" of satellite photographic images. The "controlled cluster analysis" algorithm is based on the premise: the possibility of using addi-tional a priori information about control pixels on satellite photographs located in different ecological zones, which allows correcting the mosaic structures and ecological zone areas taking into account ad-ditional information. The "controlled cluster analysis" algorithm differs in using additional parameters in the form of weight coefficients and control pixels, which provides more accurate binding of clustering results to ecological zones. The "controlled cluster analysis" algorithm is based on a modernized classical K-means algorithm, in which weight coefficients and control pixels are additionally introduced as param-eters. It is shown that as a result of using the "controlled cluster analysis" algorithm, the accuracy of esti-mating the size and configuration of the areas of ecological zones increases. The proposed algorithm makes it possible to calculate the total areas of ecological zones of forests more accurately, which can be proposed as a basis for assessing the degree of environmental degrada-tion and the magnitude of environmental damage to forests.
Аннотация:В статье предложен оригинальный контрольно-пиксельно-кластерный алгоритм оценки воз-действия химических загрязнений на лесные массивы по спутниковым фотоизображениям. В нем использована адаптивная процедура модифицированного классического алгоритма К-средних для уточнения информации о расположении контрольных пикселей на фотоизображениях раз-личных зон химических загрязнений. Информация представлена в виде адаптивно изменяющихся наборов расположения контрольных пикселей, что позволяет получать более точное расположение зон химических загрязнений лесных массивов. Разработка контрольно-пиксельно-кластерного алгоритма основана на предпосылке о возможности использования дополнительной априорной информации о контрольных пикселях на спутниковых фотоизображениях, расположенных в различных экологических зонах, что позволяет корректировать мозаичные структуры и площади экологических зон с учетом дополнительной информации. Алгоритм основан на модифицированном классическом алгоритме К-средних, в который в качестве параметров дополнительно введены весовые коэффициенты и контрольные пиксели, что обеспечивает более точную привязку результатов кластеризации к экологическим зонам. Объектом практического применения предложенного алгоритма являются многоканальные спутниковые изображения земных ландшафтов, каждый пиксель которых представляет собой век-тор яркостей элементов ландшафта в различных спектральных каналах. Комбинируя эти каналы, можно получать специализированные изображения земной поверхности, характеризующие конкретные эколого-биологические свойства растительного покрова. Например, комбинируя красный и ближний инфракрасный спектральные каналы, можно преобразовать многоканальное изображение в одноканальное, известное как NDVI (нормализованный разностный индекс растительности). Большинство аналогичных комбинаций, предназначенных для выделения специализированных эколого-биологических характеристик растительного покрова, называются вегетационными индексами. Преобразование исходных спектральных каналов в вегетационные индексы приводит к изображениям, в которых каждый пиксель является вектором вегетационных индексов. При этом в алгоритмах кластеризации используются различные метрики для вычисления расстояний между пикселями. Предложенный алгоритм позволяет более точно вычислять суммарные площади экологических зон лесных массивов, что может быть предложено в качестве основы для оценки степени экологической деградации лесов и величины экологических ущербов, нанесенных лесным массивам химическими загрязнениями промышленных предприятий.
Authors: Meshalkin V.P (clogist@muctr.ru) - D. Mendeleev University of Chemical Technology of Russia, Moscow, Russia, Ph.D, Butusov O.B. (butusov-1@mail.ru) - Moscow State Engineering University (MAMI), Moscow, Russia, Ph.D, R.R. Kantyukov (R_Kantyukov@vniigaz.gazprom.ru) - Scientific-Research Institute of Natural Gases and Gas Technologies – VNIIGAZ (Associate Professor, Deputy Director General for Science), Razvilka vil., Russia, Ph.D, Chistyakova T.B. (-) - Saint Petersburg State Institute of Technology (Technical University) (Professor), St. Petersburg, Russia, Ph.D
Keywords: vegetation indices, control pixels, forest areas, multi-channel photo image, cluster, spectral channel, enterprise, metallurgical complex, chemical pollution
Page views: 3457
PDF version article

Font size:       Font:

При разработке методов комплексной оценки воздействия химических загрязнений промышленных предприятий на окружающую среду, в частности, на лесные массивы, как комплексные индексы состояния окружающей среды считается, что наиболее эффективной является оценка в виде величины ущерба, нанесенного биомассе лесной растительности выбросами промышленных предприятий [1–3].

Под воздействием химических загрязнений нарушаются сложные биологические циклы в лесных массивах, в результате чего происходят   явные физиономические изменения, такие как дехромация, дефолиация и изреживание древостоя. Существует возможность дистанционной дешифровки физиономических нарушений состояния лесных массивов по спутниковым фотоизображениям (СФИ) [4, 5]. Для дешифровки СФИ применяются методы кластерного анализа, результаты которого зависят от количества информации, используемой при кластеризации. Для увеличения количества информации применяются методы объединения информации из разных источников, получившие название data fusion [6–10]. При этом необходимо учитывать, что разные виды лесных   массивов по-разному реагируют на химические загрязнения [2, 3]. Это обусловливает необходимость использования для оценки   экологического ущерба лесным массивам от химических загрязнений нечетких мето-  дов [8, 9, 11, 12] теории «доза–эффект» зависимостей и экологического зонирования [1–3].

Для выделения экологических зон предлагается вариант метода data fusion, основанный на использовании дополнительной информации в виде весовых коэффициентов и контрольных пикселей [6–10]. Контрольные пиксели представляют собой точки на СФИ, принадлежность которых экологическим зонам известна заранее либо в результате наземных исследований, либо из анализа статистических данных или данных лесоустройства [1, 2].

В работе [1] систематизированы алгоритмы на основе использования следующих современных методов цифровизации: фрактально-статистические методы анализа кластерной структуры СФИ, методы вейвлет-преобразования СФИ лесных массивов, текстурные методы анализа СФИ, нейросетевые методы анализа, нечетко-логические алгоритмы, алгоритмы генерализации и интегральной оценки экологического состояния лесных массивов, алгоритмы определения «доза–эффект» зависимо-  стей, алгоритмы экологического зонирования лесных массивов. Данные методы и основанные на них интеллектуально-вычислительные алгоритмы позволяют получать в результате пиксельного анализа СФИ более точную конфигурацию мозаики экологических зон и,   как следствие, более точные экономические оценки ущербов, нанесенных химическими загрязнениями окружающей среды [1, 2].

Предпосылки разработки алгоритмов управляемого кластерного анализа

Рассмотрим сущность алгоритма управляемого кластерного анализа, блок-схема которого изображена на рисунке 1. Характерная особенность алгоритма – применение при кластеризации контрольных пикселей на СФИ, что позволяет управлять процессом определения кластеров с использованием известной априорной информации о принадлежности контрольных пикселей различным кластерам экологических зон.

Алгоритм является развитием классического алгоритма К-средних [13, 14]. При этом в классический функционал метода наименьших квадратов вводятся дополнительные слагаемые и параметры, описывающие влияние весовых коэффициентов и контрольных пикселей на решение задачи оптимизации. Для кластеризации пикселей на СФИ в классическом алгоритме   К-средних необходимо указать количество кластеров, максимальное число итераций и точность решения задачи.

В дополнение к классическому алгоритму К-средних в предложенном управляемом   контрольно-пиксельно-кластерном алгоритме необходимо дополнительно указать весовые коэффициенты кластеров и контрольные пиксели, в результате чего изменяется вид целевой функции. Также в алгоритмах кластеризации необходимо выбрать метрику для расчета критерия подобия (сходства) между кластерными пикселями [15, 16], например, расстояние Евклида, Минковского, Манхэттеновское и др.

В классическом итерационном алгоритме К-средних [14] решается задача квадратичной безусловной оптимизации с выходом итерационного процесса на установившийся режим.   В контрольно-пиксельно-кластерном алгоритме в целевую функцию добавлено слагаемое, минимизирующее отклонение контрольных пикселей от центроидов. В результате внесенных изменений модернизированная целевая функция преобразуется к следующему виду:

   (1)

где j – номер кластера; p – количество кластеров; Qj − множество пикселей j-го кластера;   rj − вектор координат j-го контрольного   пикселя; w – вектор весовых коэффициентов кластеров (настраиваемые управляющие параметры); c Î Qj – пиксель, принадлежащий j-му кластеру; zj − центроиды j-го кластера – неизвестные векторы, которые необходимо найти   в результате решения задачи минимизации.

Как следует из (1), целевая функция уравновешивает положение центроидов относительно как кластерных пикселей, которые могут переходить из одного кластера в другой, так и контрольных, которые отличаются от других фиксированным расположением.

Используя необходимое условие экстремума функции многих переменных, приходим к следующей системе уравнений:

      (2)

j = 1, 2, …, p.

Решая систему уравнений (2), получаем следующую формулу для расчета центроидов:

.                                  (3)

Рассмотрим полученную формулу (3) в крайних предельных случаях.

В крайнем предельном случае нулевых весовых коэффициентов формула (3) переходит в известную формулу среднего арифметического:

.                                          (4)

В крайнем предельном случае бесконечно больших весовых коэффициентов формула (3) упрощается к следующему виду: zj = rj, то есть все пиксели каждого кластера сливаются в общий кластерный центроид.

Разработанный контрольно-пиксельно-кластерный алгоритм является итерационным.   На каждом итерационном шаге вычисляются   центроиды кластеров, по расположению кото-  рых перераспределяются кластерные пиксели.   С использованием нового расположения кластеров по формуле (3) вычисляются новые центроиды, и шаги итерационного алгоритма повторяются.

Следует отметить, что необходимость управления процессом кластеризации возникает тогда, когда некоторые пиксели, принадлежащие известному кластеру, притягиваются в другой кластер.

Контрольно-пиксельно-кластерный алгоритм состоит из следующих этапов и шагов (рис. 1).

Этап 1. Нормализация многоканальных СФИ: 1.1. Выбор процедуры нормализации спектрального канала; 1.2. Нормализация спектрального канала.

Этап 2. Кластеризация спектрального канала: 2.1. Ввод стандартных параметров кла-  стеризации: количество кластеров, максималь-  ное количество итераций, точность выделения кластеров; 2.2. Ввод специальных параметров процедуры управляемого кластерного анализа: вектора весовых коэффициентов кластеров и вектора контрольных точек; 2.3. Минимизация функционала (1); 2.4. Определение пиксельных кластеров с использованием параметров, рассчитанных на шаге 2.3.

Этап 3. Визуализация результатов алгоритма управляемого кластерного анализа:   3.1. Выбор алгоритмов визуализации; 3.2. Визуализация кластеров.

Результаты практического   использования алгоритма

Для численных экспериментов используем спектральные интервалы [4, 5] многоканального СФИ, полученного оптической аппаратурой ETM+ со спутника Landsat-7 с номерами   1–5, 7. В результате каждый пиксель СФИ будет представлен шестимерным вектором вида ck = (c1k, c2k, …, c6k), где ck − вектор яркости k-го пикселя в каждом из шести выбранных спектральных интервалов.

Рассмотрим результаты применения алгоритма управляемого кластерного анализа к СФИ со спутника Landsat-7. На рисунке 2   представлен фрагмент изображения пятого спектрального канала лесного массива, расположенного в районе промышленного предприятия. Результаты кластеризации этого фрагмента на четыре и три кластера представлены на рисунке 3.

Для управления процедурой кластеризации пикселей на СФИ необходимо ввести весовые коэффициенты кластеров и контрольные пиксели. Синий кластер, присутствующий на рисунке 3а, при кластеризации на четыре кла-  стера перешел в зеленый (рис. 3б). При этом увеличились размеры черного кластера.

В использованном варианте алгоритма контрольный пиксель помещается в синий кластер, что может быть описано в виде вектора весовых коэффициентов (w1 = 0.1, w2 = 0.2,   w3 = 0.2, w4 = 0.5).

Новая мозаика кластеров представлена на рисунке 4. Как следует из этого рисунка, площадь синего кластера в результате использования весовых коэффициентов заметно возросла.

Программная реализация контрольно-пиксельно-кластерного алгоритма разработана в виде пакета программ на m-языке среды программирования MATLAB с использованием специальной библиотеки процедур обработки изображений Image Processing. Представим текст головной программы с перечнем основных подпрограмм:

function clust_b(action, varargin)

%CLUST_B – информационная система управляемой кластеризации

%

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%  

Subfunctions & Callbacks:  

%   Initclust_b – процедура инициализации элементов интерфейса

%   EditBoxUpdate – процедура ввода информации из элементов интерфейса EditBoxes

%   UpdateClusterType – процедура ввода параметров кластеризации

%   BringUpFcmControls –  процедура ввода параметров алгоритма С-средних

%   BringUpStepFcmControls – ввод параметров процедуры StepFcm

%   BringUpSubclustFcmControls – ввод параметров для алгоритма Sabtractive

%   DoOpt  – обработчик дополнительных опций

%   TakeClusterAlg – процедура выбора алгоритма кластеризации

%   InitMyWnd – инициализация базового Windows окна; параметры:

%               ar – 2-мерный массив, str – название окна

%               v = 0 imagesc, if v = 1 – поверхность

%               v = 2 – столбиковая диаграмма

%   InitMyInfoWnd – инициализация главного окна программы со следующими элементами

%            –   информация о количестве пикселей в каждом кластере

%             –  ar – результат кластеризации

%             –  cluster_n – число кластеров

%              – str – заголовок окна

%   ImageInput –  процедура чтения изображения из файла

%   InfoBtnProc – процедура обработки кнопки Info

%   ImageOutput – процедура записи результатов кластеризации

%   ChannelBtnProc – процедура кнопки «Канал»

%   ResultBtnProc – процедура кнопки «Результат»

%   ZoomOnBtnProc – процедура кнопки «Zoom-on»

%   ZoomOffBtnProc – процедура кнопки «Zoom-off»

%   ParamBtnProc – процедура кнопки «Параметры»

%   KartaBtnProc – процедура кнопки «Карта»

%   VidelaInput – процедура кнопки ввода из БД «Кон-  трольные пиксели»

%   ViewBtnProc – процедура кнопки «Вьюер»

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

if nargin<1,

   ch_n = 0;

   action='Initclust_b';

end;

feval(action,varargin{:})

return;

Заключение

Авторы разработали оригинальный контрольно-пиксельно-кластерный алгоритм анализа многоканальных СФИ лесных массивов.

Он позволяет скорректировать площади экологических зон на основе использования дополнительных параметров в виде весовых коэффициентов и информации о распределении контрольных пикселей по экологическим зонам.

Предложенный алгоритм может быть использован как эффективное программное средство управляемого кластерного анализа при составлении картосхем, отображающих воздействие техногенных химических загрязнений на состояние лесных массивов, в виде разнообразных биологических, физико-химических и экологических характеристик компонентов лесных массивов, например, интегральных экологических показателей.

Исследование выполнено по гранту Российского научного фонда (проект № 21-79-30029).

Литература

1.    Meshalkin V.P., Dovì V.G., Bobkov V.I. et. al. State of the art and research development prospects of energy and resource-efficient environmentally safe chemical process systems engineering. Mendeleev Communications, 2021, vol. 31, no. 5, pp. 593–604. DOI: 10.1016/j.mencom.2021.09.003.

2.    Мешалкин В.П., Кантюков Р.А., Бутусов О.Б. Математические методы и информационные системы анализа воздействия на природную среду нефтегазового комплекса. СПб: Недра, 2014. 365 с.

3.    Meshalkin V.P., Butusov O.B., Kantyukov R.R., Belozerskii A.Yu. Local-potential morphometric algorithm for information-entropy estimation of the impact of technogenic chemical pollution on forests. Doklady Chemistry, 2020, vol. 495, no. 2, pp. 199–204. DOI: 10.1134/S0012500820120010.

4.    Ayerdi B., Maiora J., Grana M. Active learning of hybrid extreme rotation forests for CTA image segmentation. Proc. XII Int. Conf. HIS, 2012, pp. 543–548. DOI: 10.1109/HIS.2012.6421392.

5.    Chen C.H. Image Processing for Remote Sensing. United States of America. Taylor and Francis group Publ., 2008, 218 p. DOI: 10.1201/9781420066654.

6.    Bloch I. Information Fusion in Signal and Image Processing. ISTE Publ., 2008, 297 p. DOI: 10.1002/  9780470611074.

7.    Bloch I. Fusion of numerical and structural image information in medical imaging in the framework of fuzzy sets. In: Fuzzy Systems in Medicine, pp. 429–447. DOI: 10.1007/978-3-7908-1859-8_20.

8.    Kuncheva L.I. Combining Pattern Classifiers: Methods and Algorithms. John Wiley Publ., 2004,   382 p. DOI: 10.1002/0471660264.

9.    Alexandre L.A., Campilho A.C., Kamel M. On combining classifiers using sum and product rules. Pattern Recognition Letters, 2001, vol. 22, no. 12, pp. 1283–1289. DOI: 10.1016/S0167-8655(01)00073-3.

10. Altincay H. On naive Bayesian fusion of dependent classifiers. Pattern Recognition Letters, 2005,   vol. 26, no. 15, pp. 2463–2473. DOI: 10.1016/j.patrec.2005.05.003.

11. De Oliveira J.V., Pedrycz W. Advances in Fuzzy Clustering and its Applications. NY, John Wiley and Sons Publ., 2007, 457 p. DOI: 10.1002/9780470061190.

12. Miyamoto S., Ichihashi H., Honda K. Algorithms for fuzzy clustering. Methods in c-Means clustering with applications. In: STUDFUZZ, 2008, 244 p. DOI: 10.1007/978-3-540-78737-2.

13. Steele B., Chandler J., Reddy S. Algorithms for Data Science. Springer Cham Publ., 2016, 430 p. DOI: 10.1007/978-3-319-45797-0.

14. Steele B.M. Exact bagging of K-nearest neighbor learners. Machine Learning, 2009, vol. 74,   pp. 235–255. DOI: 10.1007/s10994-008-5096-0.

15. Agresti A. Categorical Data Analysis. NY, John Wiley Publ., 2013, 742 p.

16.  Kaski P., Östergård P.R.J. Classification algorithms for codes and designs. In: AACIM, 2006, 414 p. DOI: 10.1007/3-540-28991-7.

References

  1. Meshalkin V.P., Dovì V.G., Bobkov V.I. et. al. State of the art and research development prospects of energy and resource-efficient environmentally safe chemical process systems engineering. Mendeleev Communications, 2021, vol. 31, no. 5, pp. 593–604. DOI: 10.1016/j.mencom.2021.09.003.
  2. Meshalkin V.P., Butusov O.B., Kantyukov R.R. Mathematical Methods and Information Systems for Analyzing the Environmental Impact of the Oil and Gas Complex. St. Petersburg, 2014, 365 p. (in Russ.).
  3. Meshalkin V.P., Butusov O.B., Kantyukov R.R., Belozerskii A.Yu. Local-potential morphometric algorithm for information-entropy estimation of the impact of technogenic chemical pollution on forests. Doklady Chemistry, 2020, vol. 495, no. 2, pp. 199–204. DOI: 10.1134/S0012500820120010.
  4. Ayerdi B., Maiora J., Grana M. Active learning of hybrid extreme rotation forests for CTA image segmentation. Proc. XII Int. Conf. HIS, 2012, pp. 543–548. DOI: 10.1109/HIS.2012.6421392.
  5. Chen C.H. Image Processing for Remote Sensing. United States of America. Taylor and Francis group Publ., 2008, 218 p. DOI: 10.1201/9781420066654.
  6. Bloch I. Information Fusion in Signal and Image Processing. ISTE Publ., 2008, 297 p. DOI: 10.1002/9780470611074.
  7. Bloch I. Fusion of numerical and structural image information in medical imaging in the framework of fuzzy sets. In: Fuzzy Systems in Medicine, pp. 429–447. DOI: 10.1007/978-3-7908-1859-8_20.
  8. Kuncheva L.I. Combining Pattern Classifiers: Methods and Algorithms. John Wiley Publ., 2004, 382 p. DOI: 10.1002/0471660264.
  9. Alexandre L.A., Campilho A.C., Kamel M. On combining classifiers using sum and product rules. Pattern Recognition Letters, 2001, vol. 22, no. 12, pp. 1283–1289. DOI: 10.1016/S0167-8655(01)00073-3.
  10. Altincay H. On naive Bayesian fusion of dependent classifiers. Pattern Recognition Letters, 2005, vol. 26, no. 15, pp. 2463–2473. DOI: 10.1016/j.patrec.2005.05.003
  11. De Oliveira J.V., Pedrycz W. Advances in Fuzzy Clustering and its Applications. NY, John Wiley and Sons Publ., 2007, 457 p. DOI: 10.1002/9780470061190.
  12. Miyamoto S., Ichihashi H., Honda K. Algorithms for fuzzy clustering. Methods in c-Means clustering with applications. In: STUDFUZZ, 2008, 244 p. DOI: 10.1007/978-3-540-78737-2.
  13. Steele B., Chandler J., Reddy S. Algorithms for Data Science. Springer Cham Publ., 2016, 430 p. DOI: 10.1007/978-3-319-45797-0
  14. Steele B.M. Exact bagging of K-nearest neighbor learners. Machine Learning, 2009, vol. 74, pp. 235–255. DOI: 10.1007/s10994-008-5096-0.
  15. Agresti A. Categorical Data Analysis. NY, John Wiley Publ., 2013, 742 p.
  16. Kaski P., Östergård P.R.J. Classification algorithms for codes and designs. In: AACIM, 2006, 414 p. DOI: 10.1007/3-540-28991-7.

Permanent link:
http://swsys.ru/index.php?page=article&id=4927&lang=en
Print version
The article was published in issue no. № 3, 2022 [ pp. 458-465 ]

Perhaps, you might be interested in the following articles of similar topics: