ISSN 0236-235X (P)
ISSN 2311-2735 (E)
3

13 Сентября 2024

Контрольно-пиксельно-кластерный алгоритм оценки воздействия химических загрязнений на лесные массивы по спутниковым фотоизображениям

DOI:10.15827/0236-235X.139.458-465
Дата подачи статьи: 26.07.2022
УДК: 632.151+630*587+004

Мешалкин В.П. (clogist@muctr.ru) - РХТУ им. Д.И. Менделеева, г. Москва, Москва, Россия, доктор технических наук, Бутусов О.Б. (butusov-1@mail.ru) - Московский государственный машиностроительный университет (МАМИ) (профессор, зав. кафедрой ), Москва, Россия, доктор физико-математических наук, Кантюков Р.Р. (R_Kantyukov@vniigaz.gazprom.ru) - НИИ природных газов и газовых технологий – Газпром ВНИИГАЗ (доцент, зам. генерального директора по науке), пос. Развилка, Россия, кандидат технических наук, Чистякова Т.Б. (-) - Санкт-Петербургский государственный технологический институт (технический университет) (профессор, зав. кафедрой систем автоматизированного проектирования и управления), Санкт-Петербург, Россия, доктор технических наук
Ключевые слова: вегетационный индекс, контрольный пиксель, лесной массив, многоканальность фотоизображения, кластер, спектральный канал, предприятие, металлургический комплекс, химическое загрязнение
Keywords: vegetation indices, control pixels, forest areas, multi-channel photo image, cluster, spectral channel, enterprise, metallurgical complex, chemical pollution


     

При разработке методов комплексной оценки воздействия химических загрязнений промышленных предприятий на окружающую среду, в частности, на лесные массивы, как комплексные индексы состояния окружающей среды считается, что наиболее эффективной является оценка в виде величины ущерба, нанесенного биомассе лесной растительности выбросами промышленных предприятий [1–3].

Под воздействием химических загрязнений нарушаются сложные биологические циклы в лесных массивах, в результате чего происходят   явные физиономические изменения, такие как дехромация, дефолиация и изреживание древостоя. Существует возможность дистанционной дешифровки физиономических нарушений состояния лесных массивов по спутниковым фотоизображениям (СФИ) [4, 5]. Для дешифровки СФИ применяются методы кластерного анализа, результаты которого зависят от количества информации, используемой при кластеризации. Для увеличения количества информации применяются методы объединения информации из разных источников, получившие название data fusion [6–10]. При этом необходимо учитывать, что разные виды лесных   массивов по-разному реагируют на химические загрязнения [2, 3]. Это обусловливает необходимость использования для оценки   экологического ущерба лесным массивам от химических загрязнений нечетких мето-  дов [8, 9, 11, 12] теории «доза–эффект» зависимостей и экологического зонирования [1–3].

Для выделения экологических зон предлагается вариант метода data fusion, основанный на использовании дополнительной информации в виде весовых коэффициентов и контрольных пикселей [6–10]. Контрольные пиксели представляют собой точки на СФИ, принадлежность которых экологическим зонам известна заранее либо в результате наземных исследований, либо из анализа статистических данных или данных лесоустройства [1, 2].

В работе [1] систематизированы алгоритмы на основе использования следующих современных методов цифровизации: фрактально-статистические методы анализа кластерной структуры СФИ, методы вейвлет-преобразования СФИ лесных массивов, текстурные методы анализа СФИ, нейросетевые методы анализа, нечетко-логические алгоритмы, алгоритмы генерализации и интегральной оценки экологического состояния лесных массивов, алгоритмы определения «доза–эффект» зависимо-  стей, алгоритмы экологического зонирования лесных массивов. Данные методы и основанные на них интеллектуально-вычислительные алгоритмы позволяют получать в результате пиксельного анализа СФИ более точную конфигурацию мозаики экологических зон и,   как следствие, более точные экономические оценки ущербов, нанесенных химическими загрязнениями окружающей среды [1, 2].

Предпосылки разработки алгоритмов управляемого кластерного анализа

Рассмотрим сущность алгоритма управляемого кластерного анализа, блок-схема которого изображена на рисунке 1. Характерная особенность алгоритма – применение при кластеризации контрольных пикселей на СФИ, что позволяет управлять процессом определения кластеров с использованием известной априорной информации о принадлежности контрольных пикселей различным кластерам экологических зон.

Алгоритм является развитием классического алгоритма К-средних [13, 14]. При этом в классический функционал метода наименьших квадратов вводятся дополнительные слагаемые и параметры, описывающие влияние весовых коэффициентов и контрольных пикселей на решение задачи оптимизации. Для кластеризации пикселей на СФИ в классическом алгоритме   К-средних необходимо указать количество кластеров, максимальное число итераций и точность решения задачи.

В дополнение к классическому алгоритму К-средних в предложенном управляемом   контрольно-пиксельно-кластерном алгоритме необходимо дополнительно указать весовые коэффициенты кластеров и контрольные пиксели, в результате чего изменяется вид целевой функции. Также в алгоритмах кластеризации необходимо выбрать метрику для расчета критерия подобия (сходства) между кластерными пикселями [15, 16], например, расстояние Евклида, Минковского, Манхэттеновское и др.

В классическом итерационном алгоритме К-средних [14] решается задача квадратичной безусловной оптимизации с выходом итерационного процесса на установившийся режим.   В контрольно-пиксельно-кластерном алгоритме в целевую функцию добавлено слагаемое, минимизирующее отклонение контрольных пикселей от центроидов. В результате внесенных изменений модернизированная целевая функция преобразуется к следующему виду:

   (1)

где j – номер кластера; p – количество кластеров; Qj − множество пикселей j-го кластера;   rj − вектор координат j-го контрольного   пикселя; w – вектор весовых коэффициентов кластеров (настраиваемые управляющие параметры); c Î Qj – пиксель, принадлежащий j-му кластеру; zj − центроиды j-го кластера – неизвестные векторы, которые необходимо найти   в результате решения задачи минимизации.

Как следует из (1), целевая функция уравновешивает положение центроидов относительно как кластерных пикселей, которые могут переходить из одного кластера в другой, так и контрольных, которые отличаются от других фиксированным расположением.

Используя необходимое условие экстремума функции многих переменных, приходим к следующей системе уравнений:

      (2)

j = 1, 2, …, p.

Решая систему уравнений (2), получаем следующую формулу для расчета центроидов:

.                                  (3)

Рассмотрим полученную формулу (3) в крайних предельных случаях.

В крайнем предельном случае нулевых весовых коэффициентов формула (3) переходит в известную формулу среднего арифметического:

.                                          (4)

В крайнем предельном случае бесконечно больших весовых коэффициентов формула (3) упрощается к следующему виду: zj = rj, то есть все пиксели каждого кластера сливаются в общий кластерный центроид.

Разработанный контрольно-пиксельно-кластерный алгоритм является итерационным.   На каждом итерационном шаге вычисляются   центроиды кластеров, по расположению кото-  рых перераспределяются кластерные пиксели.   С использованием нового расположения кластеров по формуле (3) вычисляются новые центроиды, и шаги итерационного алгоритма повторяются.

Следует отметить, что необходимость управления процессом кластеризации возникает тогда, когда некоторые пиксели, принадлежащие известному кластеру, притягиваются в другой кластер.

Контрольно-пиксельно-кластерный алгоритм состоит из следующих этапов и шагов (рис. 1).

Этап 1. Нормализация многоканальных СФИ: 1.1. Выбор процедуры нормализации спектрального канала; 1.2. Нормализация спектрального канала.

Этап 2. Кластеризация спектрального канала: 2.1. Ввод стандартных параметров кла-  стеризации: количество кластеров, максималь-  ное количество итераций, точность выделения кластеров; 2.2. Ввод специальных параметров процедуры управляемого кластерного анализа: вектора весовых коэффициентов кластеров и вектора контрольных точек; 2.3. Минимизация функционала (1); 2.4. Определение пиксельных кластеров с использованием параметров, рассчитанных на шаге 2.3.

Этап 3. Визуализация результатов алгоритма управляемого кластерного анализа:   3.1. Выбор алгоритмов визуализации; 3.2. Визуализация кластеров.

Результаты практического   использования алгоритма

Для численных экспериментов используем спектральные интервалы [4, 5] многоканального СФИ, полученного оптической аппаратурой ETM+ со спутника Landsat-7 с номерами   1–5, 7. В результате каждый пиксель СФИ будет представлен шестимерным вектором вида ck = (c1k, c2k, …, c6k), где ck − вектор яркости k-го пикселя в каждом из шести выбранных спектральных интервалов.

Рассмотрим результаты применения алгоритма управляемого кластерного анализа к СФИ со спутника Landsat-7. На рисунке 2   представлен фрагмент изображения пятого спектрального канала лесного массива, расположенного в районе промышленного предприятия. Результаты кластеризации этого фрагмента на четыре и три кластера представлены на рисунке 3.

Для управления процедурой кластеризации пикселей на СФИ необходимо ввести весовые коэффициенты кластеров и контрольные пиксели. Синий кластер, присутствующий на рисунке 3а, при кластеризации на четыре кла-  стера перешел в зеленый (рис. 3б). При этом увеличились размеры черного кластера.

В использованном варианте алгоритма контрольный пиксель помещается в синий кластер, что может быть описано в виде вектора весовых коэффициентов (w1 = 0.1, w2 = 0.2,   w3 = 0.2, w4 = 0.5).

Новая мозаика кластеров представлена на рисунке 4. Как следует из этого рисунка, площадь синего кластера в результате использования весовых коэффициентов заметно возросла.

Программная реализация контрольно-пиксельно-кластерного алгоритма разработана в виде пакета программ на m-языке среды программирования MATLAB с использованием специальной библиотеки процедур обработки изображений Image Processing. Представим текст головной программы с перечнем основных подпрограмм:

function clust_b(action, varargin)

%CLUST_B – информационная система управляемой кластеризации

%

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%  

Subfunctions & Callbacks:  

%   Initclust_b – процедура инициализации элементов интерфейса

%   EditBoxUpdate – процедура ввода информации из элементов интерфейса EditBoxes

%   UpdateClusterType – процедура ввода параметров кластеризации

%   BringUpFcmControls –  процедура ввода параметров алгоритма С-средних

%   BringUpStepFcmControls – ввод параметров процедуры StepFcm

%   BringUpSubclustFcmControls – ввод параметров для алгоритма Sabtractive

%   DoOpt  – обработчик дополнительных опций

%   TakeClusterAlg – процедура выбора алгоритма кластеризации

%   InitMyWnd – инициализация базового Windows окна; параметры:

%               ar – 2-мерный массив, str – название окна

%               v = 0 imagesc, if v = 1 – поверхность

%               v = 2 – столбиковая диаграмма

%   InitMyInfoWnd – инициализация главного окна программы со следующими элементами

%            –   информация о количестве пикселей в каждом кластере

%             –  ar – результат кластеризации

%             –  cluster_n – число кластеров

%              – str – заголовок окна

%   ImageInput –  процедура чтения изображения из файла

%   InfoBtnProc – процедура обработки кнопки Info

%   ImageOutput – процедура записи результатов кластеризации

%   ChannelBtnProc – процедура кнопки «Канал»

%   ResultBtnProc – процедура кнопки «Результат»

%   ZoomOnBtnProc – процедура кнопки «Zoom-on»

%   ZoomOffBtnProc – процедура кнопки «Zoom-off»

%   ParamBtnProc – процедура кнопки «Параметры»

%   KartaBtnProc – процедура кнопки «Карта»

%   VidelaInput – процедура кнопки ввода из БД «Кон-  трольные пиксели»

%   ViewBtnProc – процедура кнопки «Вьюер»

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

if nargin<1,

   ch_n = 0;

   action='Initclust_b';

end;

feval(action,varargin{:})

return;

Заключение

Авторы разработали оригинальный контрольно-пиксельно-кластерный алгоритм анализа многоканальных СФИ лесных массивов.

Он позволяет скорректировать площади экологических зон на основе использования дополнительных параметров в виде весовых коэффициентов и информации о распределении контрольных пикселей по экологическим зонам.

Предложенный алгоритм может быть использован как эффективное программное средство управляемого кластерного анализа при составлении картосхем, отображающих воздействие техногенных химических загрязнений на состояние лесных массивов, в виде разнообразных биологических, физико-химических и экологических характеристик компонентов лесных массивов, например, интегральных экологических показателей.

Исследование выполнено по гранту Российского научного фонда (проект № 21-79-30029).

Литература

1.    Meshalkin V.P., Dovì V.G., Bobkov V.I. et. al. State of the art and research development prospects of energy and resource-efficient environmentally safe chemical process systems engineering. Mendeleev Communications, 2021, vol. 31, no. 5, pp. 593–604. DOI: 10.1016/j.mencom.2021.09.003.

2.    Мешалкин В.П., Кантюков Р.А., Бутусов О.Б. Математические методы и информационные системы анализа воздействия на природную среду нефтегазового комплекса. СПб: Недра, 2014. 365 с.

3.    Meshalkin V.P., Butusov O.B., Kantyukov R.R., Belozerskii A.Yu. Local-potential morphometric algorithm for information-entropy estimation of the impact of technogenic chemical pollution on forests. Doklady Chemistry, 2020, vol. 495, no. 2, pp. 199–204. DOI: 10.1134/S0012500820120010.

4.    Ayerdi B., Maiora J., Grana M. Active learning of hybrid extreme rotation forests for CTA image segmentation. Proc. XII Int. Conf. HIS, 2012, pp. 543–548. DOI: 10.1109/HIS.2012.6421392.

5.    Chen C.H. Image Processing for Remote Sensing. United States of America. Taylor and Francis group Publ., 2008, 218 p. DOI: 10.1201/9781420066654.

6.    Bloch I. Information Fusion in Signal and Image Processing. ISTE Publ., 2008, 297 p. DOI: 10.1002/  9780470611074.

7.    Bloch I. Fusion of numerical and structural image information in medical imaging in the framework of fuzzy sets. In: Fuzzy Systems in Medicine, pp. 429–447. DOI: 10.1007/978-3-7908-1859-8_20.

8.    Kuncheva L.I. Combining Pattern Classifiers: Methods and Algorithms. John Wiley Publ., 2004,   382 p. DOI: 10.1002/0471660264.

9.    Alexandre L.A., Campilho A.C., Kamel M. On combining classifiers using sum and product rules. Pattern Recognition Letters, 2001, vol. 22, no. 12, pp. 1283–1289. DOI: 10.1016/S0167-8655(01)00073-3.

10. Altincay H. On naive Bayesian fusion of dependent classifiers. Pattern Recognition Letters, 2005,   vol. 26, no. 15, pp. 2463–2473. DOI: 10.1016/j.patrec.2005.05.003.

11. De Oliveira J.V., Pedrycz W. Advances in Fuzzy Clustering and its Applications. NY, John Wiley and Sons Publ., 2007, 457 p. DOI: 10.1002/9780470061190.

12. Miyamoto S., Ichihashi H., Honda K. Algorithms for fuzzy clustering. Methods in c-Means clustering with applications. In: STUDFUZZ, 2008, 244 p. DOI: 10.1007/978-3-540-78737-2.

13. Steele B., Chandler J., Reddy S. Algorithms for Data Science. Springer Cham Publ., 2016, 430 p. DOI: 10.1007/978-3-319-45797-0.

14. Steele B.M. Exact bagging of K-nearest neighbor learners. Machine Learning, 2009, vol. 74,   pp. 235–255. DOI: 10.1007/s10994-008-5096-0.

15. Agresti A. Categorical Data Analysis. NY, John Wiley Publ., 2013, 742 p.

16.  Kaski P., Östergård P.R.J. Classification algorithms for codes and designs. In: AACIM, 2006, 414 p. DOI: 10.1007/3-540-28991-7.

References

  1. Meshalkin V.P., Dovì V.G., Bobkov V.I. et. al. State of the art and research development prospects of energy and resource-efficient environmentally safe chemical process systems engineering. Mendeleev Communications, 2021, vol. 31, no. 5, pp. 593–604. DOI: 10.1016/j.mencom.2021.09.003.
  2. Meshalkin V.P., Butusov O.B., Kantyukov R.R. Mathematical Methods and Information Systems for Analyzing the Environmental Impact of the Oil and Gas Complex. St. Petersburg, 2014, 365 p. (in Russ.).
  3. Meshalkin V.P., Butusov O.B., Kantyukov R.R., Belozerskii A.Yu. Local-potential morphometric algorithm for information-entropy estimation of the impact of technogenic chemical pollution on forests. Doklady Chemistry, 2020, vol. 495, no. 2, pp. 199–204. DOI: 10.1134/S0012500820120010.
  4. Ayerdi B., Maiora J., Grana M. Active learning of hybrid extreme rotation forests for CTA image segmentation. Proc. XII Int. Conf. HIS, 2012, pp. 543–548. DOI: 10.1109/HIS.2012.6421392.
  5. Chen C.H. Image Processing for Remote Sensing. United States of America. Taylor and Francis group Publ., 2008, 218 p. DOI: 10.1201/9781420066654.
  6. Bloch I. Information Fusion in Signal and Image Processing. ISTE Publ., 2008, 297 p. DOI: 10.1002/9780470611074.
  7. Bloch I. Fusion of numerical and structural image information in medical imaging in the framework of fuzzy sets. In: Fuzzy Systems in Medicine, pp. 429–447. DOI: 10.1007/978-3-7908-1859-8_20.
  8. Kuncheva L.I. Combining Pattern Classifiers: Methods and Algorithms. John Wiley Publ., 2004, 382 p. DOI: 10.1002/0471660264.
  9. Alexandre L.A., Campilho A.C., Kamel M. On combining classifiers using sum and product rules. Pattern Recognition Letters, 2001, vol. 22, no. 12, pp. 1283–1289. DOI: 10.1016/S0167-8655(01)00073-3.
  10. Altincay H. On naive Bayesian fusion of dependent classifiers. Pattern Recognition Letters, 2005, vol. 26, no. 15, pp. 2463–2473. DOI: 10.1016/j.patrec.2005.05.003
  11. De Oliveira J.V., Pedrycz W. Advances in Fuzzy Clustering and its Applications. NY, John Wiley and Sons Publ., 2007, 457 p. DOI: 10.1002/9780470061190.
  12. Miyamoto S., Ichihashi H., Honda K. Algorithms for fuzzy clustering. Methods in c-Means clustering with applications. In: STUDFUZZ, 2008, 244 p. DOI: 10.1007/978-3-540-78737-2.
  13. Steele B., Chandler J., Reddy S. Algorithms for Data Science. Springer Cham Publ., 2016, 430 p. DOI: 10.1007/978-3-319-45797-0
  14. Steele B.M. Exact bagging of K-nearest neighbor learners. Machine Learning, 2009, vol. 74, pp. 235–255. DOI: 10.1007/s10994-008-5096-0.
  15. Agresti A. Categorical Data Analysis. NY, John Wiley Publ., 2013, 742 p.
  16. Kaski P., Östergård P.R.J. Classification algorithms for codes and designs. In: AACIM, 2006, 414 p. DOI: 10.1007/3-540-28991-7.


http://swsys.ru/index.php?id=4927&lang=%E2%8C%A9%3Den&like=1&page=article


Perhaps, you might be interested in the following articles of similar topics: