ISSN 0236-235X (P)
ISSN 2311-2735 (E)

Journal influence

Higher Attestation Commission (VAK) - К1 quartile
Russian Science Citation Index (RSCI)

Bookmark

Next issue

2
Publication date:
16 June 2024

Informational and algorithmic support of an environmental air monitoring intelligent system based on neural networks

Date of submission article: 30.06.2022
Date after edit article: 04.07.2022
UDC: 004.89
The article was published in issue no. № 4, 2022 [ pp. 715-728 ]
Abstract:The article discusses algorithmic and informational support of an intelligent control system for modern gas analyzers used in environmental air monitoring systems called the Electronic nose. Neural networks form the base of information support. The paper describes a modern automatic odor recognition system based on measurements using low-selective sensors in multi-sensor systems for detecting components of gas mixtures in ambient air. It also shows the advantage of the proposed system compared with traditional systems with highly selective sensing elements. There is a library of smell images based on a series of prerecorded respons-es from the sensor matrix. It is stored in the intelligent system database. Then the responses of an analyzed gas are compared with the responses of individual substances from the image library. The authors propose a two-stage data clustering method for information processing. First, observational data is normalized so that each input parameter equally affects the system. Then the data are assembled in-to clusters using self-organizing Kohonen maps and the k-means algorithm. Each cluster represents an odor with a similar smell. Specific assessments are based on experimental data collected in the environmental monitoring system in the area of the waste incineration plant in Kozhukhovo. The paper considers the choice of an odor identification criteria, which will be used by experts in deciding on odor identification. There is a substantiation of choosing the proximity metric of analytical samples as the norm of the distance between the odor vectors in each sample as a criterion. The authors have developed an algorithm for identifying a substance’s gas analytical sample using neu-ral networks and the selected criterion for decision-making support. There is also a developed (using R pro-gramming language) software product that allows assessing data membership obtained from a device to a certain smell followed by providing visual results of a odors’ spread dynamics in real-time. The paper pre-sents the application results of the developed algorithm in the eco-monitoring system of the incinerator plant in the Kosino-Ukhtomsky district of the Moscow region.
Аннотация:Работа посвящена алгоритмической и информационной поддержке интеллектуальной системы управления современными газоанализаторами, применяемыми в системах экологического мониторинга воздуха «электронный нос». Основу информационной поддержки составляют нейронные сети. Описана современная технология автоматического распознавания запахов на основе измерений с помощью низкоселективных датчиков в мультисенсорных системах обнаружения компонентов газовых смесей в атмосферном воздухе. Показано преимущество ее применения по сравнению с традиционными системами с высокоселективными чувствительными элементами. На основе записанных откликов с матрицы сенсоров создается библиотека образов запахов, которая хранится в БД интеллектуальной системы. Затем отклики анализируемого газа сравниваются с откликами отдельных веществ из библиотеки образов. Для обработки информации предложен двухступенчатый метод кластеризации данных. Сначала данные наблюдений нормализуются, чтобы каждый входной параметр имел одинаковое влияние на систему. Затем они собираются в кластеры с использованием самоорганизующихся карт Кохонена и алгоритма k-средних. При этом каждый отдельный кластер представляет вещество со схожим запахом. Получение конкретных оценок было выполнено на основе экспериментальных данных, собранных в системе экологического мониторинга в районе мусоросжигательного завода в Кожухово. Рас-смотрен выбор критерия идентификации запаха, которым в дальнейшем руководствуются эксперты при принятии решения. Обоснован выбор в качестве критерия значения метрики близости аналитических проб как нормы расстояния между векторами запаха в каждой пробе. Разработаны алгоритм идентификации газовой аналитической пробы вещества с использованием нейронных сетей и выбранного критерия подготовки принятия решения, а также программный продукт на языке R, позволяющий оценить принадлежность полученных с прибора данных к определен-ному запаху с последующим получением визуальных результатов динамики распространения запахов в реальном времени. Приведены результаты применения разработанных алгоритмов в системе экомониторинга мусоросжигательного завода в районе Косино-Ухтомский Московской области.
Authors: Yarygin G.A. (office@diem.ru ) - SPF DIEM (Professor, Scientific Supervisor), Moscow, Russia, Ph.D, Bayukin M.V. (bayukin@diem.ru) - SPF DIEM (Deputy Director), Moscow, Russia, Ph.D, Kornyushko V.F. (arbenina@mitht.ru) - Lomonosov Moscow State University of Fine Chemical Technologies (Professor, Head of Chair), Moscow, Russia, Ph.D, Shmakova E.G. (89254225204@mail.ru) - MIREA – Russian Technological University (Associate Professor), Moscow, Russia, Ph.D, Sadekov L.V. (leosadekov@yandex.ru) - Russian Technological University (MIREA) (Postgraduate Student), Moscow, Russia
Keywords: decision-making system, environmental air monitoring, gas analyzer multisensory systems, neural network, clustering, kohonen maps, k-means algorithm, proximity metric of analytical samples, r programming environment, intellectual system
Page views: 1948
PDF version article

Font size:       Font:

Одной из основных задач, направленных на улучшение качества атмосферного воздуха как на самих промышленных предприятиях, так и в окружающих их среде, является выявление источников загрязнения и проведение мероприятий по уменьшению концентраций загрязняющих веществ в атмосферном воздухе. Для ее решения в современных системах промышленного экологического мониторинга и в системах научных лабораторных исследований все более широкое распространение получают технологии автоматического распознавания запахов с использованием многоканальных газоанализаторов на основе малогабаритных сенсоров и систем интеллектуального управления для принятия решений. Автоматический многоканальный анализатор предназначен для непрерывного контроля атмосферного воздуха в режиме реального времени [1].

Анализатор имеет встроенную библиотеку запахов отдельных объектов и способен измерять их интенсивность. Он может быть включен в систему сети территориального контроля качества воздуха или использоваться как отдельный анализатор для мониторинга интенсивности запаха и идентификации его источника. Мультисенсорная система обнаружения компонентов газовых смесей в атмосферном воздухе названа «Электронный нос» [2]. Подобная технология автоматического распознавания запахов работает на основе измерений с низкоселективных датчиков в отличие от более традиционных систем с высокоселективными чувствительными элементами.

Запах образуется смесью пахучих веществ неизвестного состава, а не отдельным веществом, следовательно, требуется контролировать концентрацию выбросов газовых смесей, а не отдельного пахучего вещества. Ольфактометрические исследования позволяют получить полноценную количественную картину запаха в атмосферном воздухе или выбросах газовых смесей с последующим моделированием распространения запаха. Без проведения количественных химических анализов в стационарной химической лаборатории выделить конкретные соединения и источник запаха из смеси веществ практически невозможно [3].

Матрица сенсоров часто обладает перекрестной чувствительностью, в большинстве случаев их количество избыточно, поэтому необходимо уменьшать размерность пространства измерений за счет выделения наиболее информативных элементов. Подобные операции осуществляются с использованием хемометрического анализа для выделения существенной информации из набора данных. Например, метод принципиального компонентного анализа определяет направления максимальной дискриминации картин сенсорных откликов и наиболее часто используется в линейном приближении. Однако для решения классификационных задач данный метод недостаточно эффективен. Среди других методов следует отметить метод линейного дискриминационного анализа. Он позволяет находить направление, по которому достигаются наибольшие различия между образцами с различными запахами и при этом минимизируются различия между образцами с одинаковыми запахами. Однако в силу того, что при функционировании мультисенсорной системы газоанализатора вероятны достаточно большие отклонения от линейности, для получения корректной количественной информации требуются методы, способные обрабатывать данные без априорного знания функциональных зависимостей между входными сигналами и выходными параметрами, то есть методы нелинейные и непараметрические [4].

С принятием международных решений о постепенном переходе целых отраслей промышленности на зеленые технологии требуется более точный и широкий спектр идентифицируемых загрязнений. Кроме того, отслеживание изменений состава атмосферного воздуха на протяжении большого периода (от нескольких месяцев до года) вблизи источника выбросов требует периодической проверки корректности работы мультисенсорной системы. Необходимы периодическая перенастройка и проверка работоспособности с учетом активно меняющихся погодных условий. Для обработки данных требуются методы обработки без априорного знания функциональных зависимостей между входными сигналами и выходными параметрами [5]. Поэтому в целях корректного опре-  деления изменения запаха близ источников   производства с высоким содержанием газовых выбросов предлагается использовать двухступенчатый метод кластеризации наблюдений, собранных газовым анализатором. Снятые с прибора данные моделируются с помощью самоорганизующихся карт Кохонена, построенных на основе цифровых сигналов от матрицы сенсоров газового анализатора, позволяя определить повторяющиеся паттерны, которые собираются в двумерную карту схожести среди нейронов   в n-мерном пространстве, а затем разносятся в кластеры запахов с использованием алгоритма k-средних. Это дает возможность визуализировать и оценить характеристики образца запаха близ его источника.

Научная новизна настоящей исследовательской работы заключается в формировании методики применения системного анализа для разработки и реализации информационной поддержки интеллектуальной системы распознавания аналитических проб в многоканальном газоанализаторе. Методика включает иерархическую систему критериев и теоретико-множественные модели на стадии разработки, а также информационные и математические модели на основе нейронных сетей на   стадии реализации с применением двухступенчатой кластеризации. Разработанный программный продукт визуализирует кластерные наблюдения в виде цветовых образов и сводит пространство собранных экспериментальных данных в компактные структуры нескольких кластеров (запахов) с отсчетом отклонений от-  носительно среднего значения.

Основное преимущество интеллектуаль-  ных систем управления на основе нейронных   сетей – принятие решений после соответствующего обучения системы. Для этого записываются отклики массива чувствительных сенсоров, через которые прокачивается газ, содержащий пары вещества. На основе записанных откликов с матрицы сенсоров создается библиотека образов запахов, которая хранится в БД интеллектуальной системы. Затем отклики анализируемого газа сравниваются с откликами отдельных веществ из библиотеки образов. Данный процесс называют распознаванием газовой пробы. В случае обнаружения схожих откликов или их комбинации появляется сообщение о нахождении в анализируемом газе паров исследуемого вещества или набора веществ.

Следует отметить, что интеллектуальная система газового анализатора не является измерителем концентрации. Определяется не количественная характеристика анализируемой пробы (концентрация), а качественная: проводится идентификация пробы, устанавливается класс образов, к которому она относится. По своей сути это специализированная информационная система, включающая подсистемы сбора, передачи, хранения, обработки и визуализации данных [6].

Целью настоящего исследования является повышение эффективности процессов распознавания образов запаха за счет информационной поддержки интеллектуальной системы принятия решений на основе нейронных сетей. В ходе ее достижения были решены следующие задачи.

1.    Разработка математического и функционального описания процесса идентификации газовой аналитической пробы вещества.

2.  Разработка информационного обеспечения поддержки принятия решений исследователем при проведении анализа аналитической пробы вещества.

3. Разработка архитектуры интеллектуальной информационной системы обработки информации распознавания аналитических проб в многоканальном газоанализаторе, содержащей библиотеку аналитических проб, подсистему идентификации, подсистему информационной и алгоритмической поддержки и подсистему экспертного оценивания.

4.    Разработка алгоритмического обеспечения идентификации аналитической пробы с применением средств искусственного интеллекта.

5.    Разработка программного продукта для реализации выбранного алгоритмического решения.

6.    Апробация разработанных методов и алгоритмов идентификации в реальной интеллектуальной системе экологического мониторинга.

Для анализа информационных потоков в интеллектуальной системе были применены инструменты функционального моделирования в нотации IDEF0 [7].

Функционально-технологическая модель процесса идентификации аналитической про­бы вещества в атмосферном воздухе отражает последовательный процесс поступления газовой смеси в газоанализатор, преобразование ее в цифровой сигнал и вывод значимого критерия системы в виде значения метрики, определяющей степень схожести образов запаха. На рисунке 1 представлена декомпозиция контекстной диаграммы в нотации IDEF0 описания процесса идентификации аналитической пробы многоканального газоанализатора с управлением на основе системы искусственного интеллекта. Диаграмма отражает процесс обработки цифрового сигнала, поступающего с сенсорной матрицы на рабочую станцию, в которую запрограммирован алгоритм распознавания аналитической пробы. Декомпозиция функциональных блоков позволяет исследовать информационные потоки внутри интеллектуальной системы управления многоканальным газоанализатором.

Газовая смесь образа запаха с окружающим воздухом поступает внутрь системы для передачи на сенсорную матрицу. Частицы газа оседают на сенсорах, что повышает их электрочувствительность и формирует выходной цифровой сигнал анализируемой пробы, или, как называют эту величину в теории распознавания образов, вектор признаков. Любой вектор в n-мерном пространстве можно охарактеризовать модулем вектора и его направлением. Для аналитических проб модуль вектора трактуется как интенсивность запаха или индекс загазованности. При разбавлении аналитической пробы чистым воздухом в 2 раза концентрация примесей уменьшается в 2 раза, и модуль вектора признаков на выходе прибора (индекс загазованности) падает тоже примерно в 2 раза. Различия направления двух векторов в теории распознавания образов оцениваются через расчет значения метрики. Она не зависит от модулей векторов, а характеризует именно разность их направлений. Меньшее значение метрики означает высокую сонаправленность векторов, то есть высокую схожесть между двумя аналитическими пробами [8].

Непрерывное наблюдение за чистотой атмосферного воздуха в системе экологического мониторинга приводит к накоплению огромных объемов информации, хранящейся в БД. Для сжатия этой информации применяются различные методы, при этом одним из наиболее эффективных является метод нейронных сетей. В работе были использованы самоорганизующиеся карты Кохонена, которые преобразуют n-мерное пространство измерений в двухмерное координатное пространство обрабатывающих элементов или нейронов.

Карты Кохонена позволяют значительно сократить объем хранящейся в БД информации за счет ее разбиения на кластеры. При этом схожие наблюдения разбиваются на выборки, что облегчает обработку данных и процесс принятия решений, так как каждый кластер можно проанализировать отдельно. Для интеллектуальной системы газоанализатора это означает определение моментов времени, когда система фиксировала схожие образы запахов в атмосферном воздухе [9].

Самоорганизующиеся карты Кохонена представляют собой однослойные сети, где отдельные нейроны соединены с каждым элементом n-мерного входного значения вектора. Вектор весов описывается формулой w = [w1, w2, …, wn].

Вектор весов рассчитывается для каждого нейрона. Исходя из расчета весов выбирается нейрон-победитель – такой нейрон, расстояние которого от входного элемента наименьшее и для которого выполняется следующее отношение: d (x, w) = mind (x, wi); 1 < i < n, где d (x, w) – расстояние между входным и весовым векторами; n – количество нейронов.

Особенность расчета весовых векторов заключается в том, что соседние нейроны адаптируют значения своих весов в соответствии с выбранным нейроном-победителем, следуя направлению его вектора по следующему правилу: w(k+1) = wi(k) + μi(k)[x – wi(k)], где μi(k)  – коэффициент обучения соседнего нейрона в области S(k).

Разработанная алгоритмическая и информационная поддержка принятия активно применяется в экологическом мониторинге района на границе мусоросжигательного завода в Кожухово. Наблюдение за атмосферным воздухом осуществлялось с 01.12.2019 по 15.01.2020. Экспериментальные данные описывают изменение концентрации летучих примесей в атмо-  сферном воздухе за указанный период. Для проведения нейронного анализа были использованы данные с матрицы сенсорных датчиков, разделенные на три подвыборки.

1.    Training Dataset. Представляет 70 % от общих наблюдений. На основе этих данных создается сеть Кохонена.

2.    Testing Dataset – 15 % от общего количества наблюдений. С помощью этой подвыборки проводится уточнение параметров сгенерированной сети.

3.    Validation Dataset – 15 % от общих наблюдений. С помощью данной подвыборки проводится дополнительное тестирование сети, чтобы подтвердить ее приемлемость.

Сначала данные наблюдений нормализуются, чтобы каждый входной параметр имел одинаковое влияние на систему. Затем они собираются в кластеры с использованием самоорганизующихся карт Кохонена и алгоритма   k-средних. Однослойные карты позволяют визуализировать данные в группы наблюдений и определять их в фактические кластеры по ха-  рактеру запаха. Для задачи наблюдения за атмосферным воздухом в Кожухово выбрана размерность карты в 20´20 единиц согласно эвристическому правилу, что ширина и высота карты выходят из формулы m = 5 [10]. Распределение наблюдений по кластерам карт Кохонена представлено в таблице 1.

Созданная сеть распределила наблюдения по топологической сетке размером 20´20, где каждый отдельный кластер представляет вещество со схожим запахом, зафиксированное в разный момент времени. Сеть отличается малой ошибкой выборок, что говорит о достаточной корреляции собранных наблюдений.

Недостаток сетей Кохонена заключается в том, что нейрон, изначально обученный на принадлежность к одному классу, во время обучения сети может изменить свой вектор направления и начать ассоциироваться с совершенно другим классом. По этой причине сеть Кохонена может стать нестабильной в период полного обучения. Во избежание перезаписи нейрона добавлен второй слой кластеров, основанный на алгоритме k-средних, благодаря чему схожие кластеры собираются в один общий кластер образа запаха, позволяя игнорировать возможные отклонения в процессе обучения карт Кохонена (рис. 2).

Второй слой сети строится на основе весов нейронов каждого из кластеров первого слоя, не добавляя большого количества лишних вычислений. Поскольку при методе k-средних количество кластеров необходимо указывать вручную, разделим кластеры предыдущего слоя на 5 больших кластеров, то есть k = 5. Расчет весов кластеров второго слоя происходит следующим образом: wi (t) = wi(t – 1) + l(xi –   – wi(t – 1)), где x – вес нейрона первого слоя.

Проведя серию экспериментов с кластеризацией с изменением k от 2 до 7 и изучив нормативные документы района исследования, было принято решение разбить топологическую карту на 5 кластеров. В случае k > 5 начинали выделяться достаточно малые группы наблюдений, которые при отсутствии соответствующей временным меткам нормативной   информации считались незначительными и нивелировались. В таблице 2 собрана результирующая статистика обработки данных газоанализатора для того, чтобы попытаться сделать промежуточный вывод о характере наблюдаемых запахов. Далее приведены усредненные показатели сенсорных датчиков каждого кластера.

Разбиение собранных наблюдений на кластеры позволяет оценить частоту появления определенного образа запаха в атмосферном воздухе. Пока основные высокочастотные кластеры описывают характерный для точки взятия наблюдений запах, малые кластеры описывают редкие или аномальные случаи появления отдельных летучих примесей в воздухе. Данные кластеров необходимо дополнительно исследовать для принятия конечного решения о характере запаха. Измерение атмосферного воздуха на предмет присутствия летучих примесей за отведенный период времени, жалобы граждан и волонтеров, метеопараметры и т.д. могут служить сопроводительной информацией для принятия решения о соответствии запаха отдельного кластера измерений. Затем результат может быть добавлен в библиотеку образов для сравнения с новыми наблюдениями, используя расчет значения метрики через евклидово расстояние между двумя векторами признаков.

Следующей важнейшей задачей интеллектуальной системы является выбор критерия идентификации запаха, которым в дальнейшем руководствуются эксперты для принятия решения об идентификации запахов. В общем виде задача математически решается с использованием критериального подхода, основанного на формировании множества локальных критериев управленческих задач для разработки механизма корректной оценки построения информационной поддержки интеллектуальной системы управления и подготовки, на основе анализа параметров системы П = {пi}, где i = 1, …, p; p – количество параметров. Отдельный вариант управленческого решения X состоит из набора критериев K, характеризующих качество выбранного решения: K = {ki}, где i = 1, …, n; n – количество критериев. Интегральный критерий Kg определяет глобальную цель   проводимых исследований и характеризует на­правление изменения характеристик для принятия управленческого решения.

Матрица K(м) экспертных оценок cij определяет влияние исполнения операции на формирование критериев управленческих оценок. Значение критерия под воздействием руководящего фактора в форме выполненных операций определяется алгебраической суммой: , где  – текущее значение критерия; Dki – приращение критерия в результате изменения интенсивности выполнения операций; значение критерия формулы описывается уравнением .

Критерии развития определяют целевые функции. Решая непосредственно многокритериальные задачи, следует

-      учитывать влияние отдельного критерия при решении контекстной задачи, поскольку каждый критерий может обладать индивидуальной значимостью или приоритетом;

-      стандартизировать критерии; данные наблюдений могут приводиться в различных единицах измерений, поэтому необходимо провести их нормализацию;

-      подобрать метод оптимизации ресурсов, выделенных на решение поставленной задачи.

Профессиональным экспертом или группой экспертов оцениваются значения критериев. Затем, руководствуясь полученными оценками, определяется глобальный критерий – многокритериальная экспертная оценка. Глобальный критерий G формируется из множества частных критериев Kjm:

где Sim – элемент формальной модели; f p – функция отображения; N – число частных критериев; Djm – множество атрибутов частного критерия.

Локальные критерии содержат экономические, экологические и технологические критерии. Разработка интеллектуальных систем управления с применением экспертных систем необходима для реализации управления с учетом этих критериев [11].

В качестве технологических критериев при поэтапном контроле процесса идентификации аналитической пробы исследуемого вещества в интеллектуальной системе многоканального газоанализатора применяются критерии (оцен-  ки) технологического контроля (kт). Технологический контроль за процессом идентификации запаха проводится на всех стадиях протекания процесса: на стадии подачи газовой смеси воздуха и аналитической пробы создается контролируемое окружение; при анализе газовой смеси на сенсорной матрице система должна быть откалибрована должным образом, чтобы датчики фиксировали оседание частиц корректно; при обработке получившихся цифровых сигналов данные служат входом для обучения нейросети кластеризации наблюдений и расчета близости вектора признаков образа запаха – получения значения метрики. Конечный локальный критерий – значение метрики близости аналитических проб. Это один из важнейших критериев процесса управления интеллектуальной системой многоканального газоанализатора. На его основе изучается близость исследуемых аналитических проб и принимается решение о необходимости внесения изменений в технологический процесс идентификации пробы [12].

Образ аналитической пробы представляет собой представленную в виде массива данных совокупность сигналов массива датчиков с одинаковой временной меткой, которой с математической точки зрения соответствует некоторый вектор в многомерном пространстве. Координаты этого вектора соответствуют нормированным сигналам отдельных датчиков, а размерность многомерного пространства – количеству каналов измерений.

Длина (модуль) вектора соответствует интенсивности запаха, а его направление индивидуально для каждого отдельного источника.

Алгоритм идентификации аналитической пробы сводится к вычислению метрики между цифровым кодом пробы и цифровыми кодами всех стандартных образцов из БД. Наименьшее значение метрики указывает на идентифицированный образец из БД, а количественное значение метрики служит оценкой достоверности этой идентификации: чем меньше значение метрики, тем выше достоверность идентификации. При лабораторных испытаниях с применением стандартных образцов, сравнивая значение модуля вектора анализируемой пробы и концентрацию идентифицированного образца, записанного в БД, можно оценить содержание компонента в пробе. Введем обозначения: i – номер образца; j – номер пробы; k – номер канала сенсора; Vi – вектор признаков образцов запахов Vi(X1, X2, …, Xk); Vj – вектор признаков пробы воздуха; M(Vi, Vj) = Mij – метрика расстояния между i-м образцом и j-й пробой.

Значение метрики оценивается через евклидово расстояние между нормированными векторами, например, для двумерного случая  (табл. 3).

Координаты нормированного вектора vi(xi, yi) одинаковы для всех векторов данного на­правления независимо от его длины, а норма такого вектора vi(xi, yi) = 1. Метрика не зависит от модулей векторов, а характеризует именно разность их направлений. Чем меньше значение параметра метрики, тем ближе направления векторов, то есть тем ближе запахи исследуемой пробы и образца. Рассмотрим расчет метрик на примере двух векторов признаков образцов V1(180,40) и V2(20,140) и некоторой пробы S1(50,25) (табл. 4).

Визуализация исходных и нормированных векторов признаков образцов и пробы приведена на рисунке 3, результаты расчетов метрик – в таблице 5.

Для наглядности использован 20-кратный масштаб для нормированных векторов.

Результаты расчета метрик подтверждают вывод, очевидный из графической визуализации исходных данных примера: вектор признаков пробы S1 намного ближе к вектору признаков образца V1 (M11 = 0,2444), чем к вектору признаков образца V2 (M12 = 0,9282). Графическая визуализация применима при размерности задачи не более 3, то есть для двух- и трехканальных сенсоров. В случае использования восьмиканальных сенсоров графический метод неприменим и расчет метрики является единственным способом оценки близости векторов признаков.

Для выбора алгоритма расчета метрики было проведено сопоставление нескольких вариантов расчета с целью определения наиболее подходящего варианта. После анализа полученных результатов окончательно была вы-  брана метрика: , где  – вектор текущего измерения;  – вектор образа запаха в БД.

В расчете значения метрики M соответствия вектора измерений и образца используется отношение угла между векторами измерения и образца к максимально возможному значению угла в пространстве положительных значений, которое рассчитывается как арккосинус отношения скалярного произведения векторов к произведению их модулей (взято в единицах процентов).

Совокупность сигналов восьми датчиков с одинаковой временной меткой, представленная в виде массива данных, которой с матема-  тической точки зрения соответствует некоторый вектор в многомерном пространстве, соответствует запаху пробы. Алгоритм вычисления значения метрики не является универсальным, различные подходы при распознавании образов отличаются именно алгоритмами вычисления метрики. Сущность алгоритма заключается в расчете метрики между вектором признаков пробы (a) и вектором всех стандартных образцов, находящихся в БД (b). Вектор признаков источников запаха описывает образ состава анализируемой пробы. БД рабочей станции содержит векторы признаков шести подготовленных образцов с концентрациями на уровне   0,5–1 ppm. Поток данных поступает на рабочую станцию, где сравниваются сигналы от сенсорных модулей с БД образцов (рис. 4).

Разработка алгоритмов велась применительно к аппаратной и интеллектуальной системам многоканального газоанализатора фирмы «ДИЭМ» (рис. 5). При этом на вход подсистемы анализа цифровых сигналов поступали нормированные данные восьми датчиков: PID, TGS2600, TGS2602, TGS2603, NO, CO, SO2, NO2. Анализатор предназначен для выполнения непрерывных автоматических измерений в приземном слое атмосферного воздуха массовых (или объемных) концентраций загрязняющих веществ, а также метеорологических параметров, уровня шума, гамма-фона. Приоритетными местами его размещения являются границы санитарно-защитной зоны предприятий, вблизи границ жилой застройки, населенные пункты (для целей государственного мониторинга).

Для программной реализации разработанного алгоритма идентификации наблюдений была использована программная среда R, поскольку она включает в себя широкий набор готовых библиотек для статистического анализа данных [13].

Разработанный программный продукт визуализирует работу сенсоров в реальном времени в виде цветовых образов (рис. 6), которые позволяют продемонстрировать динамику попадания частиц вещества на отдельном сенсорном датчике. Совмещение карт образов всех входных элементов позволяет оценить корреляцию между ними, например, то, что запах в отдельный период времени формирует четкий отклик на одних сенсорах, в то время как другие показывают малое значение отклика. Сопоставив техническую информацию с картой жалоб жителей, можно составить картину запаха для отдельного промежутка времени.

Программа сводит набор наблюдений в компактную структуру данных нескольких кластеров, где отклонения в реальном времени сравниваются со средним значением отдельного кластера (запаха). Однослойные карты позволяют визуализировать данные в группы наблюдений и определить их в фактические кластеры по характеру запаха. Размерность топологической карты, как и остальные параметры, передаются в программу. Для задачи наблюдения за атмосферным воздухом в Кожухово, как уже упоминалось, выбрана размерность карты в 20´20 единиц. Полученная карта разграничена на 5 кластеров запахов (рис. 7).

Формируя библиотеку запахов, необходимо охарактеризовать кластеры групп наблюдений (рис. 8). Помимо применения технологии искусственного интеллекта, для разбиения данных на фактические кластеры запахов необходимо ориентироваться на нормативные документы: жалобы жителей ближайших районов, их опросы, сведения волонтеров о времени и месте появления запаха, метеопараметры с информацией о направлении ветра и т.д. Например, наиболее вероятно, что превалирующий по числу наблюдений четвертый кластер ассоциируется с безвредным воздухом, поскольку время наблюдений распределено равномерно и с этими показателями не ассоциируются нормативные сведения. Малые кластеры (3 и 5) соотносятся с аномальными запахами, не присущими точке наблюдения: проехала машина, подул ветер со стороны, противоположной заводу, и т.д. Наблюдения в первом и втором кластерах часто фиксировались с разной временной периодичностью. Дополнительно с указанными временными метками совпадают жалобы жителей на присутствие гари и сероводорода в воздухе и т.д. Наиболее вероятно, что они ассоциируются с запахом с мусоросжигательного завода [14].

При принятии решений по анализу атмосферного воздуха эксперт-исследователь использует таблицу расчета двух типов метрики: между соседними записями в БД и между средними показаниями кластеров и их статистическими оценками – минимальным, средним и максимальным. Он отслеживает динамику изменения состава воздуха и способен определить, когда содержание газовых примесей в воздухе отклоняется от средних значений объекта библиотеки. На основе количественных данных, которые фиксируются в реальном вре-  мени, и алгоритма идентификации пробы, заложенного в рабочей станции, эксперт способен эффективно принимать решения об изменении состава веществ в атмосферном воздухе в реальном времени.

Заключение

Выполненный комплекс исследований ориентирован на информационное и алгоритмическое обеспечение процесса идентификации аналитической пробы исследуемого вещества с использованием инструментов системного анализа и технологий искусственного интеллекта.

Разработано математическое и функциональное описание процесса идентификации аналитической пробы вещества.

Сформировано множество критериев оцен­ки качества идентификации аналитической пробы исследуемого вещества с выводом глобального эколого-технологического критерия на основе критериального подхода.

Разработана информационная поддержка этапа идентификации аналитической пробы образа вещества, начиная от закачки газовой пробы до расчета технологического критерия, определяемого в виде значения некоторой метрики, с применением средств системного анализа создания функциональных моделей процессов в нотации IDEF0.

Разработан программный продукт анализа экспериментальных данных, сводящий снимаемые с прибора наблюдения в компактные кластеры для оценки принадлежности их к определенному запаху с последующей визуализацией.

Выведен способ расчета значения метрики из множества вариантов с проведением эмпирического эксперимента. Проведен анализ подсистем поддержки интеллектуальной информационной системы. Разработана реализация самоорганизующейся нейронной сети Кохонена с методом расчета k-средних для кластеризации собранных наблюдений многоканаль-  ным газоанализатором. На основе полученных результатов могут приниматься решения о природе запаха в отдельном кластере.

Разработано алгоритмическое обеспечение идентификации запаха на основе критерия, представляющего собой метрику для оценки разности цифровых кодов пробы и цифровых кодов стандартных образцов из БД.

Литература

1.     Городнова Н.В. Применение искусственного интеллекта в проектах «Smart-экология» // Дискуссия. 2021. Т. 106. № 2. С. 34–48.

2.     Ганшин В.М., Фесенко А.В., Чебышев А.В. От обонятельных моделей к «электронному носу». Новые возможности параллельной аналитики. URL: http://www.vrsystems.ru/stati/ot_obonyatelnix_  modelei_k_elektronnomu_nosu.htm (дата обращения: 20.06.2022).

3.     Ярыгин Г.А., Баюкин М.В., Корнюшко В.Ф., Садеков Л.В. «Электронный нос» как элемент искусственного интеллекта в задачах экологического мониторинга // ИТТ. 2021. № 50. С. 22–29.

4.     Marco S. The need for external validation in machine olfaction: Emphasis on health-related applications. Analytical and Bioanalytical Chemistry, 2014, vol. 406, no. 16, pp. 3941–3956. DOI: 10.1007/s00216-014-7807-7.

5.     Capelli L., Sironi S., Del Rosso R. Review: Electronic noses for environmental monitoring applications. Sensors, 2014, vol. 14, no. 11, pp. 19979–20007. DOI: 10.3390/s141119979.

6.     Рыбина Г.В. Основы построения интеллектуальных систем. М.: Финансы и статистика, 2014.   432 с.

7.     Корнюшко В.Ф., Николаева О.М., Золотов С.Ю., Крюкова О.В., Садеков Л.В. Интеллектуальные информационные технологии в экспериментальных исследованиях разработки готовых лекарственных форм (ГЛФ) при производстве лекарственных средств // Наука России: Цели и задачи: сб. тр. 2021.   С. 96–104. DOI: 10.18411/sr-10-02-2021-22.

8.     Ярыгин Г.А., Баюкин М.В., Корнюшко В.Ф., Шмакова Е.Г., Садеков Л.В. Информационная поддержка системы распознавания компонентов газовых смесей «электронный нос» с искусственным интеллектом в задачах экологического мониторинга // Вестн. технологического университета. 2022.   Т. 25. № 1. С. 81–87.

9.     Licen S., Barbieri G., Fabbris A., Brigglio S.C., Pillon A., Stel F., Barbieri P. Odor control map: Self-Organizing map built from electronic nose signals and integrated by different instrumental and sensorial data to obtain an assessment tool for real environmental scenarios. Sensors and Actuators B: Chemical, 2018,   vol. 263, pp. 476–485. DOI: 10.1016/j.snb.2018.02.144.

10. Вагин В.Н., Ганишев В.А. Кластеризация пользователей по голосу с помощью улучшенных самоорганизующихся растущих нейронных сетей // Программные продукты и системы. 2015. № 3.   С. 136–142. DOI: 10.15827/0236-235X.111.136-142.

11. Мелентьев В.А. Использование метода Мелентьева представления графов для выявления клик и анализа топологий вычислительных систем // ISJ Theoretical & Applied Science. 2018. Т. 68. № 12.   С. 201–211. DOI: 10.15863/TAS.2018.12.68.28.

12. Мешалкин В.П. Экспертные системы в химической технологии. М.: Химия, 1995. 367 с.

13. Богданов П.Ю., Краева Е.В., Веревкин С.А., Пойманова Е.Д., Татарникова Т.М. Программные среды для изучения основ нейронных сетей // Программные продукты и системы. 2021. Т. 34. № 1.   С. 145–150. DOI: 10.15827/0236-235X.133.145-150.

14. Варшавский П.Р., Кожевников А.В. Реализация программных средств для классификации данных на основе аппарата сверточных нейронных сетей и прецедентного подхода // Программные продукты и системы. 2020. Т. 33. № 4. С. 591–598. DOI: 10.15827/0236-235X.132.591-598.

References

  1. Gordonova N.V. Applying of artificial intelligence in ²SMART-ecology² projects. Discussion, 2021, vol. 106, no. 2, pp. 34–48 (in Russ.).
  2. Ganshin V.M., Fesenko A.V., Chebyshev A.V. From Olfactory Models to the ²Electronic Nose². New Features of Parallel Analytics. Available at: http://www.vrsystems.ru/stati/ot_obonyatelnix_modelei_k_elektronnomu_nosu.htm (accessed June 20, 2022) (in Russ.).
  3. Yarygin G.A., Bayukin M.V., Kornyushko V.F., Sadekov L.V. ²Electronic nose² as an element of artificial intelligence in tasks of environmental monitoring. Information and Telecommunication Technologies, 2021, no. 50, pp. 11–25 (in Russ.).
  4. Marco S. The need for external validation in machine olfaction: Emphasis on health-related applications. Analytical and Bioanalytical Chemistry, 2014, vol. 406, no. 16, pp. 3941–3956. DOI: 10.1007/s00216-014-7807-7.
  5. Capelli L., Sironi S., Del Rosso R. Review: Electronic noses for environmental monitoring applications. Sensors, 2014, vol. 14, no. 11, pp. 19979–20007. DOI: 10.3390/s141119979.
  6. Rybina G.V. Fundamentals of Building Intelligent Systems. Moscow, 2014, 432 p. (in Russ.).
  7. Kornyushko V.F., Nikolaeva O.M., Zolotov S.Yu., Kryukova O.V., Sadekov L.V. Intelligent information technology in experimental research of development of finished dosage forms (GLF) in the production medicines. Collection of Scientific Papers, 2021, pp. 96–104. DOI: 10.18411/sr-10-02-2021-22 (in Russ.).
  8. Yarygin G.A., Bayukin M.V., Kornyushko V.F., Shmakova E.G., Sadekov L.V. Information support of the "electronic nose" gas mixture components recognition system with artificial intelligence in environmental monitoring tasks. Herald of the Technological University, 2022, vol. 25, no. 1, pp. 81–87 (in Russ.).
  9. Licen S., Barbieri G., Fabbris A., Brigglio S.C., Pillon A., Stel F., Barbieri P. Odor control map: Self-Organizing map built from electronic nose signals and integrated by different instrumental and sensorial data to obtain an assessment tool for real environmental scenarios. Sensors and Actuators B: Chemical, 2018, vol. 263, pp. 476–485. DOI: 10.1016/j.snb.2018.02.144.
  10. Vagin V.N., Ganishev V.A. Speaker clustering using enhanced self-organizing incremental neural networks. Software & Systems, 2015, no. 3, pp. 136–142. DOI: 10.15827/0236-235X.111.136-142 (in Russ.).
  11. Melentʹev V.A. Use of Melentiev’s graph representation method for detection of cliques and the analysis of topologies of computing systems. ISJ Theoretical & Applied Science, 2018, vol. 68, no. 12, pp. 201–211. DOI: 10.15863/TAS.2018.12.68.28 (in Russ.).
  12. Meshalkin V.P. Expert Systems in Chemical Technology. Moscow, 1995, 367 p. (in Russ.).
  13. Bogdanov P.Yu., Kraeva E.V., Verevkin S.A., Poymanova E.D., Tatarnikova T.M. Software environments for studying the basics of neural networks. Software & Systems, 2021, vol. 34, no. 1, pp. 145–150. DOI: 10.15827/0236-235X.133.145-150 (in Russ.).
  14. Varshavskiy P.R., Kozhevnikov A.V. Implementation of data classification software based on convolutional neural networks and case-based reasoning approach. Software & Systems, 2020, vol. 33, no. 4, pp. 591–598. DOI: 10.15827/0236-235X.132.591-598 (in Russ.).

Permanent link:
http://swsys.ru/index.php?page=article&id=4958&lang=en
Print version
The article was published in issue no. № 4, 2022 [ pp. 715-728 ]

Perhaps, you might be interested in the following articles of similar topics: