На правах рекламы:
ISSN 0236-235X (P)
ISSN 2311-2735 (E)

Авторитетность издания

ВАК - К1
RSCI, ядро РИНЦ

Добавить в закладки

Следующий номер на сайте

2
Ожидается:
16 Июня 2024

Информационная система для распознавания состояний стохастической системы

Information system for recognition of stochastic system state
Статья опубликована в выпуске журнала № 4 за 2010 год.
Аннотация:Для решения задачи распознавания состояний динамической системы в режиме реального времени предлагается новая информационная система, основанная на модифицированных алгоритмах распознавания образов, теории ин-формации, математической статистике и принципе согласования оценок. Работоспособность системы показана на распознавании состояний электромеханической системы за реальное время при большой размерности признакового пространства.
Abstract:The problem of recognition of state of real-time stochastic dynamical system provided in the form of time series is considered. A new information intelligent software system on the base of modified algorithms of pattern recognition, of statistical theory, information theory and of principle of estimate concordance is suggested. Availability of presented of information technology suggested technology has been shown on the example of real-time recognition of state in feature dimensionality space for the electromechanical system.
Авторы: Колесникова С.И. (skolesnikova@yandex.ru) - Томский политехнический университет, кандидат физико-математических наук, Букреев В.Г. (vbuk@yandex.ru) - Томский политехнический университет, доктор физико-математических наук, Мертвецов А.Н. (a.mertvetsov@gmail.com) - Томский политехнический университет, Цой Ю.Р. (yurytsoy@gmail.com) - Томский политехнический университет, кандидат технических наук
Ключевые слова: статистические оценки, оценка качества алгоритмов, эффективность распознавания, методы распознавания образов, интеллектуальная система, состояние динамической системы
Keywords: statistical estimates, quality estimation algorithms, effectiveness of recognition, methods of pattern recognition, intellectual system, dynamical system state
Количество просмотров: 11998
Версия для печати
Выпуск в формате PDF (6.26Мб)
Скачать обложку в формате PDF (1.28Мб)

Размер шрифта:       Шрифт:

Решение оперативных диагностических задач, обеспечивающих эффективную эксплуатацию дорогостоящей и сложной аппаратуры (компьютер, программное сопровождение, хранилище данных, хранилище знаний (моделей данных), интерфейсы и пр.), модель которой можно рассматривать как стохастическую динамическую систему (ДС), не потеряло актуальности.

В статье ставится задача распознавания состояний ДС, излагаются теоретические подходы к распознаванию состояний ДС и подход к программной реализации информационной интеллектуальной программной системы (ИИС), а также приводятся результаты численных экспериментов, свидетельствующие о приемлемом качестве представляемой ИИС, базовые принципы построения системы обучения и принятия решений которой частично опираются на работу [1].

Основные определения и понятия. Под системой реального времени будем понимать систему, гарантирующую время реакции на измерение контролируемой реализации ДС в темпе протекания процессов в системе (например, оперативное обнаружение разладки ДС), под состоянием ДС – совокупность элементов (подмножество) фазового пространства ДС (скаляр, точка многомерного пространства, вектор), наделенную характерными свойствами (например, определенными экспертом согласно физической природе ДС). Под дискретизацией реализации ДС (сигнала) Y(t) понимается ее разбиение по временной составляющей Yj=Y(tj)=Y(jD), D>0 (значения временного ряда), под квантованием – разбиение диапазона значений реализации на отрезки равной длины (шаг квантования). Под системой градаций квантования (СГК) будем понимать мультимножество: уникальные значения уровней квантования (целое число шагов квантования, кодирующих значение реализации ДС) и их кратности. Формализуем класс задач, решаемых системой.

Общая постановка задачи. Обозначим через W0 множество реальных состояний ДС; WY – множество реализаций состояний ДС, отражающих математическую (или иную) модель; WTS – подмножество дискретных наблюдений реализаций состояний ДС, WTSÍWY; W=(W1, …, WI) – множество образов (классов) СДС, WÍWY. Предполагается выполнение следующих предположений: 1) существует отображение f: W0®WY; 2) существует (неизвестное, однозначное) отображение g: W0®W – модель состояний ДС.

По заданной обучающей выборке (множеству значений пар объект–метка состояний ДС) QY={ylj, rlj}Nj=1⊂WTS, где  – число серий наблюдений (реализаций) одной ДС, требуется:

1)  построить алгоритм распознавания A(QY): WTS®W (возможно, множество алгоритмов), осуществляющий оценку метки СДС d∈IW={1, …, I} по совокупности новых наблюдений (L-окну) YjL=(yj1, …, yjL), YjLÎWTS, L³1, jÎTL={1, …, T‑L};

2)  оценить вектор апостериорных вероятностей принадлежности к каждому из состояний ДС {p(d/YjL), d ∈ IW};

3)  синтезировать итоговое решающее правило, согласующее частные решения пунктов 1, 2 и минимизирующее критерий качества распознавания, под которым понимают средний риск потерь, среднее число ошибок на полном скользящем контроле, вероятность неправильного распознавания;

4)  оценить обобщающую способность алгоритма распознавания (и решающего правила) в смысле минимума информационного критерия качества;

5)  обеспечить решение задач 1−4 в режиме реального времени (для технических систем) на реальных размерностях данных при ограничениях на вычислительные ресурсы ЭВМ.

Заметим, что при L=T задача распознавания переходит в задачу идентификации.

Пример постановки задачи из решаемых ИИС класса. Пусть задан случайный процесс

            (1)

характеризующий состояние ДС, где X(t) − вектор ненаблюдаемых переменных состояния системы; Y(t) − случайная наблюдаемая векторная функция; x(t) − шум достаточно общей природы. Относительно динамики поведения случайного процесса (1) на [t0, Т] выдвинуто I>1 альтернативных гипотез W={W1, W2, …, WI}, составляющих полную группу событий и интерпретируемых как классы состояний ДС. Другими словами, временной фрагмент реализации случайного процесса может находиться только в одной из заданных (экспертом или по обучающей выборке) областей (классов) Wi, . Наблюдение осуществляется в соответствии с дискретным планом tÎ{t0, t1, …, tN}, tj=t0+jD, , по реальной ДС или ее модели. Задача состоит в отнесении наблюдаемых в момент t или на некотором фиксированном интервале (t¢, t¢¢) наблюдаемых реализаций Y(t) к классу Wi, .

Несмотря на большое количество методов интеллектуальной обработки диагностической информации, вопрос об идентификации состояний ДС в такой постановке остается открытым, поскольку практическое решение поставленной задачи затруднено не только наличием возможной зашумленной нелинейной связи между откликом (выходом) и входным воздействием, но и присутствием немоделируемой динамики, реальностью времени решения задачи распознавания состояний ДС. Рассмотрим особенности двух базовых подходов, реализованных в ИИС, применительно к решению поставленной задачи.

Решение задачи. Принципиальная сложность задачи распознавания состояний ДС методами распознавания образов обусловлена следующими факторами: 1) необходимость анализа обучающей выборки большого размера (для технических систем порядка более 104–106, а как известно, задача поиска информативных наборов признаков является NP-полной), в силу чего применение традиционных методов весьма затруднительно; 2) проведение обучения и построение решающего правила на одной реализации ДС, а принятие решения при распознавании – на другой (возможно, с другим уровнем и типом шумов); 3) реальность времени для технических систем, оцениваемая малыми порядками (10‑5с для электронно-механи­ческих систем (ЭМС)); 4) нелинейность и нестационарность зашумленного случайного процесса (1), вследствие чего применение спектральных методов приводит к неадекватным выводам; 5) возможное пересечение граничащих состоя- ний ДС.

Известно, что недостаточная информативность признаков не может гарантировать получение высокого качества классификации объектов из генеральной совокупности даже группой правил. Поэтому акцент в ИИС распознавания состояний ДС смещен в сторону решения задачи выбора информативных признаков и согласованности оценок их разделяющей способности. В обсуждаемой ИИС в качестве предварительной обработки временного ряда применяются линейные и нелинейные фильтры; формируются взвешенные эталоны, обобщающие близко расположенные объекты с учетом возможной принадлежности разным состояниям ДС, при этом эталоны с малыми весами можно интерпретировать как шумы с последующим применением традиционных методов (k-бли­жайших соседей, эталонов). При получении частных конкурирующих решений (по нескольким алгоритмам распознавания относительно всех состояний ДС) итоговое решение (с учетом весов алгоритмов на контрольной выборке) агрегируется по алгоритму согласования оценок, разработанному по [2].

Подпись:  	 б)а)																	б)Примечание: СК, АК – стандартное и адаптивное квантование, соответственно; ЕМ – Евклида метрика; ХМ –Хемминга метри-ка; ИнфОМ – метрика на основе информационного расстояния Кульбака.Рис. 1. Точность распознавания а) в зависимости от уровня квантования по одной реализации 30 %-го шума; время распознавания б) при адаптивном и стандартном квантованииПодход к решению задачи на основе теории информации является математической основой многих методов (критерий релевантности, ROC-анализ и др.). Принципиальное отличие от традиционного – формирование диагностических признаков на основе метода адаптивного квантования значений временного ряда. Суть его заключается в выборе СГК минимальной размерности, которая наилучшим образом выделяла бы информативность градаций в смысле их дискриминирующей сути. Здесь под информативностью понимается качественное свойство, характеризующее долю полезной информации в общем объеме СГК и количественно выраженное определенной мерой (энтропией, дивергенцией информации и др.). Метод на основе выбранной СГК и на базе сравнения условных распределений уровней реализации ДС (признака) в разных состояниях ДС обеспечивает на порядок и более меньшее время распознавания СДС без существенной потери его качества (рис. 1).

Подпись:  Рис. 2. Блок-схема программного комплексаАрхитектура программного комплекса ReDSS. Программный комплекс ReDSS (Recogni­tion of Dynamic System State), реализующий ИИС, имеет распределенную архитектуру. На стороне сервера развертываются БД (в которой хранится история моделирования), множество алгоритмов распознавания, выполненных в виде подключаемых модулей, в состав комплекса входит web-клиент. К серверу можно подключаться из сторонних приложений, для этого доступны сборки с интерфейсами 1 и 2 (рис. 2), с помощью которых можно добавить свой модуль (отдельную библиотеку) в каталог алгоритмов. Модуль имеет параметры (типы входных и выходных данных). Тип модуля может быть произвольным и задается его разработчиком (распознаватель, фильтр, генератор ряда, модуль голосования и т.д.). Данные о конфигурации модулей, параметры, передаются серверу в виде модели [3]. Модель представляет собой коллекцию ячеек, каждая из которых содержит информацию о блоке модели и его связи. Всякому подключенному к серверу клиенту соответствует свой экземпляр модели. Любые изменения в структуре модели, выполненные пользователем в клиентском приложении, отражаются на экземпляре, созданном на сервере. Установив необходимые значения параметров каждому модулю, обучив модули, требующие обучения, пользователь может начать процесс моделирования.

Подпись:  а) модель содержит описание объектов и связей между ними, каталог алгоритмов – информацию обо всех подключенных в данный момент модулях б) пример модели: результаты работы модулей, их параметры сохраняются в БДРис. 3. Блок-схема сервераПрограммная реализация комплекса. Для реализации комплекса была выбрана платформа Microsoft.NET, имеющая объектно-ориентирован­ную архитектуру, для поддержки распределенных приложений – Microsoft.NET Remoting [4], серверным доменом приложения выбрана служба Windows.

Решение прикладной задачи распознавания состояний ЭМС. Численная иллюстрация качества работы ИИС проведена на примере распознавания состояний ЭМС (асинхронного двигателя). Моделирование на ЭВМ преследовало следующие цели: исследовать время и эффективность распознавания (доли правильно распознанных объектов, под которыми понимались «окна» случайного размера в 5–10 отсчетов) при разных СГК в условиях разных метрик (Евклида, Хемминга, информационная) и при различных типах и уровнях шумов; оценить влияние предварительной (ядерной) фильтрации на распознавание состояний ДС. Численное моделирование (в том числе фильтрации) алгоритма распознаваний состояний ДС проводилось на измеряемых сигналах тока и напряжения АД по 6 моделям в условиях зашумленности порядка 0,30 %–90 % от максимальной амплитуды полезного сигнала (см. табл.).

Результаты моделирования на ЭВМ. В ходе анализа полученных реализаций фильтрации и прогноза были выявлены следующие особенности: а) увеличение числа градаций квантования приводит в среднем к повышению точности распознавания до определенного уровня (далее возможны падения точности, связанные со структурой сигнала и переобучением); б) время распознавания растет линейно для всех метрик в условиях стандартной и адаптивной процедуры квантования; в) оптимальное число градаций (минимальное значение n0 шагов квантования такое, что при n>n0 точность распознавания не увеличивается, а при 0

При анализе нелинейных нестационарных моделей ДС с высоким уровнем шумов был обнаружен эффект, когда в силу адаптивного выбора уровней квантования число градаций не увеличивалось с ростом параметра квантования, что повлекло существенное уменьшение времени распознавания (в 3–50 и более раз, см. табл.). Отметим, что с большим уровнем шумов сигнал фильтруется слабо, а при использовании ядерных функций в качестве обобщенных признаков необходимо проводить скользящий контроль для различных параметров ядерных функций, что влечет возрастание времени обучения в несколько раз. В этом случае предварительная фильтрация малоэффективна, и процедура фильтрации в тех ситуациях, когда распознавание состояния ДС в реальном режиме времени является самостоятельной задачей, не несет основной нагрузки при условии применения вышеизложенных модификаций выбора признаков и АР. Статистическая значимость указанных данных (точности распознавания) проверялась по t-тесту с уровнем значимости 0,95.

Эффективность и время распознавания по трем метрикам

Минимальное число градаций

Эффективность распознавания (СК/АК)

ИнфОМ

ЕМ

ХМ

10

94,86/90,41

93,76/93,16

90,2/85,26

20

98,85/97,88

97,62/97,41

99,06/96,25

30

100/97,96

99,83/97,78

100/95,85

40

100/100

100/100

100/100

 

Время распознавания х×10-5 с (СК/АК) для 104 объектов

10

9624/324

2221/141

1062/76

20

19197/399

4407/137

2058/90

30

28503/409

6407/144

2895/65

40

38198/601

8728/181

4096/83

Обзор аналогов. Среди систем для удаленного тестирования алгоритмов в различных их комбинациях и на различных данных следует отметить следующие: WEKA (http://www.cs.waikato.ac.nz/ml/ weka), RapidMiner (http://rapid-i.com/content/view/ 124/1/), находящийся в разработке Полигон алгоритмов (http://poligon.machinelearning.ru), ЭЙДОС (http://www.cs.tut.fi/~lasip/), ДЕЛЬТА (http://lc.ku­bagro.ru/ aidos/) и др. Анализ ПО показал, что в перечисленных системах, во-первых, нет ориентации на реальное время (отклик в технических системах должен соизмеряться с временным интервалом получения информации о состоянии ДС), во-вторых, в рамках временного ряда рассматривается только либо разложение его на составляющие (в том числе фильтрация), либо задача идентификации (восстановление зависимости) и не решается задача распознавания состояний ДС как фрагмента реализации случайного процесса; в-третьих, программный комплекс ReDDS позволяет без вмешательства в исходный код расширять базу используемых алгоритмов и обладает всеми преимуществами распределенной архитектуры. ИИС ReDDS решает задачи предоставления пользователю инструментария для обработки реального или модельного временного ряда; выбора модели из существующих прецедентов; использования алгоритмов распознавания, адаптированных к предметной области, возможности их комбинирования; применения алгоритмов анализа временного ряда на основе методов частично наблюдаемых случайных процессов; обработки, анализа и представления результатов.

Таким образом, можно сделать следующее заключение. Представлена разработка новой распределенной ИИС автоматизированной обработки ВР как модели ДС. Продемонстрирована работоспособность ИИС ReDDS для распознавания состояний динамического объекта за реальное время с большой размерностью исходного признакового пространства. На конкретной прикладной задаче изучены поведение и свойства вариантов алгоритмов распознавания при различных вариациях интенсивностей шумов и величин параметров оптимизации, а именно: исследованы время и эффективность распознавания при изменении интервалов дискретизации, метода системы информативных признаков (СГК), вида распределения шумов и дисперсии шумов.

Литература

1.   Вагин В.Н. [и др.] Достоверный и правдоподобный вывод в интеллектуальных системах. М.: Физматлит, 2004.

2.   Шоломов Л.А. Исследование одного класса динамических процедур коллективного выбора // Нелинейная динамика и управление. Вып. 5. М.: Физматлит, 2007.

3.   Вирт Н. Алгоритмы и структуры данных М.: Мир, 1989. С. 360.

4.   Маклин С., Нафтел Дж., Уильяме К. М15 Microsoft .NET Remoting; пер. с англ. М.: Изд.-торг. дом «Русская Редакция», 2003. 384 с.


Постоянный адрес статьи:
http://swsys.ru/index.php?page=article&id=2618
Версия для печати
Выпуск в формате PDF (6.26Мб)
Скачать обложку в формате PDF (1.28Мб)
Статья опубликована в выпуске журнала № 4 за 2010 год.

Возможно, Вас заинтересуют следующие статьи схожих тематик: