ISSN 0236-235X (P)
ISSN 2311-2735 (E)

Journal influence

Higher Attestation Commission (VAK) - К1 quartile
Russian Science Citation Index (RSCI)

Bookmark

Next issue

4
Publication date:
09 December 2024

Prediction based on the allocation of border implementations of dynamic systems

The article was published in issue no. № 4, 2010
Abstract:The paper proposes two methods for predicting complex signal based on multilayer perceptron and SVM. The length of training set for the predictor is based on the allocation of border implementations of dynamic systems in the signal, in order to use for learning the last fragment of the signal with the quasi-stable dynamic. This change-point is found in the local fractal dimension of the signal. The presented methods were developed in software package.
Аннотация:В работе предлагаются два метода прогнозирования сложного сигнала, базирующиеся на основе многослойного персептрона и SVM. Длина обучающего множества для предиктора определяется на основе выделения границы реа-лизаций динамических систем в сигнале, чтобы для обучения использовать последний фрагмент сигнала с квазиста-бильной динамикой. Для этого ищется точка разладки в локальной фрактальной размерности сигнала. Разработанные методы реализованы в программном комплексе.
Authors: I.G. Sidorkina (SidorkinaIG@volgatech.net) - Volga State University of Technology (Professor), Yoshkar-Ola, Russia, Ph.D, (g12@bk.ru) - , (dimavova@mail.ru) -
Keywords: SVM, neural network, dynamic systems, fractality, change-point detection, forecasting
Page views: 15496
Print version
Full issue in PDF (6.26Mb)
Download the cover in PDF (1.28Мб)

Font size:       Font:

В своей деятельности человек часто сталкивается со сложными цифровыми сигналами – медицинские показания, сигналы с датчиков на производстве, финансовые и экономические показатели. Сигнал представляется временным рядом значений, наблюдаемых в последовательные промежутки времени: ()≡{x1, x2, …, xN}, где ≡{t1, t2, …, tN}, xi=(ti), i=1, …, N, где N – число отсчетов в сигнале. Сложный сигнал имеет следующие характеристики (одну или несколько): нестационарность, непериодичность, функция распределения сигнала, отличная от нормального, сингулярность, фрактальность, стохастичность и хаотичность. Такие сигналы необходимо прогнозировать. Для решения этой задачи был предложен следующий подход:

1)  выделить стабильный участок в конце временного ряда, на котором происходит обучение предиктора, учитывающего последнюю динамику исследуемого процесса;

2)  выполнить прогнозирование исследуемого временного ряда с использованием двух методов – на основе достижения порога изменения сигнала и на основе SVM.

Использование двух независимых предикторов позволяет повысить стабильность прогнозирования и снизить ошибку.

Метод выделения границ реализации динамической системы. Для решения этой задачи предложена структурная модель, согласно которой сложный сигнал рассматривается как последовательности реализаций различных динамических систем (ДС), то есть:

где (t) – d-мерный вектор состояния системы в момент t; n – число точек смены динамики;  – вектор-функции, определяющие следующее состояние системы в различные периоды времени и имеющие ki последних значений x(t) в качестве параметров, i=1, …, n; ri – точки смены динамики сигнала; N – число наблюдений сигнала.

Чтобы анализировать и использовать для обучения предиктора последний стабильный в некоторой мере фрагмент временного ряда сигнала, необходимо разделить сигнал на участки квазистационарности. Такая задача известна как задача обнаружения разладки – изменения любых вероятностных свойств сигнала [1]. Однако для сложных сигналов это определение разладки может давать неточную границу истинной смены динамики сигнала. Поэтому предлагается использовать свойство, характеризующее сложный сигнал и для которого можно получить адекватные численные оценки, используя только наблюдаемый временной ряд. Как показали исследования, таким свойством является фрактальность. А точнее, локальная фрактальная размерность – показатель фрактальной размерности для ограниченной области временного ряда сигнала.

В качестве оценки локальной фрактальной размерности предлагается использовать индекс фрактальности [2]. Обнаружение смены динамики сигнала происходит по изменению индекса фрактальности в статистическом смысле, то есть по наличию разладки в ряде. Это позволяет определять смену динамики сигнала x(t) как изменение степени однородности его фрактальной размерности.

Для обнаружения изменения вероятностных свойств производного сигнала локальной фрактальной размерности использован апостериорный непараметрический алгоритм кумулятивных сумм (АКС). В результате проведенного исследования выявлено, что он эффективнее по скорости и точности обнаружения для сложных стохастических сигналов (в среднем на 5–8 %), чем общий случай алгоритма Бродского–Дарховского и метод на основе принципа минимума информационного рассогласования.

Метод обнаружения границы реализаций динамических систем заключается в следующем. По исходному сигналу строится производный сигнал локальной фрактальной размерности. В этих сигналах методом АКС находятся точки разладки. Положения точек сопоставляются, и берется среднее значение – это и будет границей между реализациями различных ДС.

Общая последовательность прогнозирования сложного сигнала следующая: получение сигнала, получение производного от исходного сигнала ряда локальной фрактальной размерности, поиск точки разладки в исходном сигнале и в ряде локальной фрактальной размерности – получение границы между реализациями различных ДС, выделение для обучения предиктора последнего фрагмента сигнала до найденной границы (фрагмент последней сформировавшейся квазистабильной динамики сигнала), построение комбинированного прогноза, оценка его достоверности. Указанная итерация может повторяться многократно для различных масштабов представления сигнала, чтобы получить многошаговый прогноз. Для прогнозирования сложных сигналов предлагаются два метода, которые можно объединить в один на основе комитета.

Прогнозирование на основе метода достижения порога изменения. В основу данного метода положено преобразование исходного сигнала в ряд времени достижения порога изменения p [3]. Преобразование к этому ряду позволяет, с одной стороны, агрегировать сигнал без потери существенной информации о нем, с другой – подойти к задаче прогнозирования с иной точки зрения. В частности, прогнозировать не следующее значение сигнала, а время, через которое изменение сигнала превысит известный порог. Прогнозирование осуществляется двухслойным персептроном. Исходный сигнал преобразовывается следующим образом:

где N – число отсчетов в исходном сигнале; x¢ – преобразованный сигнал, где оставлены только те значения, относительная разница между которыми превышает порог p; N¢ – число отсчетов в преобразованном сигнале; t – ряд времени достижения заданного порога изменения, где каждое значение означает время, которое потребовалось сигналу для того, чтобы превысить порог изменения p.

Такой метод также позволяет выполнять комбинированное прогнозирование, включающее:

-    оценку по x¢следующего значения x¢N¢+1;

-    оценку по t следующего значения tN¢+1;

-    сравнение sign(tN¢+1) и sign(tN¢+1–x¢N¢).

Сопоставление результатов, выполненных по рядам x¢ и t, позволяет увеличить степень надежности прогноза, так как совпадение знаков изменения прогнозируемых величин говорит о высокой степени его достоверности.

Прогнозирование с использованием SVM [4]. Особенностью предложенной реализации является оригинальный метод подбора входных параметров SVM-модели, который базируется на поиске похожих паттернов в исходном временном ряду, что позволяет учитывать текущее состояние исследуемой динамической системы.

Недостатком известных методов обучения SVM является то, что область, используемая для тестирования модели, выбирается случайным образом или в конце временного ряда и не учитывает текущее состояние системы. Для решения этой проблемы предлагается оригинальный способ подбора входных параметров SVM-модели.

Выделим два этапа. Первым этапом является грубая оценка околооптимальных значений подбора входных параметров путем разбиения исходной выборки на n частей и независимое обучение SVM-моделей при различных значениях оптимизируемого параметра, например, параметра C, при этом остальные входные параметры остаются постоянными. Для каждого участка высчитывается нормализованная среднеквадратическая ошибка E. Далее модели с наибольшей ошибкой удаляются из процесса обучения.

Второй этап связан с поиском такой SVM-мо­дели, которая не только отражала бы глобальную динамику процесса, но и учитывала бы локальную. Для этого тестирование модели происходит на участках временного ряда, имеющих схожую с текущим состоянием динамику. В качестве оценки схожести используется оценка косинуса угла между двумя векторами через их скалярное произведение. Чем ближе значение к единице, тем более схожими считаются векторы. Результирующей моделью выбирается та, у которой нормализованная среднеквадратическая ошибка минимальна как на выборке, участвовавшей в обучении, так и на похожих участках с учетом ее сложности.

В качестве проверки эффективности модели предложен критерий EffM. Пусть имеются две альтернативные модели – M1 и M2, тогда , если , где CM – сложность модели, рассчитанная таким образом:  (NSV – количество опорных векторов в SVM-модели; N – общее количество векторов при обучении); E – нормализованная среднеквадратическая ошибка, рассчитанная по следующей формуле:  (d2 – несмещенная дисперсия; n – количество тестовых данных, на которых проверяется модель).

В заключение следует отметить, что достоинством предложенного решения является объединение двух аппаратов прогнозирования – нейронных сетей и метода опорных векторов. Такой подход позволяет обеспечить более качественный прогноз (получить меньшую ошибку) ввиду того, что используются несколько различных предикторов. Программный комплекс, реализующий предложенные методы, может найти применение там, где ведется работа со сложными эволюционными сигналами: в медицине и биологии, контроле технологических процессов, финансово-экономичес­кой деятельности, энергетике.

Литература

1.   Darkhovski B.S. Nonparametric methods in change-point problems a general approach and some concrete algorithms. IMS Lecture Notes – Monograph Series, Volume 23, 1994. URL: http://projecteuclid.org/DPubS/Repository/1.0/Disseminate?view=body&id=pdf_1&handle=euclid.lnms/1215463117 (дата обращения: 22.10.09).

2.   Старченко Н.В. Индекс фрактальности и локальный анализ хаотических временных рядов: дис. ... канд. тех. наук. М., 2005. С. 34–64. URL: http://www.mirkin.ru/_docs/kon_diser/ diserstarchenko.pdf (дата обращения: 26.10.09).

3.   Егошин А.В. Анализ времени достижения сигналом порога изменения в задаче нейросетевого прогнозирования временных рядов // Информационно-вычислительные технологии и их приложения: сб. ст. VI Междунар. науч.-технич. конф. Пенза: РИО ПГСХА, 2007. С. 74–76.

4.   Burges C.J.C. A tutorial on Support Vector Machines for classification // Data Mining and Knowledge Discovery. 1998. № 2, pp. 121–167.


Permanent link:
http://swsys.ru/index.php?id=2628&lang=en&page=article
Print version
Full issue in PDF (6.26Mb)
Download the cover in PDF (1.28Мб)
The article was published in issue no. № 4, 2010

Perhaps, you might be interested in the following articles of similar topics: