Факторный анализ в задачах моделирования многомерных систем

№3

13 Сентября 2024

2024

2023

Факторный анализ в задачах моделирования многомерных систем

Пащенко Ф.Ф. (feodor@ipu.ru) - Институт проблем управления им. В.А. Трапезникова РАН, г. Москва, доктор технических наук, Дургарян И.С. (durgoft@ipu.ru) - Институт проблем управления им. В.А. Трапезникова РАН, г. Москва, кандидат технических наук, Голяк И.В. (ivgo@bk.ru) - Институт проблем управления им. В.А. Трапезникова РАН, г. Москва
Ключевые слова: корреляция, модель, факторный анализ, факторы, прогноз, идентификация, динамический объект, многомерный объект
Keywords: correlation, mathematical model, factor analysis, factors, the forecast, identification, a dynamic object, multidimensional object

В процессе создания АСУ нередко некоторые параметры, характеризующие объект и входные процессы, недоступны для наблюдения или не могут быть автоматически измерены из-за отсутствия требуемых датчиков. В таких случаях приходится измерять не искомую величину, а ее косвенные показатели, которые можно контролировать автоматически. Подобные задачи возникают, например, при идентификации иерархических систем, когда взаимосвязи между элементами одного и того же или разных уровней фактически недоступны для наблюдения. Аналогичные ситуации складываются во многих областях промышленности, в экономике, социологии, медицине. Возникает задача построения многоступенчатого алгоритма прогнозирования, что при большой размерности вызывает значительные трудности. Эти трудности и размерность задачи можно существенно уменьшить, используя методы факторного анализа и дисперсионной идентификации.

Пусть X(t) – входной сигнал, Y(t) – выходной сигнал идентифицируемого объекта, V(t) – выходной сигнал объекта с известным оператором B, A – оператор идентифицируемого объекта. Предположим, что оператор B имеет ограниченный обратный оператор B–1, тогда ненаблюдаемый входной сигнал можно представить в виде X(t)= =B–1V(t). Уравнение для оценки оператора идентифицируемого объекта при этом можно записать следующим образом: Y(t)=CV(t), где C=A´B–1.

Пусть операторы A и B являются линейными нестационарными интегральными операторами. Тогда оценку весовой функции идентифицируемого объекта можно найти из системы интегральных уравнений

Решая данную систему известными методами, получим оценки как для весовой функции, так и для сигнала на входе объекта.

При рассмотрении объектов, на входе и выходе которых действуют случайные процессы, решение поставленной задачи можно получить из системы уравнений

где Ky(t, s), Kv(t, s) – известные корреляционные функции сигналов Y(t) и V(t) соответственно; Kx(t, l) – неизвестная корреляционная функция входного сигнала; w(t, t) – известная весовая функция, а g(t, t) – неизвестная.

При идентификации нелинейных объектов, а также линейных объектов, на входе которых действуют случайные процессы с нелинейной внутренней структурой, целесообразно применять дисперсионные методы. При этом оценку весовой функции линейного в среднем приближения идентифицируемого объекта можно получить из системы уравнений

В данной системе уравнений предполагается, что входные и выходные процессы являются стационарными и стационарно связанными в дисперсионном смысле [1].

В факторном анализе основным предположением является равенство

X=LF+E, (1)

где X – вектор-столбец наблюдаемых переменных размерности p´1; L–p´k – матрица факторных нагрузок; F–k´1 – вектор-столбец факторов (k

Уравнение (1) постулирует основные предположения факторного анализа о том, что множество наблюдаемых коррелированных переменных X, которые подчиняются многомерному нормальному распределению с корреляционной матрицей C размерности p´p, можно описать меньшим числом гипотетических переменных или факторов F и множеством независимых остатков E.

Рассмотрим модель объекта с выходом Y и входом X=(X1, …, Xp). Если p велико, возникает желание сократить размерность модели, выразив ее входы через меньшее количество k

для некоррелированных факторов

, (2)

для коррелированных факторов

, (3)

где P – оцененная корреляционная матрица факторов, а матрица L определяется согласно [2].

Модель объекта будем искать по формуле

, (4)

где B – вектор-столбец неизвестных коэффициентов размерности k´1. Коэффициенты вектора определим из условия минимума функционала

. (5)

Подставляя (4) в (5) и дифференцируя полученное выражение по В, придем к уравнению

. (6)

Решая (6) с учетом (2), получим

, (7)

где Q=LTC–1 – матрица размерности k´p, а матрицы Kxx и Kxy определяются соответственно формулами . (8)

Для коррелированных факторов получим

. (9)

Следует отметить, что (7) и (9) получены при условии линейной связи между факторами и входными переменными. Если эта связь нелинейна, то в (7) и (9) вместо (8) будут входить матрицы, элементы которых – дисперсионные функции.

Рассмотрим представление ненаблюдаемых входов при помощи модели пространства состояний [3]. Предположим, что некоторый дискретный векторный процесс Y(t) описывается разностным линейным уравнением, которое представимо в форме

Yi=AYi–1+ГUi–1, i=0, 1, …, (10)

где Yi–n´1 – вектор-столбец состояния системы в момент ti; Ui–1 – векторный гауссовский белый шум; A и Г – постоянные матрицы. Предполагается, что Yi – стационарный гауссовский процесс с заданным начальным состоянием Y0.

Пусть процесс Y(t) является входом определенного динамического объекта, для которого требуется построить модель в виде

, (11)

где – выход модели в момент ti; P – вектор искомых коэффициентов модели.

Предположим, что в те же дискретные моменты ti вместо вектора Yi измеряется вектор Zi размерности r´1 (r£n), линейно связанный с вектором состояния Yi:

, (12)

где H – постоянная матрица размерности r´n; Vi – векторный гауссовский белый шум. Вместо вектора Yi в (11) подставим его оценку, оптимальную в смысле некоторого критерия, полученную по наблюдаемому вектору Zi. Наилучшая среднеквадратическая оценка Yi=M{Yi/z1, …, zi} может быть получена при помощи дискретного фильтра Калмана:

, (13)

где неизвестная матрица Bi определяется из условия минимума среднеквадратической ошибки [1].

Применяя рекуррентную процедуру оценивания, выразим через оценку начального состояния и значения наблюдаемых векторов Z1, …, Zi:

(14)

где I – единичная матрица размерности n´n, а матрицы B1, …, Bi определяются согласно [1].

Без ограничения общности предположим, что математические ожидания векторов Yi и Zi равны нулю для любого момента i;. Тогда справедливы равенства и для любого i.

Подставляя в (11) вместо вектора Yi его оценку и применяя аналогично предыдущему случаю среднеквадратический критерий для оценки вектора коэффициентов P, получим

, (15)

где Zi – набор векторов (Zi, Zi–1, …, Z1); элементами матрицы являются множественные дисперсионные функции, а элементами матрицы – множественные обобщенные дисперсионные функции.

Учитывая (14), формулу (15) можно выразить через корреляционные матрицы процессов Zi и Wi и процессов Zi и Zj, j=1, …, i.

Поскольку применение рекуррентной процедуры и определение матриц B1, …, Bi в (14) являются достаточно трудоемкими, используем в (11) другую оценку ненаблюдаемого вектора Yi по наблюдаемым векторам Z1, …, Zi.

Проведем следующее преобразование переменных:

, (16)

. (17)

Здесь Zi означает набор векторов (Z1, …, Zi).

Полученные переменные Xi и Fi связаны соотношением Xi=HFi+Vi, которое по форме аналогично соотношению (11) и в то же время полностью укладывается в рамки модели классического факторного анализа.

Используя формулу связи между наблюдаемыми переменными и факторными нагрузками (2), можно получить следующую оценку :

. (18)

Применяя теорию псевдообратных матриц, учитывая (11) и то обстоятельство, что в качестве критерия минимизации применяется квадратичный функционал, (18) можно записать в виде

(19)

где H+ – псевдообратная матрица; y – произвольный вектор; I – единичная матрица.

В частном случае при y=0 формула (19) принимает вид

(20)

Таким образом, модель (15) может быть записана в виде

(21)

Матрица коэффициентов P, найденная из условия минимума среднеквадратичного отклонения от W, имеет вид

(22)

Положим, как и выше, математические ожидания Zi и Wi равными нулю. Тогда будет являться автокорреляционной матрицей векторного процесса Zi; – взаимной корреляционной матрицей векторных процессов Zi и Wi; состоит из множества дисперсионных функций векторного процесса Zi относительно Zi–1; – из множественных обобщенных дисперсионных функций векторных процессов Zi и Wi относительно Zi–1; – из множественных дисперсионных функций векторных процессов Zi и Zi–1.

Из вышесказанного следует, что, используя методы факторного анализа и рекуррентного фильтра Калмана, можно существенно сократить размерность прогнозирующих моделей без ощутимой потери точности.

Литература

1. Дисперсионная идентификация; [под ред. Н.С. Райбмана]. М.: Наука, 1981.

2. Дубров А.М., Мхитарян В.С., Трошин Л.И. Многомерные статистические методы. М.: Финансы и статистика, 2000.

3. Казаков И.Е. Статистическая теория систем управления в пространстве состояний. М.: Наука, 1975.

4. Дургарян И.С., Пащенко Ф.Ф. Метод двухступенчатой идентификации в задаче оценки экономической эффективности АСУ // Автоматика и телемеханика. 1977. № 5.

5. Функциональный анализ; [под ред. С.Г. Крейна]. М.: Наука, 1972.

http://swsys.ru/index.php?id=2714&lang=%E2%8C%A9%3Den&like=1&page=article

Perhaps, you might be interested in the following articles of similar topics:

Comments