Journal influence
Bookmark
Next issue
Abstract:
Аннотация:
Authors: () - , () - | |
Keywords: numerical computation, , , dynamic systems |
|
Page views: 7743 |
Print version Full issue in PDF (4.72Mb) |
Проблема построения управления с обратной связью в нелинейных управляемых системах до сих пор остается актуальной и находится в центре внимания специалистов по управлению. Для решения задач оптимального позиционного управления (ЗОПзУ) нелинейными дифференциальными системами известны различные методики. Специфической чертой подхода Н.Н. Моисеева [1] является возможность декомпозиции ЗОПзУ с аддитивным целевым функционалом на элементарные задачи за счет реализации принципа оптимальности Р. Беллмана на априорных «шкалах состояний» в пространстве «время–состояния». Известный метод «блуждающих трубок» [1], призванный дать оценку области, в которой требуется введение шкал состояний, при данных начальном и/или целевом множествах обеспечивает локальное решение задачи, будучи определенным на некоторых подмножествах трубок достижимости и/или разрешимости (управляемости). Эффективность подхода определяется суммарной трудоемкостью значительного числа элементарных операций по вычислению траектории системы для перехода из каждого узла на дискретном множестве состояний, введенном для одного узлового момента времени, в каждый узел на аналогичном множестве для последующего узла по времени. Иными словами, требуется найти (по возможности глобальное) решение задачи оптимального программного управления (ЗОПрУ) для рассматриваемой динамической системы при терминальных ограничениях. Конструктивными направлениями в развитии подхода Н.Н. Моисеева представляются: 1) предварительная аппроксимация трубки достижимости при заданном начальном множестве или трубки разрешимости при данном целевом множестве; 2) решение ЗОПрУ на основе современных алгоритмических и программных средств. Конструктивное развитие схемы Моисеева предложено в работах [2–4] с приложениями к различным модельным задачам. Формулировка задач оптимального управления Рассматривается управляемая система
где управление программное u=u(t) или позиционное u=u(t, x). Классы доступных программных и позиционных управлений:
Множеством достижимости R(tI, xI, tI) системы (1) из позиции {tI, xI} (tS≤tI Трубкой достижимости, обозначаемой R(tI, xI, (tI, tII]), системы (1) из позиции {tI, xI} на полуотрезке (tI, tII] (tS≤tI. Аналогично определяются множества и трубки достижимости из компакта X(tI), лежащего на гиперплоскости, пересекающей пространство позиций при Целевым множеством M назовем компакт, лежащий на гиперплоскости, пересекающей пространство позиций в момент tF, на который требуется привести систему (1) при всевозможных доступных управлениях. Множеством разрешимости (M-управляемости), обозначаемым Трубкой разрешимости, или трубкой M-управляемости, обозначаемой Поточечные фазовые ограничения
Относительно системы (1) с заданным целевым множеством M, множеством начальных состояний X(ts), имеющим непустое пересечение с W(tS, tF, M), рассматривается ЗОПзУ с целевым критерием Решением ЗОПзУ будем называть функцию Схема численной оптимизации позиционных управлений Для реализации подхода необходимо ввести в рассмотрение понятия аппроксимации целевого множества, трубки разрешимости и аппроксимирующего позиционного управления. Сечение трубки разрешимости – множество разрешимости, является также множеством достижимости системы, получаемой из исходной при ее рассмотрении в обратном времени с целевым множеством как множеством начальных состояний. Множества достижимости нелинейных систем могут быть невыпуклыми и несвязными, и поэтому для учета этих особенностей в работе [2] предложены алгоритмы, реализующие метод сечений для аппроксимации множеств, а для ряда тестовых примеров представлены результаты численных экспериментов, иллюстрирующих эффективность метода сечений. На отрезке [0, tF], рассматриваемом в прямом времени, вводится сетка с шагом Вводится также сетка, узлы tr Аппроксимацией (ограниченного) множества разрешимости W[tj] системы (1), рассматриваемого в момент
Аппроксимацией (ограниченной) трубки разрешимости В основу метода сечений [2] положена следующая идея построения контура множества достижимости системы в момент tj: 1) находятся координаты параллелепипеда, всех граней которого изнутри касается множество достижимости – для этого решается серия ЗОПрУ с целью поиска экстремальных (по возможности в глобальном смысле) значений каждой фазовой переменной; 2) в границах параллелепипеда вводится сетка с разбиением по каждой координате; 3) в результате решения серии ЗОПрУ вычисляются экстремальные (по возможности все локальные) значения некоторой фазовой координаты при фиксированных значениях для всех остальных координат. В контексте схемы оптимизации позиционного управления узлы, представляющие содержание множества W[tj], могут быть введены условно, так как при работе оптимизационного алгоритма в случае несвязности множества достижимости будут удалены такие элементы множества Итак, для эффективной реализации схемы необходимо учитывать возможности несвязности, вырождения в многообразие меньшей размерности для множества достижимости. Для аппроксимации, скажем, трехмерного множества достижимости его двухмерные сечения необязательно строить также методом сечений: можно применить для упрощения расчетов, к примеру, метод опорных гиперплоскостей в предположении выпуклости этих плоских сечений. Разработанная компьютерная программа позволяет строить аппроксимации множеств достижимости. В основе лежат программы для численной оптимизации программных управлений в системах с фазовыми ограничениями. Рассмотрим пример аппроксимации контура невыпуклого множества разрешимости. Рассматривается система, описывающая управление с помощью p(t) плоским маятником в среде с неизвестной вязкостью q(t) (управление второго игрока) на отрезке времени [0, 2]:
На управления наложены ограничения:
Основным отличием методов сечений и опорных гиперплоскостей от методов эллипсоидов и других является вычисление аппроксимации множества достижимости, исходя непосредственно из определения этого множества. Для нахождения семейства оптимальных программных управлений, аппроксимирующих оптимальное позиционное управление на частичном временном отрезке [tj, tj+1] (
относительно системы (1)–(7) при поточечных фазовых ограничениях и краевых условиях На отрезке [tS, tF] проводится вычисление оптимального позиционного управления последовательно, переходя от отрезка [tN-1, tN] к отрезку [t0, t1], на основе принципа оптимальности Беллмана. Для каждой позиции {tj, xj(tj)},
В узлах сетки
Функция цены управляющего параметра Функция Беллмана на множестве W[tj] и ее аппроксимация как объединение всех наименьших значений функции цены по всем элементам множества где На отрезке [tj, tj+1] (
Приведенная схема реализована программно, причем в случае аппроксимации позиционного управления семействами программных управляющих функций требуется привлечение программных средств для оптимизации программных управлений вместо простой схемы выбора значений параметра, изложенной ранее. Случай аппроксимации параметрами более простой и менее трудоемкий, поэтому с точки зрения сравнительной эффективности можно считать его наиболее приемлемым. По результатам работы алгоритмов, реализующих изложенную схему, строится композиционное программное управление, обеспечивающее кусочно-дифференцируемую траекторию, по которой производится перевод системы на целевое множество. Если реализуется случай аппроксимации позиционного управления семействами параметров, то может понадобиться сглаживание получаемой траектории. С этой целью проводится приближение композиционного управления как кусочно-постоянной функции полиномиальной функции достаточно высокой степени. Таким образом, итоговым этапом работы программной системы является применение результатов, насчитанных для всех аппроксимирующих сечений трубки разрешимости, для построения оптимального программного движения из любой позиции, взятой из аппроксимации этой трубки, на целевое множество. Вопросы численной оптимизации программных управлений Как уже отмечено, элементарной операцией в алгоритмах аппроксимации множеств разрешимости и оптимизации позиционного управления является ЗОПрУ, которая может оказаться достаточно трудноразрешимой. Эффективность решения серии ЗОПрУ зависит от уровня надежности (включая уровень автоматизации) программного обеспечения. Авторами проведена реализация (на языке Fortran) ряда методов улучшения программных управлений. На языке Maple разработана программа автоматического вывода конструкций принципа максимума Понтрягина и его линеаризованной версии. Для учета концевых и поточечных фазовых ограничений реализованы методы гладких и недифференцируемых по Фреше штрафных функционалов. Разработанная технология решения ЗОПзУ и аппроксимации множеств разрешимости не используют дифференциальное уравнение Гамильтона–Якоби–Беллмана, опираются непосредственно на определение множеств разрешимости и принцип оптимальности Беллмана, реализуемый на аппроксимации трубки разрешимости. В подходе элементарной операцией является ЗОПрУ, следовательно, эффективность его зависит от эффективности методов и многометодных схем решения ЗОПрУ. Таким образом, аппарат аппроксимации траекторных трубок, а также решения ЗОПрУ и ЗОПзУ является единым с точки зрения достаточно полного исследования возможностей управления в нелинейных дифференциальных системах. Литература 1. Моисеев Н.Н. Численные методы в теории оптимальных систем. М.: Наука, 1971. 2. Моржин О.В., Тятюшкин А.И. Алгоритм метода сечений и программные средства для построения множеств достижимости // Изв. РАН. Теория и системы управления. 2008. № 1. С. 5–11. 3. Тятюшкин А.И., Моржин О.В. Алгоритм численного синтеза оптимального управления // Автоматика и телемеханика. 2008. № 4. 4. Тятюшкин А.И., Моржин О.В. Конструктивные методы оптимизации управлений в нелинейных системах // Там же. 2009. № 4. |
Permanent link: http://swsys.ru/index.php?id=2258&lang=en&page=article |
Print version Full issue in PDF (4.72Mb) |
The article was published in issue no. № 2, 2009 |
Perhaps, you might be interested in the following articles of similar topics: