Одной из ключевых задач современной робототехники является развитие технологий когнитивного взаимодействия робототехнических систем, позволяющих решать задачи интеллектуального иерархического управления за счет перераспределения знаний и функций управления, например, традиционно между лидером и подчиненным (master–slave system). Современные подходы к решению данной задачи основаны на теории многоагентных систем, теории роевого искусственного интеллекта и многих других [1–8].
В многоагентной системе существует, соглас- но [9–14], новый синергетический информационный эффект самоорганизации БЗ и формирования дополнительного информационного ресурса, возникающий при обмене информацией и знаниями между активными агентами (swarm synergetic information effect) [9, 10]. Извлечение дополнительного ресурса в виде скрытой в классических состояниях квантовой информации осуществляется на основе квантового нечеткого вывода, который, в свою очередь, является новым квантовым поисковым алгоритмом и частным случаем квантового алгоритма самоорганизации.
За счет синергетического эффекта создается до- полнительный информационный ресурс, и много- агентная система способна решать сложные ди- намические задачи по выполнению совместной работы. Поставленная задача может не выполняться каждым элементом (агентом) системы в отдельности в разнообразных средах без внешнего управления, контроля или координации, но обмен знаниями и информацией позволяет совершать совместную полезную работу для достижения поставленной цели управления в условиях неопределенности исходной информации и ограничений на расход полезного ресурса [10]. В частности, известно, что для систем управления с обратной связью количество извлекаемой полезной работы W удовлетворяет неравенству где k – постоянная Больцмана; Tmin(t) интерпретируется как наименьшая достижимая системой температура во времени t при управлении с обратной связью в предположении, что Tmin(0) = T, и Ic определяет количество информации Шеннона (перенос энтропии), извлекаемое системой из процесса измерения [13, 14].
Физически синергетический эффект – это самоорганизация знаний и создание дополнительной информации, позволяющей многоагентной системе совершать максимально полезную работу при минимуме потерь полезного ресурса и требуемой исходной информации, без разрушения нижнего исполнительного уровня системы управле- ния [11, 12, 14]. Совместно с информационно-термодинамическим законом интеллектуального управления (оптимальное распределение качеств «устойчивость–управляемость–робастность») проектируется интеллектуальная система управления (ИСУ) многоагентными системами, гарантирующая достижение цели управления в условиях неопределенности исходной информации и ограниченного полезного ресурса [10–12, 14].
Речь идет о сети слабо связанных между собой роботов, совместно решающих задачи, которые выходят за рамки индивидуальных возможностей. Различные узлы подобной системы, как правило, имеют различный уровень интеллектуализации (знания, алгоритмы, вычислительные базисы) и разные информационные ресурсы при проектировании. Каждый узел должен быть способен модифицировать свое поведение в зависимости от обстоятельств, а также планировать свои стратегии коммуникации и кооперации с другими узлами. Здесь показателями уровня кооперации являются характер распределения задач, объединение различных информационных ресурсов и, конечно, возможность решения общей проблемы в заданное время [4, 5].
Актуальность проблемы и постановка задачи
В условиях неопределенности или неточности исходной информации, непредвиденных ситуаций или информационного риска традиционный (использующий принцип глобальной отрицательной обратной связи) и широко применяемый в промышленности ПИД-регулятор часто не справляется с поставленной задачей управления. В то же время решение задачи о глобальной робастности ПИД-регулятора до настоящего времени неизвестно, несмотря на актуальность данной проблемы.
Использование нечетких регуляторов (НР) совместно с ПИД-регулятором привело к созданию гибридных нечетких ИСУ с различными уровнями интеллектуальности в зависимости от полноты и корректности спроектированной БЗ. Использование технологии мягких вычислений (основанной на генетических алгоритмах (ГА) и нечетких нейронных сетях (ННС)) расширило области эффективного применения НР за счет добавления новых функций в виде обучения и адаптации.
Разработанный интеллектуальный инструментарий Оптимизатор баз знаний (ОБЗ) SCOptKBTM позволил проектировать робастные БЗ на основе решения одной из алгоритмически трудно решаемых задач теории искусственного интеллекта – извлечение, обработка и формирование объективных знаний без использования экспертных оценок [12]. В данном ОБЗ применяются три ГА, которые позволяют спроектировать оптимальную структуру НР (вид и число ФП, их параметры, а также число самих правил нечеткого вывода), аппроксимирующего обучающий сигнал с требуемой ошибкой. При этом автоматически проектируется оптимальная структура ННС и формируется модель универсального аппроксиматора в виде НР с конечным числом продукционных правил в БЗ.
Технологии дистанционной настройки и передачи БЗ позволяют объекту управления (ОУ) принимать БЗ от блока ОБЗ или от других ОУ, что дает возможность управлять структурно новыми объектами, такими как коллективы роботов, многоагентные системы, сложные автоматизированные производства и др. Кроме того, данная технология дает возможность ОУ обновлять и адаптировать БЗ под конкретную ситуацию управления, в том числе нештатную.
Интенсификация производственного процесса, рост сложности и количества различных техни- ческих изделий, повышение вычислительной мощности процессоров свидетельствуют о необходимости развития технологий проектирования и внедрения интеллектуальных систем в контур управления. В свою очередь, необходимо наличие интеллектуального инструментария для настройки подобных систем в различных предметных областях. Повышение вычислительного базиса (типов вычислений) программного продукта приводит к повышению качества и надежности управления, добавляя свойства адаптации и обучения в контур обратной связи. Однако повышение надежности системы управления ведет к увеличению настраиваемых параметров и, как следствие, к повышению сложности настройки подобных систем.
Разработанный инструментарий реализует механизмы создания, настройки и передачи пара- метров управления в виде сигналов управления, полученных из БЗ НР, не разрушая нижний исполнительный уровень. Использование мягких вычислений и разработанных технологий проектирования ИСУ сокращает влияние экспертных оценок в процессе обучения и настройки ИСУ.
Для демонстрации взаимодействия робототехнических систем были спроектированы макеты роботов. Системы управления роботов функционируют на основе нейросетевых НР, разработанных на основе технологии, представленной в [9, 10].
Структура и основные функции ОБЗ
Применительно к проектированию ИСУ мягкие вычисления представляют собой комбинацию из следующих подходов: теория нечетких систем, ГА и ННС. НР является центральным элементом ИСУ и вырабатывает управляющие сигналы изменения во времени (законы управления) коэффициентами усиления kp, kd, ki (coefficient gain schedule) ПИД-регулятора.
Функциональная структура ИСУ с блоками НР и ОБЗ на мягких вычислениях представлена на рисунке 1. Такая структура включает одновременно следующие качества управления: управляемость, точность и устойчивость (нижний уровень управления – САУ), обучение и адаптация (верхний интеллектуальный уровень управления – НР с БЗ).
Входом ОБЗ является обучающий сигнал, который может быть получен либо на этапе стохастического моделирования поведения ОУ (с использованием его математической модели), либо экспериментально, то есть непосредственно из результатов измерений динамических параметров физической модели ОУ.
ОС является источником знаний и представляет собой массив данных, разделенный на входные и выходные составляющие, каждая из которых, в свою очередь, состоит из одного и более сигналов. В случае аппроксимации некоторого управляющего сигнала входными компонентами могут являться ошибка управления, интеграл ошибки и ее производная, а выходным компонентом – требуемое значение управляющего воздействия либо некоторые настраиваемые параметры системы управления, например, коэффициенты усиления ПИД-регулятора. Результатом аппроксимации обучающего сигнала является построенная БЗ для НР, включающая оптимальное конечное множество правил и оптимально сформированные параметры функции принадлежности входных и выходных переменных НР.
Таким образом, результатом проектирования является требуемый тип универсального аппрокси- матора в виде НР с оптимальной структурой БЗ.
Дистанционное соединение с ОБЗ и передача БЗ
Дистанционная настройка позволяет проектировать ИСУ, получая данные непосредственно с ОУ без использования системы стохастического моделирования, что дает преимущество при проектировании нечетких систем управления для сложных и слабо формализованных ОУ в непредвиденных ситуациях управления.
Рассмотрим модуль удаленного соединения ОБЗ и реального ОУ для настройки БЗ. Для передачи данных используется USB-соединение или радиоканал Bluetooth. Происходит обмен информацией между системой управления и ОБЗ для формирования БЗ (рис. 2).
Система управления считывает показания датчиков и отправляет их на компьютер для последующей обработки. Приняв входные значения, ОБЗ оценивает в функции ГА предыдущее решение (БЗ НР) и осуществляет нечеткий вывод для проверки следующего решения (БЗ НР). Результат нечеткого вывода отправляется на удаленное устройство. После этого система управления, обработав входные значения, вырабатывает управляющее воздействие. Таким образом, реализуется настройка БЗ НР в online. Профиль соединения использует последовательный порт. Скорость передачи в нашем случае составляет 115 200 бит/с. В процессе функционирования по COM-порту передаются числа в символьном виде. Подключение к ОБЗ осуществляется через разработанный плагин.
Удаленная передача БЗ является следующим шагом развития беспроводного соединения ОУ с ОБЗ. В данном случае от ОБЗ передаются не управляющие воздействия, а БЗ, то есть происходит обмен информацией и знаниями более высокого уровня. Реализация среды соединения предполагает использовать стандарт IEEE 802.11 (Wi-Fi) и протокол TCP/IP для приема-передачи данных. Осуществляется обмен информацией между системой управления и ОБЗ для формирования и передачи БЗ (рис. 3).
Структурно БЗ с точки зрения программной инженерии реализована структурным типом данных, и ее размер зависит от количества входных и выходных переменных, количества функций принадлежности лингвистических переменных и числа продукционных правил. При скорости 1 Мбит/с передача БЗ размером 10 Кбайт с учетом внутренних задержек составляет не больше 100 мс, что позво- ляет качественно перестраивать ИСУ под задан- ную задачу в режиме online.
Проведем сравнение ПИД-регулятора (PID) с НР (FC1), оптимизированного с помощью дистанционной настройки. На рисунке 4а представлен угол отклонения сравниваемых регуляторов, а на рисунке 4б – интегральная оценка угла отклонения в типовой ситуации. На рисунке 5а представлен уровень отъезда левого (left) и правого (right) колес от точки запуска, а на рисунке 5б – интегральная оценка отъезда.
Как показывают рисунки 4 и 5, уровень ошибки НР ниже ПИД-регулятора и для угла отклонения, и для отъезда от точки запуска.
Моделирование и эксперимент взаимодействия группы роботов
В качестве ОУ выступают макеты манипулятора, перевернутого маятника и мобильного манипулятора. Мобильный и стационарный манипуляторы оснащены системой распознавания образов на основе библиотеки компьютерного зрения OpenCV и аппаратной части в виде web-камеры, приставки Kinnect и инфракрасного сенсора. Рассматриваются децентрализованные и иерархические варианты взаимодействия группы роботов. Демонстрируется эксперимент в связке ведущий–ведомый (master–slave), проводимый на основе системы распознавания мобильного манипулятора.
В качестве демонстрационных роботов используются перевернутый маятник, тележка с манипулятором и стационарный робот-манипулятор.
Перевернутый маятник представляет собой динамически неустойчивый мобильный объект. Разработанная ИСУ позволяет роботу свободно перемещаться по различным видам поверхностей, таким как паркет, асфальт, линолеум, стол, а также дополнительно ставить на него объекты различной тяжести, например бокал, телефон и т.п. На рисунке 6а представлена трехмерная модель перевернутого маятника.
Тележка с манипулятором представляет собой мобильную платформу с установленным на нее манипулятором с тремя степенями свободы. Для ориентации в пространстве на робот установлены две камеры: цветная Kinect и инфракрасная Wiimote. Для распознавания объектов взаимодействия робот использует систему распознавания образов, работающую в среде OpenCV. Система может свободно перемещаться в пространстве, распознавать различные объекты и использовать манипулятор для взаимодействия с ними. Модель тележки представлена на рисунке 6б.
Стационарный робот-манипулятор представляет собой манипулятор с четырьмя степенями свободы. Робот оснащен камерой, охватывающей обзором поле рядом с манипулятором и системой распознавания контуров. Вместо захвата к манипулятору подведена трубка с жидкостью, которая хранится в бачке. Робот способен распознавать контуры емкостей, размещенных в рабочей области, и наполнять их какой-либо жидкостью. На рисунке 6в представлена трехмерная модель стационарного манипулятора.
Рассмотрим реализованные типы взаимодействия в группе роботов. В первом демонстрационном примере на робот типа перевернутый маятник [15–17] устанавливается бокал, который является объектом распознавания для стационарного манипулятора. Перевернутый маятник определяет свое положение относительно робота-манипулятора с помощью инфракрасной камеры и «маячков», при соответствующей команде меняет свое местоположение и перемещается к манипулятору в требуемую точку пространства.
Когда перевернутый маятник оказывается в зоне видимости стационарного манипулятора, система распознавания определяет местоположение бокала и отправляет манипулятору команду наполнить его жидкостью (рис. 7).
Такое взаимодействие является типовым, и его применение возможно в целом спектре задач. Кроме очевидных возможностей автоматизации кафе и баров, возможна автоматизация множества производственных задач, таких как погрузка-разгрузка контейнеров, сортировка и т.п.
В качестве второго примера взаимодействия рассматривается задача, в которой сверху на перевернутый маятник устанавливается бокал. Тележка с манипулятором оснащена инфракрасной камерой, определяющей относительное положение перевернутого маятника, и начинает движение в сторону распознанного объекта. Также команда на сближение отправляется перевернутому маятнику. После сближения мобильный манипулятор с использованием системы распознавания и камеры Kinect определяет местоположение бокала. Ма- нипулятор, оснащенной ИСУ, рассчитывает команду двигателям в звеньях и перемещает захват манипулятора к бокалу. Сначала тележка находит в зоне видимости перевернутый маятник и определяет его положение. Если маятник повернут, ему отправляется команда на разворот. Если маятник стоит ровно, начинается взаимное движение навстречу. Когда дистанция становится оптимальной для захвата бокала, в работу включается камера Kinect и происходит распознавание бокала, установленного на маятник. После распознавания бокала отправляются координаты и команда манипулятору на захват бокала (рис. 8).
Такое взаимодействие реализует иерархическое управление в связке ведущий и ведомый. Так, перевернутый маятник выступает в роли ведомого и выполняет команды от мобильного манипулятора, который обладает дополнительным сенсором для определения положения маятника.
Выводы
Результаты проведенных исследований пока- зали следующее:
- удаленная оптимизация БЗ вместе с ГА-ПИД-регулятором позволяют строить ИСУ без использования математического моделирования в режиме online;
- ОБЗ обеспечивает повышение надежности ИСУ в режиме online;
- дистанционное соединение позволяет оптимизировать БЗ в определенных (типовых) условиях функционирования, тем самым создавая множество БЗ с высоким качеством управления для различных ситуаций управления;
- инструментарий позволяет настраивать сложные системы управления с большим количеством контуров управления; количество входных переменных и размер получаемой БЗ ограничиваются лишь аппаратными характеристиками компьютера и ОУ.
Разработанные варианты взаимодействия показывают возможности применения данных систем в широком спектре задач, таких как автоматизация складов и производств, автоматические заведения общественного питания, ликвидация последствий чрезвычайных происшествий и т.п. Главной особенностью многоагентной системы является синергетический эффект, возникающий от объединения нескольких робототехнических систем, когда результат функционального взаимодействия намного превышает возможности каждого из роботов в отдельности.
Литература
1. Тарасов В.Б. От многоагентных систем к интеллектуальным организациям: философия, психология, информатика. М.: Эдиториал УРСС, 2002. 352 с.
2. Зайцев А.А., Курейчик В.В., Полупанов А.А. Обзор эволюционных методов оптимизации на основе роевого интеллекта // Изв. ЮФУ: Технические науки. 2010. № 12. С. 7–12.
3. Cazenille L., Bredeche N., Halloy J. Automated optimization of multi-level modes of collective behavior in a mixed society of animals and robots. URL: https://arxiv.org/pdf/1602.05830v1.pdf (дата обращения: 2.02.2017).
4. Dudek G., Jenkin M., Milios E., Wilkes D. A taxonomy for multi-agent robotics. Autonomous Robots, 1996, vol. 3, iss. 4, pp. 375–397.
5. Ota J. Multi-agent robot systems as distributed autonomous systems. Advanced Engineering Informatics, 2006, vol. 20, iss. 1, pp. 59–70.
6. Kawamura K., Gordon S. From Intelligent Control to Cognitive Control. Proc. World Automation Congress (WAC '06), 2006, pp. 1–8.
7. Kawamura K., Peters R.A., Bodenheimer R., et all. Multiagent-based cognitive robot architecture and its realization. Intern. Jour. of Humanoid Robotics, 2004, vol. 1, no. 1, pp. 65–93.
8. Lenk J.C., Droste R., Sobiech C., Ludtke A., Hahn A. Towards cooperative cognitive models in multi-agent systems. Proc. Intern. Conf. on Advanced Cognitive Technologies and Applications, 2012, pp. 67–70.
9. Ulyanov S.V., et all. Quantum swarm model of self-organization process on quantum fuzzy inference and robust wise control design. Proc. 7th Intern. Conf. Appl. of Fuzzy Systems and Soft Computing (ICAFS’2006), Siegen, Germany, 2006, pp. 10–19.
10. Ulyanov S.V. Self-organizing quantum robust control methods and systems for situations with uncertainty and risk. Patent US 8788450 B2, 2014.
11. Ульянов С.В., Решетников Г.П., Решетников А.Г. Технологии интеллектуальных вычислений. Квантовые вычисления и программирование в самоорганизующихся интеллектуальных системах управления. Дубна: Изд-во ОИЯИ, 2015.
12. Ульянов С.В., Николаева А.В., Решетников А.Г. Интеллектуальные системы управления в непредвиденных ситуациях. Оптимизатор баз знаний на мягких вычислениях. LAP LAMBERT Acad. Publ., OmniScriptum GmbH & Co. KG, 2013.
13. Sandberg H., et all. Maximum work extraction and implementation costs for nonequilibrium Maxwell’s demon. Physical Review E, 2014, no. 4, pp. 042–119.
14. Ульянов С.В. Квантовая релятивистская информатика. LAP LAMBERT Acad. Publ., OmniScriptum GmbH & Co. KG, 2015.
15. Nawawi S.W., Ahmad M.N., and Osman J.H.S. Real-time control system for a two-wheeled inverted pendulum mobile – robot. Advanced Knowledge Application in Practice, InTech, 2010, pp. 299–312.
16. Gocmen A. Design of two wheeled electric vehicle. Master Sci. Thesis. Atilim Univ., Temmuz, 2011.
17. Castro A. Modeling and dynamic analysis of a two-wheeled inverted pendulum. Master Sc. Thesis, Georgia Institute of Technology, Atlanta, USA, 2012.
References
- Tarasov V.B. Ot mnogoagentnykh sistem k intellektualnym organizatsiyam: filosofiya, psikhologiya, informatika [From Multi-Agent Systems to Intellectual Organizations: Philosophy, Psychology, Informatics]. Moscow, Editorial URSS Publ., 2002, 352 p.
- Zaytsev A.A., Kureychik V.V., Polupanov A.A. Evolution methods of optimization research based on swarm intelligence. Izvestiya YuFU. Tekhnicheskie nauki [Izvestiya SFedU. Engineering Sciences]. 2010, no. 12, pp. 7–12 (in Russ.).
- Cazenille L., Bredeche N., Halloy J. Automated optimization of multi-level modes of collective behavior in a mixed society of animals and robots. Available at: https://arxiv.org/pdf/1602.05830v1.pdf (accessed February 2, 2017).
- Dudek G., Jenkin M., Milios E., Wilkes D. A taxonomy for multi-agent robotics. Autonomous Robots. 1996, vol. 3,
iss. 4, pp. 375–397.
- Ota J. Multi-agent robot systems as distributed autonomous systems. Advanced Engineering Informatics. 2006,
vol. 20, iss. 1, pp. 59–70.
- Kawamura K., Gordon S. From intelligent control to cognitive control. Proc. World Automation Congr. WAC '06. 2006, pp. 1–8.
- Kawamura K., Peters R.A., Bodenheimer R., Sarkar N., Spratley A., Hambuchen K.A. Multiagent-based cognitive robot architecture and its realization. Int. Jour. of Humanoid Robotics. 2004, iss. 1 (1), pp. 65–93.
- Lenk J.C., Droste R., Sobiech C., Ludtke A., Hahn A. Towards cooperative cognitive models in multi-agent systems. Proc. Int. Conf. on advanced cognitive technologies and applications. 2012, pp. 67–70.
- Ulyanov S.V., Litvintseva L.V., Ulyanov S.S. Quantum swarm model of self-organization process on quantum fuzzy inference and robust wise control design. Proc. 7th Int. Conf. on Appl. of Fuzzy Systems and Soft Computing (ICAFS’2006). Siegen, Germany, 2006, pp. 10–19.
- Ulyanov S.V. Self-Organizing Quantum Robust Control Methods and Systems for Situations with Uncertainty and Risk. Patent US 8788450 B2, 2014.
- Ulyanov S.V., Reshetnikov G.P., Reshetnikov A.G. Tekhnologii intellektualnykh vychisleny. Kvantovye vychisleniya i programmirovanie v samoorganizuyushchikhsya intellektualnykh sistemakh upravleniya [Quantum Computing and Programming in Self-Organizing Intelligent Control Systems]. Dubna, JINR, 2015.
- Ulyanov S.V., Nikolaeva A.V., Reshetnikov A.G. Intellektualnye sistemy upravleniya v nepredvidennykh situatsiyakh [Intelligent Control Systems in Unforeseen Situations]. LAP Lambert Academic Publ., OmniScriptum GmbH & Co. KG, 2013.
- Sandberg H., Delvenne J.C., Newton N.J., Mitter S.K. Maximum work extraction and implementation costs for nonequilibrium Maxwell’s demon. Physical Review E. 2014, vol. 90, no. 4, pp. 042–119.
- Ulyanov S.V. Kvantovaya relyativistskaya informatika [Quantum relativistic informatics]. LAP LAMBERT Academic Publ., OmniScriptum GmbH & Co. KG, 2015.
- Nawawi S.W., Ahmad M.N., Osman J.H.S. Real-time control system for a two-wheeled inverted pendulum mobile – robot. Advanced Knowledge Application in Practice. InTech Publ., 2010, pp. 299–312.
- Gocmen A. Design of two-wheeled electric vehicle. Master Sci. Thesis. Atilim Univ., 2011.
- Castro A. Modeling and dynamic analysis of a two-wheeled inverted pendulum. Master Sci. Thesis, Georgia Institute of Technology, Atlanta, USA, 2012.