Разработка систем управления различными объектами сводится к построению программных комплексов, имитирующих их работу. Например, во многих тренажерах присутствуют объекты окружающей обстановки, управление которыми может сводиться к заданию направления и скорости движения, команд включения и выключения различных устройств и т.д. При этом существуют возможности манипулирования этими объектами человеком при помощи специализированных программных интерфейсов и задания вручную па- раметров, а также использования моделей, опи- сывающих алгоритм поведения. Как правило, данные модели пользуются алгоритмами с жестко заданными свойствами поведения объектов, основанными на временных или иных факторах. Структуру такой системы в общем случае можно представить в виде набора средств отображения (экранных форм), комплекса моделей для каждого типа объектов, вычислительного звена, управляющего временной и событийной синхронизацией (рис. 1).
К недостаткам такого подхода можно отнести необходимость присутствия в ряде случаев реального человека для решения задач контроля над объектами, а также выдачи команд по их управлению (в тех случаях, когда эти действия не зависят напрямую и не управляются моделями поведения).
Существующие в настоящее время методы теории принятия решений позволяют имитировать действия и команды человека для управления и моделирования действий объектов. К таким методам можно отнести искусственные нейронные сети, генетические алгоритмы и ряд других [1].
Искусственные нейронные сети – это математические модели, а также их программные или аппаратные реализации, построенные по принципу организации и функционирования биологических нейронных сетей, то есть сетей нервных клеток живого организма. Одно из главных преимуществ нейронных сетей перед традиционными алгоритмами – возможность их обучения [2]. Таким образом, задача разработки механизмов контроля и управления объектами в описанной выше системе сводится к введению модулей на основе нейронной сети и созданию такой конфигурации при подключении входа сети к моделям объектов обстановки, которая позволила бы имитировать их действия в дальнейшем. На рисунке 2 представлена схема управления с введением модуля нейронной сети, где в качестве примера управление объектом № 3 передано обученной сети.
В данной схеме принятие решений по управлению объектом № 3 полностью полагается на выход модели нейронной сети, которая имитирует работу реального объекта в той или иной ситуации. При этом ставятся задачи подбора конфигурации сети, алгоритма ее обучения и настройки, ранжирования входных данных, задания настроек и классификации объекта. В процессе выбора методик применения нейронных сетей в данной задаче возможно рассмотрение различных разработок, в частности, сетей Хопфилда, Хэмминга, однослойных и многослойных персептронов с прямым и двунаправленным распростране- нием [2–3].
Наиболее общий подход предусматривает несколько следующих этапов.
I этап – постановка задачи; определяются цели и информационное пространство исследования, вырабатывается алгоритм его проведения.
II этап – сбор данных для обучения; осуществляется набор репрезентативного материала – примеров для обучения сети, каждый из которых представляет массив входных данных и в случае использования обучения с учителем соответствующий ему известный ответ.
III этап – создание и обучение нейронной сети с использованием программы-эмулятора; данный этап включает отбор наиболее информативной подсистемы признаков, определение архитектуры искусственной нейронной сети, обучение окончательной нейросетевой модели оптимизированной архитектуры, оценку направления и степени влияния признаков, составляющих входной вектор на моделируемый параметр.
IV этап – создание интерфейса; разрабатываются средства взаимодействия с пользователем для облегчения настройки, интерпретации результата и вывода ответа сети.
V этап – процесс доучивания в условиях реальной работы и накопления данных, которые используются для дальнейшей работы уже имеющейся нейронной сети с целью ее приложения к анализу и моделированию конкретных объектов.
Формализация проблемы управления объектами обстановки. В тренажерах к объектам тактической обстановки относятся подвижные и неподвижные объекты, функционирование которых влияет на деятельность обучаемых или зависит от них, а именно, надводные корабли, подводные лодки, суда, летательные аппараты, стационарные и позиционные средства наблюдения и освещения обстановки. Все эти объекты обладают множеством управляемых параметров, значения которых определяют их взаимовлияние с деятельностью обучаемых.
По способу управления тактические объекты условно делятся на активные – управляемые обучаемыми, и пассивные – все остальные тактические объекты, управляемые руководителем обучения или автоматически по заранее заданной программе (детерминированное управление), а также в соответствии со складывающейся обстановкой (адаптивное, или игровое управление). В процессе учебного мероприятия способ управления объектом может изменяться. Идентичность описания детерминированного и адаптивного управления упрощает смену способов управления объектом.
Любые алгоритмы управления объектами можно представить в виде последовательности логических операторов вида if (ИС)ВУ, где ИС – инициирующее событие, ВУ – вектор управления.
Под вектором управления будем понимать совокупность управляющих воздействий на объект. Применительно к управлению маневрированием объектов ВУ={Knew, b, Vnew, Hnew, y}, где Knew – новый (заданный) курс объекта; b – угол перекладки вертикального руля на циркуляции; Vnew – новая (заданная) скорость объекта; Hnew – новая (заданная) глубина объекта; y – заданный дифферент при изменении глубины.
Применительно к управлению применением оружия, вооружения и технических средств объекта ВУ будет иметь более сложный вид, определяемый перечнем и управляемыми параметрами оружия (вооружения) конкретного объекта.
Под ИС будем понимать событие, заключающееся в выполнении какого-либо условия и инициирующее новые управляющие воздействия на объект. При детерминированном управлении ИС заключается в наступлении момента t, соответствующего времени T0 начала нового галса объекта: ИС=(t³T0).
При адаптивном управлении ИС заключается в получении объектом новой информации об обстановке. Назовем доступную объекту информацию вектором наблюдаемой обстановки (VHO). Тогда ИС заключается в совпадении текущего значения с некоторым заданным его значением : .
Элементы VHO связаны между собой конъюнктивно, то есть ИС считается наступившим при совпадении всех элементов векторов и . При наличии дизъюнктивных связей (одинако- вые ВУ вырабатываются при совпадении хотя бы одного из элементов векторов) ИС считаются различными, а их количество соответствует ко- личеству дизъюнктивно связанных элемен- тов VHO.
Поскольку в данной модели принято, что ИС жестко связано с ВУ, в дальнейших рассуждениях используем термин инициированное управляющее воздействие (ИУ), под которым будем понимать совокупность ИС и соответствующего ему ВУ. Для данной модели управляемый объект всегда находится в состоянии ожидания одного или нескольких ИУ. При этом состояние (совокупность значений параметров) объекта может быть установившимся или переходным (до завершения переходных процессов, вызванных управляющим воздействием). Новое ИУ может наступить и до окончания переходного состояния, вызванного предыдущим ИУ. Одновременно может ожидаться наступление нескольких ИУ. Совокупность ИУ, одновременно ожидаемых объектом, будем называть группой ИУ. В общем случае совокупность группы ИУ определяется стратегией поведения (миссией) объекта в конкретном эпизоде учебного мероприятия.
ИУ, которые выполняются последовательно одно за другим, назовем последовательностями ИУ. В ряде ситуаций требуется выполнение заранее определенной последовательности ИУ. Соответствующие устойчивые (жесткие) последовательности ИУ будем называть директивными последовательностями. Сформированные последовательности ИУ, которые могут повторяться для разных объектов и на различных этапах моделирования, назовем типовыми.
Набор структур указанных типов ИУ и последовательностей ИУ для управления объектами обстановки определит входные и выходные параметры интеллектуального модуля взаимодействия вычислительного комплекса и набора моделей отображения объектов тактической обстановки.
Методика разработки и использования. Математической основой построения модуля может являться, например, многослойный персептрон. Входные данные (состояние моделируемого объекта и окружающей обстановки) поступают на слой нейросети, который передает преобразованные сигналы на ряд других (скрытых) слоев. Скрытый слой состоит из некоторого числа нейронов. Работа персептрона сводится к класси- фикации входных сигналов, принадлежащих n-мерному гиперпространству, по некоторому числу классов. С математической точки зрения это происходит путем разбиения гиперпространства гиперплоскостями. Каждая полученная область является областью определения отдельного признака действия и принятия решения по управлению объектом.
Упрощенно можно выделить несколько режимов работы такого модуля в составе системы:
- режим обучения – модуль находится в процессе сбора данных о состоянии всех объектов во время функционирования системы и управления реальными операторами;
- режим пассивного наблюдения – модуль находится в состоянии наблюдения за текущей ситуацией, выдает прогнозные и потенциально возможные команды управления на уровне подсказок для операторов системы;
- режим активного наблюдения – модуль находится в режиме пассивного наблюдения, а также параллельно накапливает информацию для дальнейшего обучения и совершенствования;
- режим управления объектами – модуль находится в режиме принятия входных данных и выдачи управляющих команд для соответствующих объектов тренировки.
Практическая ценность использования интеллектуальных схем управления. Результаты внедрения подобного подхода в существующие или перспективные разрабатываемые тренажеры позволят получить:
- реалистичное управление объектами на основе генерации и выбора лучшего решения исходя из опыта всех прошлых данных проведенных занятий, а не в зависимости от алгоритма, заложенного в той или иной модели поведения;
- возможность ранжирования степени и качества принятия решений управления объектом, в том числе уровень его интеллекта, и как следствие – сложность разыгрываемой ситуации;
- сокращение количества рабочих мест в системе и возможность их оперативной замены интеллектуальным нейронным модулем, в том числе возможность передачи управления конкретным объектом или их группой.
Предложенный подход может применяться не только в контексте указанного в качестве примера тренажера по управлению динамичными объектами, но и в других разработках с целью интеллектуализации программных решений и введения качественно новой модели управления объектами.
Литература
1. Рутковская Д., Пилиньский М., Рутковский Л. Нейронные сети, генетические алгоритмы и нечеткие системы. М.: Горячая линия–Телеком, 2006. 452 с.
2. Хайкин С. Нейронные сети: полный курс. М.: Издат. дом «Вильямс», 2006. 1104 с.
3. Вороновский Г.К. [и др.]. Генетические алгоритмы, искусственные нейронные сети и проблемы виртуальной реальности. Харьков: ОСНОВА, 1997. 112 с.