Разработка технологии нечеткого моделирования ситуаций принятия решений в частично формализованных системах

№4

09 Сентября 2024

2024

2023

№4 2023

Разработка технологии нечеткого моделирования ситуаций принятия решений в частично формализованных системах

Вовк С.П. () -
Ключевое слово:
Ключевое слово:

Различные организационные системы относятся к классу частично формализуемых систем. Особый интерес представляют организационные системы, состоящие из двух подсистем, которые могут действовать согласованно или конфликтно в целях достижения наилучшей (в определенном смысле) общей для системы динамики нарастания некоторого необходимого качества. Последовательное принятие решения (ПР) по управлению взаимодействием таких подсистем осуществляется с учетом ограничений в виде предыстории протекания процесса взаимодействия в условиях несовпадающих систем предпочтений.

У исследуемого класса есть основные особенности организационных систем.

· Оптимальную стратегию достижения глобальной цели диктует I1, которой принадлежит инициатива в выборе правил взаимодействия по причине обладания в большей степени опытом и ресурсами. Оптимальная стратегия определена желаемой динамикой нарастания необходимого качества, отражающей темп нарастания интегрального показателя качества.

· Пассивная подсистема I2, которой навязываются правила взаимодействия, обладает некоторой реальной динамикой нарастания показателя качества. Сравнение темпов нарастания интегрального показателя качества у пассивных подсистем, обладающих разными характеристиками, позволяет в каждый момент функционирования определить динамически изменяющуюся принадлежность к классу.

· I2 пытается достигнуть общей цели с минимумом затрат: (вступает в коалицию или антагонистически противоборствует). Нарастание показателя качества оценивается с учетом первоначального уровня сложности работ и ввиду несовпадения оценок уровней сложности исходы взаимодействия описываются интервалами.

В отличие от традиционно рассматриваемых в теории игр сценариев поведения выбор стратегии взаимодействия I1 в некоторый момент ПР зависит от ранее проявленной I2 способности к накоплению качества. Способности проявляются в виде величины отклонения желаемой и реальной динамик нарастания показателя качества и определяют выбор класса стратегий для возврата к желаемой динамике. Стратегии некоторого класса моделируются соответствующим фрагментом. Необходимость учета названных особенностей приводит к тому, что в общей постановке задачи моделирования и анализа частично формализованных систем отчетливо виден ряд вспомогательных задач:

1) модель динамики нарастания необходимого качества;

2) построение ситуационной модели игры с динамически меняющимся классом стратегий активного игрока и управление ее сценарием;

3) выбор лучшей тактики противодействия по отношению к противоположной стороне с учетом множеств критериев сторон.

Первая модель строится либо по результату экспертной оценки трудоемкости и значимости выполненных работ, либо оптимальная траектория определяется по описанию системы рекуррентными соотношениями Бэллмана.

Для решения второй задачи требуется:

· сформировать сценарий, описываемый конечным графом = (Ss, V),

где представляет собой объединение всех эталонных ситуаций моментов управления tj, j=; VÍSs´Ss описывает переходы между эталонными ситуациями разных tj с помощью отображений множества эффективных (или оптимальных) тактик игрока I1 в множество дуг и полезностей этих тактик в множество дуг ;

· определить допустимые тактики игрока для шага ПР tj, что требует решения третьей задачи;

· определить для I1 максимизирующее управление с для попытки возврата I2 к запланированной динамике нарастания качества в условиях существования ограничения на силу воздействия в виде предыстории ; должно одновременно удовлетворять достижимости поставленной цели и допустимости найденного решения .

В качестве основной модели для решения третьей задачи выбрана известная теоретико-игровая модель анализа конфликтной ситуации. Путем анализа конкретной ситуации ПР, представленного на рисунке, предлагается переход от общей теоретико-игровой модели к конкретной форме матричной игры.

Переход производится следующим образом:

- при ситуации ПР, характеризующейся четкими исходами взаимодействия и известными вероятностями их наступления, выполняется переход к модели четкой игры Неймана-Моргенштерна [1];

- при последствиях альтернатив , формализуемых с функцией полезности (ФП) , и ограниченности информации о вероятностях исходов (РВ) задача ПР для игрока I1 описывается кортежем

, (1)

где Р={Рp} – множество значений лингвистических вероятностей, каждое из которых формализуется нечетким числом с :[0,1]®[0,1]. Последствия решений I1 оценивает по лингвистическому критерию . С позиций I1 задача анализа решений в нормальной форме описывается . Структура предпочтения I1 представляет бинарное нечеткое отношение нестрогого доминирования по полезности (ДП). Принцип выбора элементов из A1(tj) на основе результата парного сравнения альтернатив состоит в построении Rs1(tj) с .

определяет нечеткость тактики с нечетким подмножеством недоминируемых тактик (эффективных решений) с . Это преобразование описывает модель нечеткой игры , где – тактики i-го игрока; – бинарные нечеткие отношения нестрогого предпочтения i-го игрока на множестве.

Формализация ситуации 2 с помощью Гнч, несмотря на попытки, предпринятые в работе [2], оставляет нерешенными важные с точки зрения практики моделирования вопросы:

1) каким образом учитывается система предпочтений игрока при выборе им решения в tj,

2) Подпись:
Моделирование ситуации взаимодействия систем с использованием четких и нечетких игр каким образом выбирается желаемый уровень достижения промежуточной цели .

Предлагается постановку задачи определения желаемого уровня достижения цели I1 в условиях наличия противодействующей стороны I2 представить в виде кортежа:

, (2)

где – система предпочтений, под которой понимается совокупность представлений лица, принимающего решения (ЛПР), в момент tj о критериях и достоинствах тактик для представителей разных классов I2, задаваемых в виде отображения ; – алгоритм, позволяющий определить же- лаемый уровень достижения цели на множестве агрегированных предпочтений ; заключается в процедуре построения уровня h1 нечеткого , которое необходимо представить в виде функциональной зависимости .

В результате анализа подходов к учету нечеткости, возникающих из-за многих критериев, автором было выявлено, что имеющиеся процедуры учета многокритериальности при построении множества недоминируемых альтернатив Aндi i-го игрока не отражают ограниченности информации о состоянии противоположной стороны. Многокритериальность может быть учтена с использованием степени разделения возможностей агреги- рованных предпочтений игроков относительно альтернатив при разных предположениях о состоянии внешней среды.

Исследование моделей, реализующих алгоритм на матрице агрегированных предпочтений , показало, что для определения hi – уровня различения альтернатив игрока Ii можно воспользоваться понятием “порог разделения зон” альтернатив, введенным в общей модели “разделения торговой зоны” Й. Леунга [3]. С учетом названного для || определяется

где – степень совместности тактики am с критерием l; – степень важности для представителя класса c противника Крите- рия l с точки зрения рассматриваемого в игре класса Ii.

Для определения желаемого уровня достижения цели hi использовано понятие “порог разделения зон” [3]:

, (3)

где – агрегированные предпочтения рассматриваемого в игре класса Ii относительно тактик для представителей класса c противника.

Аналогично может быть определен уровень для противника.

Равновесное решение нечеткой игры ищется как [2]. Оно выделяет на W область W¢ удовлетворительных исходов. Стратегии игроков, соответствующие w(a1,a2)ÎW¢, представляют эффективные решения игроков при выборе первой альтернативы I1 и второй альтернативы I2. W¢ служит основой для поиска единственного управления для I1, отвечающего требованию достижимости промежуточной цели для представителей класса c игрока I2. Для нахождения единственного управления был разработан алгоритм определения максимизирующего управления для очередного шага ПР.

Предложенный метод поиска равновесного решения нечеткой игры в условиях многокритериального выбора игрока и ограниченности информации о состоянии другой стороны позволил разработать технологию моделирования игровых ситуаций с исходами взаимодействия, описываемых интервалами.

Основные пункты технологии моделирования ситуаций ПР с использованием четких и нечетких игр следующие.

1. Представить схему взаимодействия " I1 -I2" в виде дерева позиционной игры.

2. Выявить множества тактик A1 для I1 и A2 для I2.

3. Перейти к п. 4 при возможности однозначной оценки исходов всех партий. Перейти к п. 6 в случае неоднозначности оценки некоторых исходов, то есть исходов, оцененных преподавателем в виде нечеткого интервала [b1,b2].

4. Определить ожидаемые выигрыши игро- ков с помощью [1] , где функция выигрыша Gi является показателем успеха игрока на множестве исходов.

5. Представить схему взаимодействия в матричной форме, затем осуществить поиск оптимальных решений с использованием традиционных методов решения матричных игр [1]:

· при наличии "седловой точки" – с помощью ,

· при ее отсутствии – с помощью , где a1,a2 – чистые стратегии игроков I1 и I2 соответственно; – смешанные стратегии; G(a1,a2), – математическое ожидание выигрыша в чистых и смешанных стратегиях.

Перейти к п. 25.

6. Упорядочить состояния, в которых может находиться I2, по убыванию их вероятностей p(c1)³ …³ p(cm) на основе ранее рассмотренной оценки вероятностей возможных состояний противоположной стороны. Оценить степень истинности утверждения a=“состояния C упорядочены по убыванию вероятности” как Т()=1.

7. Определить нечеткие оценки полезности тактики I1 при применении альтернатив af, ag в виде [4] и , u,vÎ[0,1] для всех k возможных состояний противоположной стороны.

8. Результат сложения нечетких чисел обозначим , с функциями принадлежности , , определяемыми [4] и .

9. Если , то принять mД (ag,af)=0 "agÎA1 и перейти к п. 17.

Если с использованием четкого доминирования по полезности нельзя упорядочить тактики, при пересечении интервалов, перейти к п. 10, а при включении – к п. 11.

10. Если имеет место пересечение интервалов оценок полезностей, то оценить истинность утверждения zk’= можно с помощью [4] .

Перейти к п. 10.

11. В случае включения интервалов оценок полезностей оценить истинность утверждения Т(zk’) с помощью формулы [4]

12. В случае пересечения интервалов оценок полезностей оценить истинность Т(zk”) утверждения zk”= с помощью формулы [4] .

В случае включения интервалов оце- нок – с помощью формулы [4] .

13. Определить степень доминирования альтернативы af над ag как , где определена в п. 10 или 11.

14. Определить степень доминирования альтернативы ag над af как , где определена в п.12.

15. Оценить истинность утверждения T(b) [4] с помощью .

16. Определить степень доминирования с помощью характеристической функции отношения ДП [4] .

17. Произвести парный анализ тактики af с другими agÎA1, выполнив п. 8-16 на множестве A1.

18. Построить нечеткое множество недоминируемых тактик AНД1 и с [4] .

19. Задачу анализа тактик для I2 задать отображением a: N®W, рассматривая в качестве возможных состояний природы наборы работ xÎX. Построить нечеткое множество недоминируемых тактик AНД2 игрока I2, для чего выполнить п. 6-18 алгоритма на множестве тактик A2.

20. Выполнить попарное сравнение Wf, Wg в случае пересечения интервалов оценок с помощью , а в случае включения интервалов оценок с помощью .

Построить [4] нечеткое множество не- доминируемых тактик AНД2 с .

21. Определить нечеткость исхода [2], получающегося в результате применения нечетких стратегий игроками, согласно A1´A2={((a1,a2), s1(a1) Ù s2(a2))}, где a1ÎA1 , a2Î A2.

22. Построить на нечетком множестве исходов W=A1´A2 четкие отношения уровня Rhi={(a1,a2)ÎA1´A2|R(a1,a2)³hi} (i=1,2) с использованием определенных с помощью (3) желаемых уровней I1 и I2.

23. Найти равновесное решение игры с помощью Rh=Rh1Ç Rh2, где hi – уровень нечеткого отношения R i-го игрока. Под отношением уровня понимается четкое отношение Rhi, определяемое для " hi >0 следующим образом: Rhi ={(w,w¢)Î W1´W2 |R(w,w¢)³hi }.

24. Вычеркнуть нулевые строки и столбцы в матрице отношения Rh. Исходы, оставшиеся после вычеркивания, составляют множество Парето.

25. Конец.

Названная технология моделирования ситуаций ПР с использованием четких и нечетких игр получила практическую реализацию в АРМ преподавателя-исследователя, занимающегося планированием, организацией, контролем учебного процесса.

При работе с АРМ преподаватель-исследователь использует основное меню с пунктами: “Работа с календарным планом”, “Работа с деревьями”, “Выход”.

При выборе режима “Работа с календар- ным планом” появляется возможность выбора нужного режима работы: “Новый”, “Открыть”, “Выход”.

Календарный план представляет собой последовательность контрольных занятий с заданиями разной сложности в разные моменты контроля знаний, каждое из которых моделируется деревом, характеризующим конкретного учащегося как представителя класса по обучаемости. Возможность моделирования оптимальной планируемой рейтинг-характеристики достигается за счет перераспределения баллов между точками контроля. Фактическая рейтинг-характеристика строится по результатам контроля знаний студента или группы.

В режиме “Работа с календарным планом” предусмотрены возможности построения нового плана, просмотра или корректировки существующих. Возможности по редактированию календарного плана следующие.

– Вставить пункт. Вводится номер эталонного дерева (при работе со стандартными эталонными деревьями) или имя файла для нового дерева, а также планируемые и фактические количества баллов и точки выхода. Для определения точки выхода курсор перемещается в ту вершину на дереве игры, которая будет точкой выхода, и нажимается клавиша Esc.

- Удалить пункт плана.

- Редактировать общую информацию о плане.

- Редактировать текущее дерево игры (план).

- Редактировать текущее дерево игры (факт).

- Подсчитать фактические баллы.

- Редактировать информацию о текущем пункте плана.

В режиме “Работа с деревьями” экран пользователя условно разделен на 3 части: дерево – в нижней части экрана, информация – в левом верхнем углу экрана, помощь – в правом верхнем углу экрана.

Каждый из узлов дерева может содержать сколь угодно большое число потомков. Количество уровней в дереве ограничено размером экрана (7 уровней). Каждый лист дерева имеет следующие параметры.

1. Выигрыш при попадании в вершину, характеризующую результат контроля (0.0, 0.6, 0.8, 1.0 от максимума).

2. Вероятность попадания в данную вершину из предыдущей. Для вершин одного уровня, имеющих общего предка, сумма вероятностей равна 1.0. Для лучшего визуального восприятия такие вершины отображаются на экране в виде белого кружка, все остальные – в виде красных.

3. Цвет связи с предыдущей вершиной облегчает понимание, для какого типа ученика предназначена данная ветвь дерева (синий – для слабого, зеленый – для среднего, красный – для сильного).

4. Вероятность конкретной партии.

5. Последовательность заданий и их уровни сложности.

Игра развивается в виде одной из партий. Преподаватель выдает задания в вершинах выдачи задания, учащийся их выполняет, в вершинах принятия решения преподаватель оценивает выполнение учащимся задания.

Узел выдачи задания отражает набор уровней сложности задания в дереве, номер выдаваемого задания на участке партии (проставляется автоматически), вероятность попадания в вершину из предка, цвет связи с предком, комментарий.

Узел принятия решения описывается следующей информацией: выигрыш (0.0, 0.6, 0.8, 1.0), вероятность попадания из предка, цвет связи с предком, вероятность попадания в данную вершину из корня дерева, последовательность уровней сложности заданий для партии.

Попадая в вершину-лист, располагаем следующей информацией: вероятность попадания в эту вершину, выигрыш, последовательность выполнения заданий.

В режиме просмотра при нажатии клавиши Enter на экран выводятся матрица вероятностей исхода и матрица выигрышей. Дерево игры может редактироваться в одном из режимов: редактирование общей информации о дереве – клавиша F3, полноэкранное редактирование дерева (пользователь имеет возможность создавать новое дерево или редактировать уже существующее) – клавиша F4. В последнем режиме пользователь может выполнять следующие операции: “Добавление вершины” – клавиша Ins, “Удаление вершины” – клавиша Del, “Редактирование информации о вершине”– клавиша Enter, “Перемещение вершины (изменение координат)” – клавиша пробел (Space).

Предлагаемый комплекс моделей может найти более широкое практическое применение, в частности, его возможно применять для целей дистанционного обучения (ДО).

Известно, что учебные курсы, программы, информационное обеспечение для ДО разрабатываются, главным образом, на основе интуиции разработчиков и педагогического мастерства экспертов-педагогов. Наиболее перспективно формализацию описаний и анализа учебных ситуаций без упрощения их сложности производить с помощью нечетких множеств.

Однако не существует комплекса моделей, позволяющих учесть ранее названную специфику взаимодействия подсистем в организационных системах. Поэтому также предложены алгоритмы построения сценария игры и определения максимизирующего управления в сценарии, часть исходов которого описывается нечеткими интервалами.

Их особенности заключаются в следующем. Алгоритм построения сценария игры включает дополнительный этап построения дерева управляющих решений с учетом последовательности работ с разным начальным уровнем сложности. Использование максимизирующего управления в нечеткой ситуационной сети позволяет достигать желаемую цель с удовлетворяющей ЛПР возможностью или корректировать первоначально запланированную цель с учетом текущей классификации пассивной подсистемы.

На основании этих алгоритмов разработаны технологии построения сценария игры и определения максимизирующего управления в ситуационной сети, позволяющие организовывать нужную динамику нарастания показателя качества у системы в целом.

Использование нечетких ситуационных моделей для управления взаимодействием игроков позволяет устранить один из главных недостатков матричной игры – отсутствие динамичности, и дает возможность при выборе решения в сложной системе учесть интуитивные действия ЛПР.

Список литературы

1. Нейман Дж., Моргенштерн О. Теория игр и экономическое поведение. - М.: Наука, 1970. –340 с.

2. Ragade R.K. Fuzzy games in the analysis of options Journal of Cubernetics, 1976, v.6, h.213-221.

3. Леунг Й. Разделение на торговые зоны в нечетких условиях: Теория возможностей и ее применение. - М.: Наука, 1992. –272 с.

4. Обработка нечеткой информации в системах принятия решений // А.Н. Борисов, А.В. Алексеев, Г.В. Меркурьева и др. - М.: Радио и связь, 1989. –304 с.

http://swsys.ru/index.php?id=579&lang=.docs&page=article

Perhaps, you might be interested in the following articles of similar topics: