На правах рекламы:
ISSN 0236-235X (P)
ISSN 2311-2735 (E)

Авторитетность издания

ВАК - К1
RSCI, ядро РИНЦ

Добавить в закладки

Следующий номер на сайте

4
Ожидается:
09 Декабря 2024

Инструментарий для экспертных систем. технология SIMER + MIR

Статья опубликована в выпуске журнала № 3 за 1990 год.
Аннотация:
Abstract:
Автор: Осипов Г.С. () -
Ключевое слово:
Ключевое слово:
Количество просмотров: 11970
Версия для печати

Размер шрифта:       Шрифт:

Программная система SIMER + MIR представляет собой совокупность программных средств для формирования качественной модели предметной области и адаптации к этой модели программных

средств моделирования рассуждений типа аргументации. Система ориентирована преимущественно на области с неясной структурой объектов, с ненолно описанным множеством свойств объектов и богатым набором связей различной "связывающей силы" между объектами.

Одна из особенностей системы состоит в том, что ее использование на заключительном этапе (т.е. когда область определена и установлено соответствие системы как области, так и классу задач) не предполагает участия специалистов по экспертным системам. Это означает, что система SIMER + MIR представляет собой технологию создания систем, основанных на знаниях о предметной области, причем технологию, ориентированную на экспертов.

Почему мало прикладных экспертных систем? В настоящее время разработано много программ, называемых экспертными системами (ЭС), оболочками для ЭС и т.д. Даже если исключить системы, которые названы экспертными но каким-либо внешним (по отношению к системе) соображениям, среди этих систем можно выделить:

•      собственно ЭС, являющиеся законченным программным продуктом для копеч- ного пользователя;

•      пустые ЭС, содержащие все необходимые средства профаммной поддержки, конструкции и процедуры и отличающиеся от систем предыдущего типа тем, что их базы знаний еще ие содержат знаний экспертов предметной области (знания экспер тов, используемые ими для формирования заключений, будем называть эксперти зой);

•      инструментальные программные среды, позволяющие создавать в интерактив ном режиме необходимые конфигурации пустых ЭС;

•      специализированные языки высокого и сверхвысокого уровней для создания систем второго и третьего типов.

При всей условности этой классификации можно заметить, что если для реализации переходов от четвертого к третьему и от третьего ко второму типам нужны профаммисты, то для реализации перехода от второго к первому типам необходимо, кроме экспертов, участие специальной категории людей, владеющих информацией как об архитектуре и средствах представления знании в системе, так и о методах преодоления "когнитивной защиты" экспертов [1]. Этих специалистов принято называть инженерами но знаниям.

Проблемы, связанные с выявлением знаний экспертов и переносом экспертизы, были заметны еще в первых ЭС. Они положили начало инженерии знаний, которая в настоящее время является чем-то вроде ремесла, а сам процесс выявления знаний представляется искусством, [раничащим с черной магией.

Работа эта кропотливая и занимает много времени. Качество системы прямо зависит от квалификации инженера по званиям, глубины его понимания предметной области и ряда личностных характеристик [5].

Задача осложняется тем, что образ мышления и представления эксперта часто не соответствуют его вербальным сообщениям, т.е. самые компетентные эксперты оказываются некомпетентными при попытках описать те знания, которыми они пользуются при решении задач.

К причинам неудач следует отнести и трудности, связанные с выбором формализма для представления знаний. Решение вопроса о выборе подходящего формализма носит стратегический характер, а последствия его неудачного решения могут оказаться катастрофическими [4].

Существующая тенденция состоит в попытках придать экспертизе такую форму, которая соответствовала бы способу представления, принятому в имеющейся в распоряжении инженера по знаниям инструментальной среде. Например, в тех случаях, когда инструментальное средство основано па системе продукций, инженер по знаниям будет пытаться получить экспертизу в форме правил вида "Если ... то ...". Если в результате такой деятельности удается получить систему, например, из нескольких сотен продукций, то не будет известна ни их относительная важность, ни число продукций, не вошедших в это множество (в то время как известно, что опытный специалист отличается от новичка не только объемом своих знаний, но и их организацией [2().

Иная архитектура системы (например в виде сети фреймов) потребует придания экспертизе формы совокупности некоторых ситуаций и установления таких отношений, как, допустим, соподчинение или "прототип-экземпляр".

В инженерии знаний любой формализм является средством описания понятий, их свойств, связей между ними, а также для поддержки рассуждений о понятиях, об их свойствах и связях между ними.

Неадекватный формализм приводит к потере многих существенных деталей и порождает "тривиальный интеллект", т.е. способность хорошо справляться только с простыми задачами.

Таким образом, вопрос о выборе адекватного способа представления должен решаться на основе анализа понятийной системы предметной области и принятых в ней способов рассуждений /6]. Для решения задач реального уровня сложности должны быть выполнены следующие требования к способу представления:

•      умение описывать все существенные объекты, их свойства, признаки и связи с точки зрения будущих задач;

•      пренебрежение несущественными свойствами объектов и области;

•      возможность создавать новые объекты или рассматривать как таковые совокупности объектов, присваивать каждому такому объекту имя и в дальнейшем ссылаться на него;

•      рассматривать как естественное состояние модели, качество "работы" которой должно "монотонно" зависеть от ее полноты [4].

Архитектура. Система SIMER+MIR включает модуль прямого приобретения знаний SIMER, моделирования рассуждений типа аргументации MIR, программу адаптации системы MIR к базе знаний, сформированной с помощью SIMER+ и программной среды поддержки базы знаний, над которой работают все названные модули. Конструкции базы знаний создаются и просматриваются с помощью языка ивженера знаний FORTE, который включается в технологию в специальных случаях (рис.1).

Представление и база знаний. Одним из наиболее распространенных вид о и экспертизы являются высказывания (сообщения) эксперта об объектах (событиях) предметной области. Эти высказывания имеют вид: <имя объекта><имя отношения > <имя объекта >. Для ряда областей - медицины, экологии, политики, социологии - можно выделить формы сообщений, показанные в табл.1:

Таблица 1

Этот список не является исчерпывающим, однако дает представление о тех когнитивных структурах, которые необходимо представлять и обрабатывать в базе знаний.

Каждая из этих форм может иметь различный смысл; уточнение смысла можно получить при рассмотрении "прямого" сообщения с "обращенным". Иными словами, если для некоторых фиксированных а или р справедливо сообщение формы Ф ,, то необходимо попытаться установить, какое из сообщений Ф -Ф справедливо при замене а на р, р на а- Так, для сообщения "Гром наблюдается при грозе" справедливо "обращенное" сообщение "Гроза сопровождается громом", а для сообщения "Воспалительны?! процесс может наблюдаться при повышенной температуре" справедливо сообщение "Повышенная температура характерна для воспалительного процесса". Таким образом, смысл сообщений уточняется построением "конъюнкций" форм Ф1-Ф Такие "конъюнкции" форм сообщений будут называться типами сообщений. Возможные типы сообщений приведены в табл. 2.

С каждым типом сообщения из табл.2 связывается формальная конструкция базы знании, т.е. бинарное отношение на множестве объектов (событий). Эти конструкции можно проиллюстрировать следующим образом: если каждый объект (событие) представить в виде "двухмерного" множества, по первому измерению которого можно откладывать атрибуты этого объекта, а по второму - множества значений соответствующих атрибутов, то каждый объект представляется в виде фигуры

Если считать множества всех атрибутов равновеликими, то можно рисовать прямоугольники

Тогда типу сообщения Tf можно поставить в соответствие диаграмму (пересечение аир всюду далее заштриховано):

В качестве примера приведем интерпретации некоторых диаграмм.Так, диаграмму, соответствующую сообщению типа Т3, можно интерпретировать следующим образом: для всякого примера объекта р найдутся такие примеры объекта я, в которых равны совпадающие имена и значения атрибутов.

Для сообщения типа Т„: для всякого имени атрибута примера объекта а найдется совпадающее с ним имя атрибута из примера объекта р и наоборот; при этом соответствующие значения атрибутов равны.

Каждой из изображенных диаграмм можно дать такую теоретико-множественную интерпретацию, связав с каждым из типов сообщений Т некоторое бинарное отношение R примеров объектов (при к = Г).

Возможна и другая интерпретация диаграмм. Она связана с рассмотрением на множествах атрибутов семейства функций, действующих из декартовых произведений некоторых множеств атрибутов в множества атрибутов и ставящих в соответствие некоторым кортежам значений атрибутов примеров событий значения атрибутов в примерах других событий. С учетом этого интерпретацию диаграммы типа сообщения Т можно дать, например, следующим образом: для всякого примера объекта а найдется пример объекта р и для всякого атрибута объекта р и некоторой функции f из заданного семейства F, определенной на каком-либо сегменте примера и, образ f на этом сегменте находится в множестве значений атрибута объекта р и равен какому-либо значению атрибута примера объекта р (это обстоятельство отмечено точечной штриховкой).

Если функции из семейства F рассматривать как временные, т.е. вырабатывающие свое значение в следующий после появления значений аргумента промежуток времени, то отношения R.,-R1? можно рассматривать как отношения событий, которые вытекают из разворачивающегося во времени процесса:

в промежуток времени t некоторые атрибуты приобретают определенные значения < m , m ,..., m>; ко всем тем событиям, куда входят эти атрибуты или некоторые из

них, применяются подходящие функции из F и вырабатывают во время t +1 значения некоторых других атрибутов. С каждым из тех событий, куда входят эти новые атрибуты, устанавливается одно из отношений R -R .

Способ представления с определенными так отношениями R -R называется не однородной семантической сетью.

В реализации базы знаний основными элементами структур данных являются элементы "вершина", "элемент кортежа", "атрибут", "цепь", "стрелка". Элемент "вершина' соответствует объекту (событию) и содержит имя, списки входных и выходные "стрелок" и список типа "элемент кортежа". Каждый элемент кортежа характеризуется указателем на элемент типа "атрибут", множеством значений этого атрибута и указателем на следующий "элемент кортежа". Список "элементов кортежа" соответствует совокупности атрибутов события.

Для обеспечения простои) способа определения указателя "вершины" существуют элементы тина "пепь". Элемент типа "цепь" содержит указатель на "вершину" и указатель на следующий элемент типа "цепь". Указатель на первый элемент списка "цепь" входит в описание элемента тина "атрибут". "Атрибут" характеризуется также именем, множеством значений и единицей намерения.

Отношения на множестве объектов реализованы в элементах типа "стрелка". Каждый такой элемент содержит имя, сорт, вес, тип веса, указатель на "вершину" и указатель на следующий элемент типа "стрелка". Отношения на двух объектах описываются парой элементов типа "стрелка", один из которых входит в список входящих стрелок одного объекта, другой - в список входящих стрелок другого объекта.

Процедурная компопеша системы содержит функции создания структур данных, поддержки корректности базы знаний, наследования свойств и ряд других функций. Для обеспечения поиска но именам элементов типа "вершина" и "атрибут" в системе реализовано В-дсрево. Доступ ко всем элементам базы осуществляется через виртуальную намять. Каждый элемент имеет внутренний идентификатор, но значению которого однозначно определяется его размещение в оперативной или внешней памяти. Для работы с объектами, отсутствующими в оперативной памяти, осуществляется их динамический перенос из внешней памяти в оперативную. Это позволяет системе работать на компьютере с ограниченным объемом оперативной памяти.

Прямое приобретение знаний в системе SIMER

Трудности, связанные с выявлением и переносом экспертизы, возникли с момента появления первых экспертных систем. Одна из них связана прежде всего с существованием так называемой когнитивной защиты [3]. Понятие кошитивной защиты основано на теории личностных конструктов, выдвинутой Келли в 1955 году. Чем Шире набор личностных конструктов у субъекта, тем более многомерным, дифференцированным является образ мира, человека, других явлений и предметов, т.е. тем выше его когнитивная сложность [8]. Поэтому преодоление когнитивной защиты связывается с выявлением личностных конструктов.

Другая трудность - проблема "отбора" зналий, заключающаяся в "дискретности", неполноте и слабой структурированности знаний эксперта. Это часто приводит к неправильной оценке важности тех или иных знаний для решения задач. Психологические исследования свидетельствуют о недостаточной корреляции между вербальными сообщениями и ментальным поведением эксперта. Иными словами, даже самые компетентные эксперты оказываются недостаточно компетентными при попытке описать знания, которые они используют цри выработке решений.

Наконец, еще одна трудность возникает из-за присутствия в процессе приобретения знаний традиционно центральной фигуры - так называемого инженера по знаниям. Несмотря на влияние инженера по знаниям на качество построенной системы, знакомство его с элементами когнитивной психологии, с основными теориями мышления, со способами активизации мышления и представления знаний [5], существует некоторый психологический барьер в передаче экспертом своих знаний другому человеку.

8 системе SIMER реализован подход к приобретению знаний, при помощи которых решаются эти проблемы. Результатом реализации этого подхода явилась система, в которой приобретение знаний происходит в процессе прямою диалога с экс-нертом; управление диалогом осуществляется способом представления и накопленными зп алиями, а в качестве основных стратегий выявления знании используются методы преодоления когнитивной защиты.

Основные принципы описываемого ниже подхода изложены в [7J.

Для выявления структурных знаний о предметной области используются стратегии разбиения па ступени и ренертуарпых решеток.

Стратегия разбиения на ступени направлена на выявление структурных и классификационных свойств событий (понятий, объектов) области и таксонометрической структуры событий предметной области.

Стратегия разбиения на ступени реализуется в одном из двух сценариев, который выбирается экспертом:

1.      "Имя - свойство";

2.      "Множество имен - свойство".

Сценарий "Имя - свойство".

1.1.  Вопрос системы об имени события.

Сообщение эксперта об имени события.

1.2.      Вопрос системы об имени свойства. Сообщение эксперта об имени свойства.

1.3.      Вопрос системы о существовании множества значений свойства. Отпет эксперта (Да/Нет).

В случае отрицательного ответа имя свойства воспринимается как имя события. Если имя события, образованного на шаге 1-3. отсутствует в базе знаний, то это событие рассматривается как новое, и для пего выполняются шаги 1.2 - 1.7.

1.4.  Вопрос системы о типе множества значений свойства (непрерывное/ди скрет и ое).

Соответствующий ответ эксперта.

1.5.      Вопрос системы о единице измерения свойства. Сообщение эксперта о единице измерения.

1.6.      Вопрос системы о множестве значений свойства. Сообщения эксперта о множестве значений свойства.

В процессе выполнения шагов 1.2 - 1.6 создается глобальный объект "имя свойства" и область его значений. Совокупность таких объектов будем называть базисом свойств области.

1.7.  Вопрос системы о подмножестве значений свойства, характерного для описы ваемо!-о события.

Сообщения эксперта о иодмножестве значений свойства.

В результате выполнения шага 1.7 один из элементов базиса свойств связывается с описываемым событием (с указанием подмножества области значений элемента базиса, характеризующего описываемое событие).

Сценарий "Множество имен - свойство".

При работе сценария niai 1.1 многократно повторяется, а затем выполняются шаги 1.2 - 1.7 для каждого имени события.

Стратегия репертуарных решеток направлена на преодоление копштивной защиты эксперта. Механизм преодоления основан на выявлении его личностных конструктов. Каждый конструкт описывается некоторой совокупностью шкал, а каждая шкала образуется оппозицией свойств.

Наиболее эффективный способ выявления оппозитных свойств - предъявление эксперту триад семантически связанных событий с предложением назвать свойство, отличающее одно событие от двух других [3]. На следующем шаге эксперту предлагается наэваэъ оппозитное свойство. Таким способом выявляются элементы множества личностных психологических конструктов конкретного эксперта.

С другой стороны, свойства, различающие события, - это те свойства, которые влияют на формирование решения. Так как при этом не ставится задача выявления кошитивной организации индивидуального сознания эксперта, то описанная пропс-дура используется для формирования базиса свойств области, а не для построения личностных конструктов. Пополнение базиса свойств области осуществляется путем повторения этой процедуры с другими триадами.

Например, эксперту в области представления знаний предъявляется триада понятии, описывающих способы представления: семантические сети, фреймы, системы продукций. Эксперту предлагаете ответить на следующие вопросы:

•        какой из указанных способов представления отличается от двух других?

•        системы продукций;

•        какое свойство отличает системы продукций от семантических сетей и фрей мов?

•        легкость описания динамики;

•        назовите оппозитное свойстао свойству "легкость описания динамики"?

•        трудность описания динамики;

•        дайте имя свойству, имеющему значения "легкость описания динамики" и "труд ность описания динамики"?

•    возможность описания динамики.

В результате формируется шкала с именем "возможность описания динамики" и со значениями "легкость описания динамики" для объекта "системы продукций"; "трудность описания динамики" для объектов "семантические сети" и "фреймы".

Предлагая эксперту аналогичные вопросы об отличии семантических сетей от систем продукций и фреймов, можно выявить и другие свойства базиса области.

Еще один пример - выявление каузальных знаний о предметной области. К каузальным знаниям о предметной области в соответствии с [9] относятся: связи между следствиями и необходимыми и достаточными причинами; связи между следствиями и достаточными причинами; связи между следствиями и дополнительными сопричинами; связи между следствиями и необходимыми сопричинами; связи между следствиями и возможными сопричинами. Будем понимать каузальные знания несколько тире, включив в рассмотрение, кроме связей событий настоящего с будущим и событий прошлого с настоящим, и связи между событиями настоящего. В соответствии с этим отнесем к каузальным знаниям все типы сообщений из табл. 2,

Тогда задача выявления каузальных знаний сведется к установлению соответствия меж;iy множеством типов сообщений и множеством отношений R-R т.е. к поиску1 отображения Т в R. Для поиска этого отображения используется стратегия выявления сходства [7). Она основана на выявлении в интерактивном режиме алгебраических свойств сообщений Т. (таких как симметричность/асимметричность, рефлексивность/иррефлексивность и других) и появлении на основании этого гипотез о принадлежности сообщений тем или иным отношениям R (именно эти свойства оказываются нужными при работе механизма рассуждений).

Например, относительно двух событий "рост заработной платы" и "повышение уровня жизни" эксперт сообщил, что "рост заработной платы" обычно сопровождается "повышением уровня жизни". Тогда возникают вопросы:

а)  повышение уровня жизни всегда сопровождается ростом заработной платы?

б)  повышение уровня жизни обычно сопровождается ростом заработной платы? ej повышение уровня жизни может сопровождаться ростом заработной платы?

Ответ эксперта а) будет свидетельствовать о том, что исходное сообщение относится к типу Т табл. 2; ответ в) - исходное сообщение относится к типу Т той же таблицы. Далее появляются гипотезы о том, что сообщение эксперта интерпретируется отношением R или R в зависимости от ответа а) или в). Повышение степени достоверности такой гипотезы возможно при использовании стратегии подтверждения сходсгва [7].

Стратегия подтверждения сходсгва является комбинированной, основанной на взаимодействии сгратегий разбиения на ступени и выявления сходства, а также на анализе свойств событий (если они определены).

Например, в результате работы стратегии выявления сходства установлена принадлежность предыдущего примера отношению R На основании определения отношения R, для всякого свойства первого события найдется единственное свойство второго события и наоборот, так что область значения свойства первого события является подобластью области значений соответствующего свойства второго события. В случае выполнения этого условия гипотеза о принадлежности предыдущего примера отношению R считается достоверным утверждением, в противном случае запускается стратегия разбиения на ступени с целью выявления новых свойств событий, для которых было бы верно это условие. Если, несмотря на это, условие достоверности не выполняется, то craiyc гипотезы сохраняется, однако в базе знаний системы появляется информация о некорректности соответствую шей связи между событиями. Эта информация ограничивает возможность использования построенной связи, например, с точки зрения механизма наследования свойств. При работе стратегий выявления и подтверждения сходства сценарий работы навязывается системой.

Моделирование рассуждений в системе MIR

Введем следующие обозначения:

О - опрос признаков яз множества S;

П - порождение множества гипотез Г;

И - исключение множества гипотез Г.

Элементы данных типа "стрелка", соответствующие отношению R будем называть отрицательными связями, остальные - положительными.

Работа системы MIR начинается с работы модуля О, затем модуль П строит множество гипотез Г на основе анализа положительных связей S с Г для подтвержденных признаков из S. Множество гипотез Г используется модулем О для порождения новогс множества признаков S связанных с гипотезами из Г положительными связями, и осуществления их тестирования. К подтвержденным признакам ич S применяется модуль П для порождения нового множества гипотез Г . Выполняются операции Г: = ГПГ S: = SUS.. Этот процесс продолжается итеративно до стабилизации множества S и Г. Затем выполняется модуль И исключения гипотез из Г на основе анализа отрицательных связей для подтвержденных симптомов и анализа положи-

тельных связей для обусловленных признаков, т.е. таких неподтвержденных признаков, отсутствие которых имеет большее значение для принятия решения, чем нх присутствие.

Если в результате выполнения модуля И в множестве гипотез осталось более одной гипотезы, то выполняется поиск дифференциальных признаков для подмножеств множества гипотез (дифференпиальным признаком для некоторого множества гипотез называется значение свойства, характерное для одной гипотезы из множества и нехарактерное для других, или событие, связанное положительной связью с одной гипотезой из множества и не связанное таковой с другими). В результате этого процесса происходит исключение соответствующих гипотез. При необходимости процедура повторяется для оставшегося множества 1ипотез до его стабилизации.

После выполнения еще нескольких модулей осуществляется анализ полученного множества гипотез с целью поиска его минимального подмножества, связанного положительными связями со всеми подтвержденными признаками и тем самым объясняющего их. Это последнее мпожество и считается окончательным результатом.

СПИСОК ЛИТЕРАТУРЫ

1,      Воо»е J.H. Personal Construct Thec*y and Ihe Transfer of Human E*pertiK Advances rn Artificial. T O'Shea|ed.). £1*. Sci. Publfetwe B.V. I North-Ио1 land). 198S.

2,      Chi M.T.H.. Fellovich P.J. ana Glaser R. Celegoi nation and representairon of physics ptotilen» by experts and novicet, Coon. So., voj.5, pp. 121-152, 1981.

3 Keily G.A. The PaycholoQy ol Perional СопиУис». New Ynrtt, Norton. 1955.

A. flygc У.А. Основные пройммы пй*встввг*мия знаний. ТИИЭР, 1986. - Т.71, N 10г

5Г ГвВрилоВа Т.Д. Кг* стать им*вмвроы по эмаииРМ.М., T9SS. [Теаисы дсЛдадод. ВКИИ. 21-25 i-qpuph 13SSf. ПереслаВ^о-Залвсскии.).

G. Мывяов С. ОсипоВ Г.С. Типы предметны* областей и модели анемий. Соэопол, 1989. (Сборник трудоВ Второю ме*дународново

семинара 'Теория и применение искусственнОбО интеллеКтаТ.

7.      Осипов Г С. Принципы примо>о приобретен ив знаний. Соэооол, ^98Э. (Сборник трудов Второго меЖЯунвродноао семинара "Теория и при**внение искусствен ново интеллекта").

8.      Пвтгкнко В.Ф. Пси<осеианпч*а сознания. М.: Изд-во МГУ, 1988.

3,   Поспелов Д.А. Ситуационное управление: Тейеия и практика. М : Наука. 1ЭЭ6Г


Постоянный адрес статьи:
http://swsys.ru/index.php?page=article&id=1420
Версия для печати
Статья опубликована в выпуске журнала № 3 за 1990 год.

Возможно, Вас заинтересуют следующие статьи схожих тематик: