На правах рекламы:
ISSN 0236-235X (P)
ISSN 2311-2735 (E)

Авторитетность издания

ВАК - К1
RSCI, ядро РИНЦ

Добавить в закладки

Следующий номер на сайте

2
Ожидается:
16 Июня 2024

Рассуждения о знаниях и рассуждениях в метауровневой архитектуре

Статья опубликована в выпуске журнала № 1 за 1990 год.
Аннотация:
Abstract:
Авторы: Айелло Л. () - , Нарди Д. () - , Шаерф М. () -
Ключевое слово:
Ключевое слово:
Количество просмотров: 10112
Версия для печати

Размер шрифта:       Шрифт:

Одной из задач искусственного интеллекта являемся создание искусственного агента, способного к самостоятельному поведению в реальном мире, поэтому понимание того, что означает для некоторого интеллектуального агента сбор знаний о реальном мире путем наблюдений и восприятия высказываний аналогичных агентов, очень важен. Усвоение знаний агентом происходит в результате наблюдений: он уточняет свою базу знаний и получает возможность использовать вновь усвоенные знания при проведении собственных рассуждений. Этот процесс предполагает некоторый формализм при построении агентом собственного символьного представления о мире, включающего других партнер о is-агентов, а также механизм дедукции. Интеллектуальный агент должен проводить рассуждения с использованием личных знаний, рассуждения о своих знаниях и действиях, связанных с процессом рассуждения, рассуждения о знаниях и рассуждениях других агентов.

Основным предметом изучения является процесс взаимодействия, возникающего межд_\ агентами: каждый агент имеет свою точку зрения на окружающий мир и на других агентов как часть этого мира и может рассуждать об этом мире. Агенты «прислушиваются» друг к Другу и могут нетривиально использовать выводы, к которым пришли другие партнеры. Иначе говоря, агент, знающий, что партнер имеет определенную точку зрения на мир, отличную от его собственной, получает информацию о мире, наблюдаемом с иной позиции.*

В описываемой ситуации участвуют агенты, являющиеся совершенными рассуждающими устройствами: на заданный вопрос агент говорит правду, оптимально соответствующую его знаниям. Агент не обманывает ни в смысле характера своих заключений, ни в смысле своих способностей их строить: он не говорит «я не шою», если в действительности тает. Особенно интересно то, что агент может строить свои рассуждения, опираясь на выводы, сделанные другим агентом; таким образом, он познает то, чего непосредственно не сообщал ему другой агент. Он способен рассуждать относительно заключений типа ~я не знаю», сделанных другим агентом, черпая таким образом знания из неведения других агентов.

Главным вопросом, который необходимо рассмотреть при построении машинной программы, имеющей дело с проблемами, связанными с несколькими агентами, является выбор формализма для представления знаний, позволяющего описывать знания и рассуждения агентов, а также собственные знания агента. Представление с использованием логики первого порядка для рассуждения о знаниях и рассуждениях требует явного представления некоторой теории (т.е. теории некоторой теории). На самом деле, если w есть правильно построенная формула, то для утверждения того, что агент А знает w, мы должны написать KNOWS(A, w) (т.е. знает). Поэтому знание приводит к предикату KNOWS, который использует в качестве своих аргументов правильно построенные формулы (т.е. элементы некоторой теории).

При моделировании проблем, связанных с совокупностью агентов, применялись два подхода. Первый — это введение модального оператора, интерпретируемого в терминах знаний агента [11, 20, 21]. Второй — определенное обобщение логики первого порядка путем рассмотрения множеств теорий, связанных в некоторую метзуровневую архитектуру [2. 3, 8, 14, 32].

Модальные системы позволяют формализовать знания агента посредством некоторого логического языка, дополненного модальным оператором, который мы обозначим символом L. Предложение L[A]

L[A2]p\ Некоторое множество аксиом и правил вывода определяет то множество формул, которые могут быть выведены в рамках данной системы. Эта логическая конструкция полностью определяется заданием семантики указанного модального оператора. Чаще всего используется при этом интерпретация в терминах возможных миров Хинтикка (Himikka) [18] и Крипке (Kripke) [22].

Семантика возможных миров является формальным средством для использования модальной логики, при котором небольшим изменением семантики удается охватить различные множества аксиом. В каждом состоянии мира некоторый агент имеет различные состояния или миры, которые он считает допустимыми. Этот агент знает р совершенно точно, если р истинно во всех мирах, которые он считает возможными. Как показал Крипке. применяя различные условия к отношениям возможности, можно представить целый ряд интересных аксиом. Например, из требования, чтобы реальный мир всегда был одним из возможных миров, вытекает, что агент не может знать ничего, что было бы ложным. Если это отношение транзитивно, то агент точно знает то, что он знает, а если отношение тран-зитннно и симметрично, то агент также знает, чего он не знает.

Модальная система, которая обычно применяется при рассуждениях о знаниях, носит наз-нанис S5. Схемы ее аксиом выглядят следующим образом: l)La =) a 2)Ца=>р) =>(La->LP)

3)      La => LLa

4)      -■La=>L-1 La.

плюс привило вывода, позволяющее выводить La из a.

В первой аксиоме утверждается, что каждая известная формула также истинна. Вторая аксиома выражает логическое всезнание, тогда как третья и четвертая аксиомы вводят понятия соответственно позитивной и негативной интроспекции. Позитивная интроспекция означает, что агент точно представляет себе свои знания, т. е. ему известно, что он знает. Негативная интроспекция означает, что ему известна степень своего незнания, т. е, ему известно, чего он не знает. Если допустить возможность, что не все знания корректны, то первая из аксиом должна быть опущена, и результирующая система будет называться К4.

При использовании семантики возможных миров определенную трудность составляет неявное принятие аксиомы логического всезнания, что в реальных ситуациях представляет сильную гипотезу. Для решения этой проблемы Konolige [21] вводит модальную систему, которая является полной в отношении рассуждений о рассуждениях. Семантика этой системы задается через множество логических последствий, которые могут быть выведены агентом.

Организация знаний в рамках некоторой метауровневой архитектуры* получила довольно широкое распространение для представления в системах искусственного интеллекта. Такая архитектура использовалась главным образом для управления процессом дедукции; метазнания позволяют направлять поиск решения и повышать эффективность поиска путем применения эвристических стратегий. Более широко метауровневые архитектуры использовались для создания интроспективных систем [7, 24, 31], способных модифицировать свое поведение, анализируя состояние и обращаясь к собственному представлению. Метауровиевая архитектура позволяет создать систему, в которой различные вопросы могут решаться на единой основе [16, 23].

В метауровневой архитектуре агент представляется как некая метатеория и некоторое множество теорий базового (или объектного) уровней, представляющих собственное знание агента и, возможно, знания других агентов. В рамках метатеории можно подтверждать факты, относящиеся к теориям объектного уровня, и строить умозаключения на основе представленных знаний. Для этого требуется определение символов, которые в метатеории

представляют объекты указанных теорий. В дальнейшем мы обозначаем посредством 'w' символ метатеории, который представляет объект w некоторой теории. Например, предложение «если агент А, знает а, то агент А, знает р» может быть записано в виде метауровне-вой формулы:

KNOWS (A,, 'a') => KNOWS (A3, '((')■

Метауровневый и модальный подходы различаются тем, как в них представлено знание агента. В первом случае представление реализуется явным образом, а в случае модальной логики представление знаний носит неявный характер и работа с ним ведется через используемый модальный оператор.

Возможность выражать метауровневые понятия обеспечивается несколькими типами систем, носящими как процедурный, так и декларативный характер. Обзоры, касающиеся метауровневых архитектур, можно найти в [2, 3, 14, 24]. Одной из отличительных характеристик метауровневой архитектуры является используемый язык, точнее языки, поскольку знания и метазнания не всегдя выражаются на одном и том же языке. Если придерживаться декларативного подхода к представлению знаний и заниматься метауровневыми архитектурами, основанными на логике первого порядка, то язык и метаязык — это одно и то же. На самом деле однородность языка и дедуктивных возможностей предполагает итерацию мета-конструкций на произвольном числе уровней при одних и тех же выразительных возможностях на каждом уровне.

Другой характеристикой метауровневой архитектуры является организации связей между уровнями. В рамках логики первого порядка такие связи устанавливаются указанием правила использования имен, связывающих символы языка метауровня с выражениями объектного уровня, и применением принципов рефлексии, связывающих теорию и метатеорию и позволяющих уровням обмениваться результатами дедукции. Примеры метауровневых архитектур, обладающих вышеуказанными свойствами, приведены в [6, 8, 32],

Работа по рассуждению о знаниях и рассуждениях проводилась на системе FOL [32], хотя большая часть соображений об использовании метауровневой архитектуры для рассуждения о рассуждениях и знаниях носит общий характер.

Агент в системе FOL может быть реализован как множество контекстов. База знаний, содержащая знания данного агента, воплощена е базовом контексте или контексте объектного уровня. При этом другие контексты объектного уровня представляют знание данного агента о знаниях других агентов. Контексты и мстаконтексты имеют одну и ту же структуру; атрибут «мета» подчеркивает, что контекст содержит описание некоторого другого контекста. Таким образом, имеется возможность строить иерархии контекстов, в которых метаконтексты описываются посредством мета- метаконтекстов и т. д.

Контекст дает конечное представление о некоторой теории первого порядка, в которой знания могут быть выражены в форме аксиом в языке логики первого порядка и путем задания частичной модели этой теории, называемой моделирующей структурой. Эта моделирующая структура устанавливает связь интерпретации, выраженной как функции и структуры данных функционального языка, подобного языку Лисп, с некоторыми символами этой теории.

При заданной двоякой форме выражения знаний проводимая дедукция должна принимать во внимание обе спецификации, которые в FOL получили название синтаксической и семантической. В системе FOL имеются различные типы блоков рассуждения, называемые вычислителями (evaluators), которые могут делать заключения либо из синтаксических, либо из семантических знаний. Синтаксические вычислители реализуют стандартные процедуры дедукции в логике первого порядка: перезапись уровней и обнаружение тавтологий. Семантический вычислитель проверяет на удовлетворимость частичную модель, определенную интерпретациями, ассоциированными с символами этой теории. Мощным средством построения рассуждений в системе FOL является системный вычислитель FOL, который извлекает пользу из семантического и синтаксического знаний, комбинируя семантическое вычисление и синтаксическую перезапись. Подробное описание системного вычислителя FOL приводится в [26].

Подобно любому контексту, мстаконтекст в FOL имеет синтаксическую и семантическую компоненту, но так как он отсылается к частям самой системы, то в качестве структур данных, используемых в этой моделирующей структуре, могут использоваться те структуры, с помощью которых система реализована. Например, при спецификации некоторого мета-контекста константному символу, обозначающему правильно построенную формулу сорта, может быть придана интерпретация в этой моделирующей структуре посредством той структуры данных, которая создана системой для представления правильно построенной формулы контекста объектного уровня. В других вариантах метауровневой архитектуры вводятся иные отношения имён между символами этого метауровня и объектами, представляющими базовый уровень [8, 15]; своеобразие системы FOL заключается в том, что она характеризует структуры данных как частичную модель метатеории, представленной мета-контекстом, поэтому отношение между объектным уровнем и метауровнем — это не только отношение имен. Структуре данных объектного уровня придается когнитивная оценка в терминах интерпретаций символов в мета контексте. Более того, системный вычислитель FOL производит выбор уровня, на котором выполняются вычисления с использованием функций в этой моделирующей структуре вместо метауровней синтаксической спецификации, тем самым обеспечивая эффективное выполнение метауровневых спецификаций.

Проблемы, возникающие при построении рассуждений о знаниях и рассуждениях, хорошо иллюстрируются на примере простой головоломки, известной среди специалистов по искусственному интеллекту как задача о трех мудрецах. Как-то король, пожелавший выяснить, какой из трех мудрецов самый мудрый, сказал им, что один колпак на голове одного из них белый. Учитывая, что один мудрец может увидеть колпаки других, но не свой, король спросил первого мудреца, какой цвет — черный или белый — имеет его колпак. Тот ответил, что не знает; второй мудрец на тот же вопрос дал такой же ответ. И тогда третий мудрец ответил, что колпак на нем белый.

Эта головоломка является примером лояльных друг к другу, но не кооперирующих агентов: они просто отвечают на заданный вопрос, не объясняя пути своего рассуждения, что могло оказаться полезным для других агентов.

Знания каждого мудреца представляют структуру, состоящую из трех теорий объектного уровня и одной метатеории: Эту структуру мы называем агентом. Первая теория объектного уровня ownTL содержит собственные знания агента, а остальные две (Tj) содержат знания, о которых агенту А: известно, что ими располагает агент А^. В дополнение к ним каждый агент имеет метатеорию, называемую МТ|% в которой представлено знание для рассуждения о знаниях и рассуждениях других агентов.

Метатеория агента связана со всеми теориями объектного уровня, и для каждой образовавшейся пары осуществляются принципы рефлексии. Смысл этой связи оказывается разным для ownTj иТ|: в первом случае она позволяет выводить собственные убежде-

ния агента, во итором ■— заключения, которые могли бы вывести для себя другие агенты. Наш агент может и не соглашаться с этими заключениями, которые могут противоречить его убеждениям.

Теории объектного уровня содержат аксиомы, представляющие знания, которые имеются (или про которые изнестно, что они имеются) у мудреца. Каждая из них содержит аксиому, выражающую то ограничение, что котя бы на одном из мудрецов белый колпак:

atleast: while! V white2Vivhite3 где константа whitel интерпретируется так; цвет колпака первого мудреца — белый.

Каждая ownT; представляет то, чтб этот мудрец может видеть. Например, ownT, содержит также аксиомы whitc2 white3

Знания относительно других мудрецов, представленное в Т], первоначально ограничено аксиомой atleast и общим представлением о двух агентах. Например, в Т^ мы имеем факт whitel (белый Г), который, как известно третьему агенту, является фактом, известным и второму агенту.

Предикат THEOREM (T, 4v') используется для обозначения: формула W является логическим следствием теории Т. В соответствии с принципами рефлексии, если формула w утверждается в теории Т, то THEOREM (T, 'w') выполняется в соответствующей метатеории.

Предикат KNOWS (A, 'w') описывает знания агента, касающиеся других агентов. KNOWS никогда не ссылается на собственные знания агента, которые представлены в его ownT,, На самом деле значение предиката KNOWS отлично от модального оператора L, поскольку он ссылается па знания, выведенные в результате рассуждений о рассуждениях. Предикат KNOWS отличается от предиката THEOREM тем, что известному можно и не доверять (см. аксиому knows).

Все переменные относятся к символам метатеории, нижний индекс i означает, что эта метатеория имеется в метатеории каждого агента, где каждое вхождение i заменяется номером этого агента, т. е. цифрой 1, 2 или 3 соответственно. Верхний индекс j обозначает агента . о котором ведется рассуждение.

Эта аксиома" связывает знание о других агентах, выраженное предикатом KNOWS, с соответствующей теориеЙТ}. Ока используется при рассуждениях о знаниях других агентов, ведущих к заключениям, которые могут быть представлены е Т|, и для будущих логических выводов.

confidence: Vw.THEOREM (T{, w)A

—.THEOREM (own!., mknot (w)) =->THEOREM (ownT,, w)

Эта аксиома используется в случае, когда агент проникается доверием к следствиям, к которым он пришел путем рассуждений о знаниях другого агента. Аксиома knows имеет форму аксиомы необходимости в модальных системах Ка=.а; она выражает более конкретное свойство рассуждения о рассуждении и необходима для поддержания представления знания других агентов. Аксиома confidence напоминает модальную аксиому Ка=>а; она используется для ввода в теорию ownTj i-ro агента фактов, представленных к Т]. т. е. фактов, присутствующих в представлении, которое i-й агент имеет об агенте А..

reason:Vwlw2. ANSWERS (A w l,don!kno\v) A THEOREM (add (w2. Tj), wl)A ACCEPTVIEW (A-, w2) = ;KNOWS (A , mknot (w2))

ANSWERS (Aj, wl, dontknow)* используется для представления ответа «я не знаю», даваемого агентом А., когда его спрашивают о wl, в частности о цвете его колпака. ANSWERS может быть легко определен через KNOWS:

V  w.ANSWERS(A,w,yes)=KNOWS(A,w)

V  w.ANSWERS(A,w,no}sKNOWS(A,mknot(w))

V  w.ANSWERS(A, w, dontknow)^ - KNOWS (A, w)A

-< KNOWS (A, mknot(w))

THEOREM (add(w2, Tj, wl) проверяет, в состоянии ли агент А. вывести wl при условии, что он знает w2.

Предикат ACCEPTVIEW(A,w) проверяет приемлемость гипотезы относительно точки зрения этого агента. Для того, чтобы некоторая формула была приемлемой для агента А, она не должна отсылаться к цвету колпака того же самого агента, поскольку предполагается, что он не должен знать цвета своего колпака. Отсюда в случае А£:

yw. ACCEPTVIEW (A, ,w)= --OCCURS(whitel,w). то есть w ке упоминает whitel.

Аксиома reason определяет способ рассуждения путем противоречия при дедукциях, которые могут выполняться другими агентами. Этот факт может быть выведен из утверждений о полноте конкретных подтеорий, как показано в [4]. Аксиома reason используется, например, для моделирования рассуждения второго мудреца о первом: "Если первый мудрец не знает whitel, а я знаю, что он может доказать whitel при виде двух черных колпаков, то я могут сделать вывод: ему известно, что одновременно они оба черными не являются».

Из условий ANSWERS (Aj.wl, dontknow) и THEOREM(add(w2, TJ),wl) следует недоказуемость w2 в Tj, поскольку Tj непротиворечиво и правдиво, хотя и не полностью, представляет знания А . Определение reason требует полноты теории Т] или предположения о замкнутом мире, поскольку недоказуемость w2 ведет к предположению —■ w2. На самом деле теории, предсташшющие знания мудреца, неполны, поскольку, например, в ownT, мы не можем доказать ни whitel, ни —. whitel; но обсуждаемое условие полноты теории может быть ослаблено проверкой того, что w2 выражает приемлемую точку зрения агента AfI которая дается предикатом ACCEPTVIEW. Все это приводит к заключению (как это и сформулировано в определении предиката ACCEPTVIEW): взгляд любого агента на окружающий его мир, за исключением цвета его колпака, является объективным.


Постоянный адрес статьи:
http://swsys.ru/index.php?page=article&id=1397&lang=
Версия для печати
Статья опубликована в выпуске журнала № 1 за 1990 год.

Возможно, Вас заинтересуют следующие статьи схожих тематик: