Авторитетность издания
Добавить в закладки
Следующий номер на сайте
Архитектура интегрированной системы управления базами данных и базами знаний
Аннотация:
Abstract:
Авторы: Горанов Д.В. () - , Пенкин Д.Д. () - | |
Ключевое слово: |
|
Ключевое слово: |
|
Количество просмотров: 12452 |
Версия для печати |
Информационное обслуживание конечных пользователей связано с эффективным хранением и обработкой больших массивов данных, отображающих структуру пользовательских предметных областей. В общем случае оно включает множество взаимосвязанных задач, относящихся к приложениям двух типов: • приложения, связанные с решением структурируемых проблем в отображаемой предметной области; • приложения, связанные с решением неструктурируемых проблем в отображаемой области. Первый тип приложений связан с применением традиционной технологии обработки баз данных (БД). Приложения второго типа отличаются повышенной степенью интеллектуальности и базируются на использовании технологии баз знаний (БЗ). Эти приложения требуют обработки неструктурированных данных с использованием не полностью формализованных алгоритмов решения задач Следует отметить, что до настоящего времени не сформулированы общие правила и методы описания предметных областей и не созданы общие средства для решения структурируемых и неструктурируемых проблем, связанных с ними. Если в области технологии БД основные работы связаны с развитием теории реляционных баз данных, то этого нельзя сказать в отношении подходов к представлению знаний. Именно поэтому используют разнородные программные средства для поддержки технологии БД и БЗ. Это, с одной стороны, порождает дополнительные требования к квалификации пользователей традиционных систем управления базами данных (СУБД) для обработки сложных информационных структур, а с другой — проблемы, связанные с интеграцией различных программных сред. Базы знаний следует рассматривать как этап развития баз данных. Поэтому БЗ включают в себя как необходимый компонент базу данных. Интеграция средств управления БД и БЗ позволяет решить указанные проблемы и обеспечивает преимущества, обусловленные сохранением традиционной технологии работы конечных пользователей СУБД при расширении возможности поддержки нетрадиционных приложений. ОБОСНОВАНИЕ ВЫБРАННОГО ПОДХОДА К ИНТЕГРАЦИИ На практике проблему интеграции различных программных сред, обеспечивающих возможность поддержки и использования технологий БД и БЗ, можно решать на основе трех подходов: ■ создание специализированных средств управления данными и знаниями для конкретной прикладной системы; ■ создание для конкретной прикладной системы специализированных интерфейсных средств к традиционной СУБД; ■ расширение традиционной СУБД средствами поддержки и манипулирования знаниями. Первый подход имеет два существенных недостатка. Во-первых, требуются значительные ресурсы для разработки этих средств. При этом разрабатываются и такие компоненты, которые имеются в традиционных СУБД. Во-вторых, разработанные средства управления знаниями имеют обычно узкую область применения и трудно поддаются развитию и адаптации к требованиям других прикладных систем. При втором подходе традиционная СУБД используется как средство обслуживания прикладной системы для доступа к необходимым данным. Основная проблема заключается в конструировании интерфейса между прикладной системой и СУБД. Наш подход к разработке архитектуры и практической реализации интегрированной системы управления БД и БЗ построен на основе дальнейшего развития архитектуры универсальной интерактивной СУБД с динамически изменяющимися структурами TDB/1. Это позволило достичь следующих преимуществ: ■ интегрированное хранение БЗ и БД; ■ «дружественный» интерфейс с конечным пользователем на основе интерактивных средств СУБД; ■ обработка больших БЗ с использованием эффективных механизмов доступа к данным СУБД КОМПОНЕНТЫ ПРОГРАММНОЙ СРЕДЫ ПОДДЕРЖКИ ТЕХНОЛОГИИ БАЗ ЗНАНИЙ В общем случае программная среда поддержки БЗ включает следующие основные компоненты: • собственно БЗ; • процессор логического вывода (ПЛВ); • процессор пользовательского интерфейса (ПП). БЗ является формой организации программ и данных. Она содержит следующую информацию: • тексты на ограниченном естественном языке; • управляющие данные; • описания объектов и ситуаций. Важной проблемой создания БЗ является подход к представлению знаний. Удачно выбранный подход может существенно упростить реализацию БЗ. В базе знаний выделяют два класса знаний: • декларативные; • процедурные Декларативные знания включают факты, аксиомы /правила, относящиеся к данным фактам. Процедурные знания задают алгоритм обработки информации в базе данных и методы логического вывода. Процедурные знания могут иметь разную организацию. Большая часть программных систем, поддерживающих технологию баз данных, использует продукции (правила) вида «условие—действие». Процессор логического вывода выполняет- решение поставленной задачи на основе доступа к БЗ, при этом он строит и оценивает гипотезы, которые используются и для ее расширения. В общем случае ПЛВ может выполнять прямой, обратный или частичный вывод в зависимости от конечной цели доступа к БЗ. Прямой вывод реализуется от фактов к заключению, обратный — от заключения к фактам и частичный — от заключения и части фактов к остальным фактам. Процессор пользовательского интерфейса поддерживает взаимодействие с конечным пользователем. Он обеспечивает интерпретацию входных сообщений пользователя и их преобразование во внутренний формат, обратное преобразование и вывод результатов в удобной для пользователя форме. ПП ориентирован на организацию дружественного общения со всеми категориями пользователей на основе запросов, предусматривающих ответы ДА/НЕТ, а также и более сложные варианты диалога на естественном языке. Характеристики рассмотренных программных компонентов учитываются при расширении архитектуры системы управления базами данных. РАСШИРЕННАЯ АРХИТЕКТУРА СУБД ДЛЯ ПОДДЕРЖКИ БАЗ ЗНАНИЙ Предлагаемый подход для расширения архитектуры СУБД с целью поддержки баз знаний основан на использовании системы продукций представления знаний и может применяться для любой СУБД. Традиционная архитектура СУБД расширяется по горизонтали (рис. 1). Общее число архитектурных уровней (4) не изменяется, так как используются общие компоненты, реализующие интерфейс с конечным пользователем (I) и доступ на физическом уровне (IV). Остальные два уровня (II и III) декомпозируются, так как совмещение функций процессоров логического вывода и процессора баз данных нецелесообразно из-за снижения эффективности информационной обработки, а также большой трудоемкости расширения существующих компонентов СУБД. В расширенной архитектуре СУБД нашли отражение следующие принципы: ■ максимальное совмещение выполняемых функций на каждом архитектурном уровне с учетом эффективности обработки данных; ■ унифицирование средств манипулирования данными и знаниями; ■ интегрированное хранение знаний и данных. Главной целью декомпозиции второго и третьего архитектурных уровней является стремление предоставить конечному пользователю единый интерфейс к информации в БД и БЗ при сохранении требуемой эффективности. Представленная архитектура обеспечивает определенный уровень интеллектуальности СУБД и тем самым возможность оснащения традиционных информационных систем средствами поддержки более сложных информационных структур. Первый уровень СУБД, который доступен конечному пользователю, обеспечивает обработку различных пользовательских представлений, соответствующих его конкретным информационным потребностям. Знания представляются в виде отношений, описывающих зависимости между элементами отображаемых областей в терминах реляционной модели данных. Интерпретация продукций (правил) типа «условие—действие» реализуется как структуры над множеством фактов. Каждая структура описывает множество фактов, определяющих конкретное заключение. Второй и третий уровни декомпозируются в соответствии с запросом пользователя. На этих уровнях выполняемые функции разделяются между процессорами ПЛВ и РП, ПБЗ и ПБД. Необходимо отметить, что процессоры ПБЗ и ПБД взаимосвязаны стандартизированным интерфейсом с процессором физического доступа ПФД для обеспечения эффективности доступа как к базам данных, так и к базам знаний. РЕАЛИЗАЦИЯ РАСШИРЕННОЙ АРХИТЕКТУРЫ Рассмотренная архитектура использована при развитии программных средств СУБД TDB/1 (рис. 2). Для этого в состав СУБД TDB/1 включены два новых программных компонента — ПЛВ и ПБЗ. Для структурирования знаний из отображаемой предметной области используются правила продукций, которые обеспечивают вывод заключения относительно пользовательского запроса, описывающего конкретную ситуацию. Каждое правило продукции определяется как пара <факты, заключение>. Таким образом, правило продукции состоит из части, задающей описание ситуации в предметной области, и части, определяющей промежуточное или конечное заключение. ПЛВ обеспечивает вывод различными способами. В случае неопределенности конкретной ситуации выполняется прямой вывод, при котором реализуется доступ ко всей БЗ. Обратный и частичный логический выводы выполняются для опровержения или подтверждения гипотезы без обработки всей базы знаний. ПБЗ обрабатывает правила продукций как ассоциативные кортежи. БЗ представляется в виде таблицы, содержащей множество ассоциативных кортежей, каждый из которых может содержать переменное число компонентов и представляет неструктурированное знание из предметной области. Над ассоциативными кортежами выполняются те же операции добавления, исключения и модификации, что и над обычными кортежами, обрабатываемыми ПБД. Поэтому на пользовательском уровне нет принципиальной разницы между таблицами, отображающими знания, и таблицами, содержащими данные. Таким образом, пользователи могут использовать адекватным способом предоставленные интерфейсные средства СУБД TDB/1 для сопровождения и развития БЗ. Представленный подход развития архитектуры традиционной СУБД прошел практическую проверку и показал, что он достаточно полно удовлетворяет потребности конечных пользователей при обработке сложных информационных структур, позволяет сократить сроки внедрения технологии БЗ благодаря использованию существующих программных систем. Это и является основой его экономической эффективности, выражающейся в снижении стоимости и сокращении сроков разработки программного обеспечения БЗ, а также исключение расходов, связанных с закупкой новых программных средств, обучением пользователей и обслуживающего персонала. |
Постоянный адрес статьи: http://swsys.ru/index.php?page=article&id=1370&lang= |
Версия для печати |
Статья опубликована в выпуске журнала № 2 за 1989 год. |
Возможно, Вас заинтересуют следующие статьи схожих тематик:
- Интерактивная процедура построения модели тренда для экономических показателей
- Искусственный интеллект в грядущем десятилетии
- Анализ отечественного опыта и структуризация механизмов управления оборонным научно-промышленным комплексом
- Использование матричных квадродеревьев для хранения площадных картографических объектов
- Исследовательское проектирование в кораблестроении на основе гибридных экспертных систем
Назад, к списку статей