На правах рекламы:
ISSN 0236-235X (P)
ISSN 2311-2735 (E)

Авторитетность издания

ВАК - К1
RSCI, ядро РИНЦ

Добавить в закладки

Следующий номер на сайте

4
Ожидается:
13 Декабря 2024

Компьютерная поддержка построения онтологий

Статья опубликована в выпуске журнала № 2 за 2006 год.
Аннотация:
Abstract:
Автор: Шильников П.С. () -
Ключевое слово:
Ключевое слово:
Количество просмотров: 11807
Версия для печати
Выпуск в формате PDF (1.41Мб)

Размер шрифта:       Шрифт:

Онтологии, претендующие на роль единого междисциплинарного подхода к описанию разных предметных областей, приобретают все большую популярность. В простейшем случае онтология определяется как некоторый общий словарь понятий, используемый в качестве кирпичиков в системе обработки информации [1]. По сути, онтологии обеспечивают структурную спецификацию и формализованное представление предметной области в виде понятий и связей между ними.

Термин «онтология» весьма многозначен: под это определение подпадают многие понятийные структуры: семантические сети и когнитивные карты в искусственном интеллекте, таксономия в теории классификации, иерархия классов в объектно-ориентированном программировании, концептуальные схемы данных в теории баз данных и пр. [2,3]. Соответственно, в разных областях предлагаются различные инструментальные средства поддержки построения онтологий, например, визуальные конструкторы онтологий [3], таксономические средства формирования корпоративной памяти и пр. В целом, пока наблюдается «расхождение» различные подходов и средств построения онтологий. На наш взгляд, необходимо построение стандарта на онтологии. Здесь в качестве базового инструмента предлагается взять средства широкого известного стандарта ISO 10303 STEP [4].

Целью данной работы является анализ основных идей концепции CALS и средств стандарта STEP в плане организации компьютерной поддержки построения онтологий.

Концепция CALS (Continuous acquisition and life-cycle support), означающая непрерывную компьютерную поддержку всего жизненного цикла изделия, лежит в основе создания единого информационного пространства предприятий. В этой концепции выделяются три взаимосвязанных аспекта.

1. Увеличение числа задач, решаемых с применением автоматизированных систем. Это связано с ростом числа прикладных программных продуктов (приложений), относящихся к разным предметным областям и создаваемых независимыми друг от друга производителями.

2. Интеграция различных продуктов, достижение их интероперабельности. Здесь основным направлением является интероперабельность в отношении данных, то есть совместимость данных, создаваемых и принимаемых приложениями. Наиболее трудоемкой задачей при этом является обеспечение совместимости данных не на физическом и логическом уровнях, а на концептуальном уровне.

3. Применение средств интеграции данных для повышения эффективности бизнес-процессов: внедрение PDM-технологий, то есть технологий управления проектными данными, реализации стратегий всеобщего управления качеством TQM и реинжиниринга.

Решающим направлением является обеспечение совместимости данных, поскольку без этого все попытки повышения эффективности бизнес-процессов будут бессмысленными.

Построение концептуальной схемы данных является непростой задачей. Это объясняется тем, что реальные объекты обладают бесконечным разнообразием свойств (причем в мире не существует двух идентичных объектов). Следовательно, и описание объектов через ограниченный набор свойств и их классификация являются условными.

Проблему классификации объектов можно разделить на два уровня: группирование объектов с одинаковыми наборами свойств; группирование объектов с одинаковыми значениями свойств. Уровень 1 обеспечивается средствами описания концептуальных схем данных, а уровень 2 – средствами каталогизации. Для построения концептуальных схем данных чаще всего используется методология SADT; другим показательным примером служит методология построения унифицированных процессов RUP (Rational unified process), разработанная фирмой «Rational Software» и ориентированная на применение универсального языка моделирования UML[5)].

Опишем методику построения концептуальных схем данных в стандарте ISO 10303 STEP (рис. 1) [4].

Эта методика предусматривает, что самые общие понятия, инвариантные к предметной области (например, «изделие», «персона», простейшие геометрические объекты, процессы, материалы и т.д.), определяются заранее. Она складывается из следующих шагов.

Шаг 1. Строится функциональная модель работы приложений, обеспечивающих автоматизацию деятельности в данной предметной области («Модель деятельности в прикладной области»). Данная модель представлена в виде IDEF0-диаграммы. Входами и выходами функциональных блоков являются информационные объекты, соответствующие пакетам данных, которыми обмениваются между собой приложения. В стандарте STEP пакет данных называется элементом функциональной модели UoF (Unit of functiona­lity).

Пример функциональной модели в области «Проектирование» приведен на рисунке 2.

Шаг 2. На основе полученной функциональной модели выполняется детальная проработка данных. Необходимо определить, из каких элементов данных состоит каждый пакет данных (информационных объектов), соответствующих стрелке на функциональной диаграмме.

Такая концептуальная схема данных в терминах предметной области называется справочной моделью прикладной области.

Среди набора элементов данных под идентификатором понимается внешний символьный идентификатор, принятый в разработке и производстве изделий (например, «224.00700.210-57»), а не формальный идентификатор, обозначающий сущность или экземпляр сущности.

Шаг 3. Элементы данных могут представляться отдельными атрибутами сущностей. Например, идентификатор (единичную символьную строку) естественно представить его в виде одного атрибута сущности. Материал, обладающий некоторым фиксированным набором свойств (наименование, плотность, прочность, теплопроводность и т.д.), лучше представить в виде одной сущности, атрибуты которой отображают эти отдельные свойства. Для представления более сложных информационных объектов, например, технологических процессов,  требуется несколько сущностей.

Шаг 4. Переработанные таким образом данные затем интерпретируются с помощью информационных ресурсов. Такая концептуальная схема данных в стандартных терминах называется «Интерпретированная модель прикладной области».

В более ранних вариантах описанной выше методики допускалось представление справочной модели предметной области с помощью диаграмм Чена или с помощью IDEF1x. Однако в связи с тем, что в STEP принят объектный подход, предпочтение отдается языку EXPRESS – мощному средству для формального представления концептуальных схем данных.

Согласно стандарту ISO 10303 STEP, текст концептуальной схемы данных для возможности работы с соответствующими EXPRESS-определе­ниям экземплярами данных подвергается программной обработке, называемой «компиляцией». Результатом компиляции EXPRESS-схемы является словарь данных. Правила построения словаря данных даны в одном из разделов STEP – общие определения стандартного интерфейса доступа к данным (SDAI).

Новые возможности автоматизации процесса разработки онтологий в рамках STEP возникают в связи с появлением проекта протокола системотехнических приложений (AP233 – System engineering and design). На рисунке 3 представлен состав концептуальной схемы данных протокола системотехники. Такой состав обеспечивает возможность следующего сценария работ: 1) с помощью интерактивных графических средств создается модель в определенной графической нотации; 2) построенная визуальная модель отображается в структуры данных, использующие те сущности, которые позволяют строить модели в данной нотации. При этом некоторые из сущностей могут одновременно использоваться в нескольких нотациях.

В STEP также возможно построение метаонтологий (sdai_dictionary – словарь SDAI) [4]. Метаонтология строится при помощи тех же средств, что и непосредственно онтологии и прикладные модели. Следовательно, первоначально построенная функциональная модель предметной области может быть преобразована в словарь данных справочной модели предметной области, а по словарю может быть восстановлена концептуальная схема данных.

В целом можно заключить, что сегодня достигнут большой прогресс в отношении интероперабельности средств представления геометрической формы и структуры (конструкторского графа) изделия, в то время как по данным системотехники достижения куда более скромные. Хотя и существуют системотехнические прикладные программные продукты (Design IDEF, BRWin, ERWin, Rational Rose и т.д.), данные, с которыми они работают, несовместимы между собой. Кроме того, сами программные продукты несовместимы с программными продуктами других классов (CAD, CAE, PDM и т.д.).

Список литературы

1.   Мизогучи Р. Шаг в направлении инженерии онтологий// Новости искусственного интеллекта.–2000.– №1-2.– С.11-36.

2.   Смирнов С.В. Онтологический анализ предметных областей моделирования // Изв. Самарского науч. центра РАН. - 2001. - Т.3. - № 1. - С. 62-70.

3.   Гаврилова Т.А., Веремьев В.Л. Управление знаниями как корпоративная стратегия автоматизации// Сб. науч. тр. VI науч.-практ. конф.: Реинжиниринг бизнес-процессов на основе современных информационных технологий. Системы управления знаниями. – М.: МЭСИ, 2002. – С.218-224.

4.   ISO TC 184/SC4 N535:1998(E) Guidelines for the development and approval of STEP application protocols

5.   Калянов Г.Н. Моделирование, анализ, реорганизация и автоматизация бизнес-процессов. – М.: Финансы и статистика, 2006.


Постоянный адрес статьи:
http://swsys.ru/index.php?page=article&id=510
Версия для печати
Выпуск в формате PDF (1.41Мб)
Статья опубликована в выпуске журнала № 2 за 2006 год.

Возможно, Вас заинтересуют следующие статьи схожих тематик: