Авторитетность издания
Добавить в закладки
Следующий номер на сайте
Производство знаний в предметно-ориентированной системе научной осведомленности
Аннотация:
Abstract:
Авторы: Туманов В.Е. (tve@icp.ac.ru) - Институт проблем химической физики РАН, г. Черноголовка, кандидат химических наук | |
Ключевые слова: интернет, центр профессиональной компетенции, web, архитектура приложения |
|
Keywords: Internet, , , |
|
Количество просмотров: 14109 |
Версия для печати Выпуск в формате PDF (8.40Мб) |
В результате научных исследований и компьютерного моделирования химиками накоплены массивы научных данных о химических реакциях (константах скорости, энергиях активации, энтальпиях реакции), о реагентах (молекулах, ионах и радикалах) и их физико-химических характеристиках (энтальпиях образования молекул и радикалов, потенциалах ионизации и т.д.). Эти данные объединяются в электронные коллекции данных и публикуются в Интернете на основе портальных технологий. Часто в такие порталы встраиваются приложения для первичной обработки данных (например, расчет теплоемкости [1]).
Задачи организации таких данных для интеллектуального анализа и исследования с целью нахождения новых зависимостей приводят к необходимости разработки и создания на основе современных информационных технологий в Интернете центров профессиональной компетенции для сообществ заинтересованных исследователей и пользователей. Подобные центры компетенции должны стать местом сбора, хранения, обработки и производства новых профессиональных знаний. Целью настоящей статьи является обсуждение программно-аппаратной архитектуры хранилищ знаний (ХЗ) для предметно-ориентированных систем научной осведомленности. Предметно-ориентированные системы научной осведомленности. Одним из подходов представления научных данных и их анализа в электронных центрах профессиональной компетенции является разработка систем научной осведомленности по аналогии с системами деловой осведомленности или бизнес-аналитики. В работе [2] отмечается, что создание таких систем является результатом выполнения крупномасштабных проектов, в которых участвуют десятки и сотни научных организаций. Однако в отдельных научных организациях в рамках научно-исследовательских проектов могут быть созданы предметно-ориентированные системы научной осведомленности [3,4], которые отличаются узкоспециализированной предметной областью знаний, гибкой программно-аппаратной архитектурой и включают в себя активные элементы производства новых знаний – интеллектуальные агенты и встроенные экспертные системы. Такие предметно-ориентированные системы научной осведомленности могли бы рассматриваться как узлы распределенного центра профессиональной компетенции в сети Интернет. Определение 1. Предметно-ориентированная система научной осведомленности есть информационная инфраструктура, которая обеспечивает интеллектуальный анализ данных, принятие решений, производство новых знаний и совместную работу научного сообщества в рамках выделенной узкоспециализированной профессиональной области. Центральным компонентом предметно-ориентированных систем научной осведомленности является ХЗ. ХЗ предметно-ориентированных систем научной осведомленности. Прежде напомним определение хранилища данных (ХД) [5]. Под ХД понимается предметно-ориентированная, интегрированная, неизменяемая и поддерживающая хронологию электронная коллекция данных для поддержки принятия решений. Подобно ХД, ХЗ может рассматриваться как предметно-ориентированная, интегрированная, содержащая временные ряды и поддерживающая процесс принятия решений электронная коллекция. Однако в отличие от ХД ХЗ является комбинацией неизменяемых и изменяемых объектов и компонент, где хранятся не только данные, но и знания предметной области. В процессе исследования данных методами интеллектуального анализа полученные знания могут изменяться. Так, могут измениться параметры центра кластера в зависимости от поступления новых данных или используемого алгоритма кластеризации. Или может быть уточнен вид зависимости в данных. Например, параболический тренд может оказаться справедливым только в определенном интервале, а вне этого интервала будет иметь место линейный тренд. Компонент производства знаний может генерировать данные, которые являются прогнозом значений некоторого параметра, но экспериментального подтверждения не имеют, то есть знания, хранимые в ХЗ, могут изменяться и дополняться в результате его эксплуатации. Определение 2. ХЗ есть предметно-ориентированная, интегрированная, поддерживающая временные ряды данных электронная коллекция, которая содержит данные, знания, процедуры генерирования знаний и используется для анализа и исследования данных, производства новых знаний и поддержки принятия решений. Данное определение является расширением определения, приведенного в [6]. Существенное отличие настоящего определения состоит в добавлении в ХЗ компонент интеллектуального анализа данных и средств генерирования знаний. Общая программно-аппаратная архитектура ХЗ приведена на рисунке 1. Как видим, ХЗ включает хранилище данных для исследования, содержащее неизменяемые во времени данные (экстенсиональный фрагмент ХД), базу знаний выделенной предметной области, встроенные механизмы производства профессиональных знаний, хранилище производных данных (интенциональный фрагмент ХД), интерфейс пользователя и интерфейс эксперта. Интерфейс пользователя предназначен для выборки и распространения знаний, а интерфейс эксперта – для производства новых знаний. Предметно-ориентированная система научной осведомленности по физической химии радикальных реакций включает в себя информационный ресурс и компонент производства новых профессиональных знаний (ХЗ). В состав информационного ресурса системы входят базы данных: литературных источников, по энергиям диссоциации связей, по энтальпиям молекул и радикалов, а также подсистема дистанционного обучения. В состав ХЗ как компонента производства новых профессиональных знаний входят (рис. 2): · ХД для исследования, содержащее экспериментальные данные по реакционной способности радикальных реакций в жидкой фазе; · встроенная экспертная система для управления оценкой реакционной способности радикальных реакций; · интеллектуальный агент для оценки константы скорости и энергии активации реакции в жидкой и газовой фазах; · веб-сервис, посредством которого осуществляется вызов обученных искусственных нейронных сетей для прогнозирования значений констант скорости и энергии активации жидкофазных радикальных реакций определенных классов; · ХД, содержащее рассчитанные данные по реакционной способности радикальных реакций в жидкой и газовой фазах; · база знаний, содержащая продукционные правила и факты, используемые встроенными экспертными системами. В результате работы пользователей системы ХЗ пополняются новыми профессиональными знаниями. В качестве механизмов производства новых знаний в настоящей системе используются встроенные экспертные системы, обученные искусственные нейронные сети и интеллектуальные агенты. Как показала опытная эксплуатация макета системы, использование встроенных экспертных систем в ХЗ оправданно в тех случаях, когда можно использовать знания экспертов или получить такие знания в процессе интеллектуального анализа данных, что является трудоемким по времени процессом. Более перспективным оказалось использование искусственных нейронных систем, которые лучше аппроксимируют зависимости в данных и дают более точный прогноз реакционной способности. Однако искусственные нейронные сети не всегда можно обучить из-за отсутствия достаточного набора данных. Поскольку предполагается, что система научной осведомленности будет опубликована в сети Интернет и открыта для коллективного использования профессиональным сообществом, остается актуальным вопрос контроля качества выводимых в системе новых знаний. В настоящее время при попытке сохранить в системе полученные знания предусмотрено заполнение анкеты, в которой пользователь комментирует обоснованность полученного результата. Вопрос автоматического контроля производимых новых знаний требует отдельного исследования и пока остается открытым. Публикация в сети Интернет предметно-ориентированной системы научной осведомленности по физической химии радикальных реакций даст возможность химикам-исследователям, химикам-технологам, студентам, аспирантам и преподавателям вузов получить доступ к активным электронным информационным ресурсам по реакционной способности радикальных реакций в жидкой фазе, энергиям диссоциации связей и энтальпиям образования органических соединений и, в частности, наполнять ХЗ новой информацией. Разработка и публикация в Интернете предметно-ориентированных систем научной осведомленности на основе использования ХЗ позволит научному сообществу создавать распределенные сети для сбора, хранения, распространения и производства предметно-ориентируемых фундаментальных знаний. Список литературы 1. NIST Standard Reference Database 19A. Positive Ion Energetics. Ver. 2.02. 1994. 2. Hackathorn R. Science Intelligence. Can a Business Intelligence Approach Enable «Smart» Science? DM Review. 2005 (http://www.DMReview.com). 3. Dong Q., Yan X., Chirico R.D., Wilhoit R.C., Frenkel M. Database Infrastructure to Support Knowledge Management in Physicochemical Data. // 18-th CODATA Conference. 2002, Sep. 29 – 3 Oct., Montreal, Canada, 36 p. 4. Tumanov V.E. Data Warehousing and Data Mining in Thermochemistry of Free Radical Reactions. // Fourth Winter Symposium on Chemometrics «Modern Methods of Data Analysis». Russia. Chernogolovka. February. 15–18. 2005, pp. 28–29. 5. Inmon W.H. Building the Data Warehouse. John Wiley, 2004, 3nd Ed. – 412 p. 6. Firestone J.M. Enterprise Information Portals and Knowledge Management. Butterworth-Heinemann. 2002. – 422 p. |
Постоянный адрес статьи: http://swsys.ru/index.php?page=article&id=1628 |
Версия для печати Выпуск в формате PDF (8.40Мб) |
Статья опубликована в выпуске журнала № 4 за 2008 год. |
Возможно, Вас заинтересуют следующие статьи схожих тематик:
- Кроссплатформенная поисковая мультиагентная система
- Информационная среда Ульяновского государственного технического университета
- Интернет, генофонд, геном
- Облачные технологии в компьютерном моделировании научных и инженерных задач
- Информационная интеллектуальная система для разработки схем производства твердых лекарственных форм
Назад, к списку статей