Напольских Д.Л. (NapolskihDL@yandex.ru) - Поволжский государственный технологический университет (доцент), Йошкар-Ола, Россия, кандидат экономических наук | |
Ключевые слова: Web ontology language, protege, тезаурус, специализированная онтология, семантические технологии, граф знаний, цифровизация управления регионом, кластеризация |
|
Keywords: Web ontology language, protege, thesaurus, specialized ontology, semantic technologies, knowledge graph, region management digitalization, clusterization |
|
|
Введение. В настоящее время для решения научных и практических задач активно реализуется потенциал интеллектуальных систем, построенных на основе семантических технологий. Процессы цифровизации экономики и государственного управления обусловливают активное внедрение семантических технологий в различные предметные области знаний. Кластеры и кластерная политика представляют собой недостаточно структурированную область знаний, содержащую противоречивую информацию о кластерах, обусловленную различным контекстом употребления кластерной терминологии [1]. Формирование базы знаний о кластерной политике на основе открытых источников данных о квазикластерах, зачастую не соответствующих научной концепции кластера, может привести к подмене понятий и формальным выводам о процессах кластеризации эконо- мики [2]. Поэтому возрастает актуальность формализации научной концепции кластера на основе семантических технологий [3, 4]. Семантические сети являются наиболее перспективной формой постановки и решения сложных научно-практических задач социально- экономического развития. Возрастающая значимость больших данных и сквозной характер технологий искусственного интеллекта актуализируют задачи интеграции информации, получаемой в разных форматах и из различных баз знаний, с помощью семантических сетей [5]. Ключевым преимуществом семантических сетей по сравнению с классическими БД является их изначально полуструктурированная модель, позволяющая рассматривать объекты и явления в контексте различных областей знания. Концепция графов знаний [6] получила дальнейшее развитие в виде таких универсальных баз знаний, как Wikidata и Metaphactory, а также ряда специализированных графов знаний, среди которых можно выделить граф знаний компании Siemens (эксплуатация промышленного оборудования), Statoil (добыча нефти и газа), Pinterest (таргетированная реклама), BioPortal (медицина и биотехнологии) и другие. Основой (моделью) методологически грамотного построения семантических сетей являются онтологии [7]. Для формализации специализированных знаний о различных предметных областях используются онтологии, являющиеся формой целостного представления системы знаний в рамках конкретного домена (предметной области) с помощью построения иерархии понятий (классов) и структуры отношений между ними [8]. Разработано достаточное количество различных программных средств для создания и редактирования онтологий, среди которых можно выделить фреймворк Protégé [9], а также библиотеку Owlready2 для языка Py- thon [10]. Сегодня существует большое число как универсальных, так и специализированных онтологий, представляющих различные области социально-экономической деятельности [11, 12]. Примерами универсальных онтологий верхнего уровня являются система организации знаний SKOS (Simple Knowledge Organization System), разработанная Консорциумом Всемирной паутины, общая формальная онтология GFO (General Formal Ontology), разработанная Генрихом Эрре и Барбарой Хеллер, базовая формальная онтология верхнего уровня BFO (Basic Formal Ontology), разработанная Барри Смитом. К специализированным относятся онтологии – библиографических описаний книг и периодических изданий (BIBO); – транспортных потоков товаров компаний (SCTG); – для описания различных организаций (The Organization Ontology); – товаров (RosettaNet); – для описания персон (FOAF); – медицинская (Galen); – объектов культурного наследия (CIDOC CRM). В качестве примеров лингвистических онтологий (тезаурусов, представляющих собой иерархическую сеть понятий) можно выделить BabelNet, WordNet и Sensus, а также российские проекты РуТез и YARN. Таким образом, создание онтологии домена «Кластеры» обусловлено задачей расширения технологического инструментария субъектов кластерной политики, в частности, механизмов обработки на основе интеллектуальных систем метаданных, необходимых для эффективной реализации государственной кластерной политики. Разработка специализированной предметной онтологии кластера расширяет возможности решения задач кластерной политики за счет анализа больших объемов информации из различных баз знаний [13]. Процесс разработки предметной онтологии домена «Кластеры» состоит из следующих этапов: – определение перечня основных классов понятий онтологии домена «Кластеры»; – формирование таксономической иерархии предметной онтологии; – разработка структуры составных понятий, входящих в онтологию; – определение отношений между элементами онтологии. Данная последовательность может применяться для разработки специализированных онтологий с целью представления других эконмических концепций и теорий. Методология исследования В рамках исследования использовалась следующая совокупность семантических технологий, объединенных единым методологическим каркасом: онтологический язык OWL второй версии, редактор онтологий и фреймворк для построения баз знаний Protégé [14], програм- мные инструменты работы с онтологиями (резонеры и др.). Инструментарий разработки онтологии для представления экономической концепции кластера показан на рисунке 1. Сегодня основным стандартизированным языком описания онтологий для семантических сетей, поддерживаемым практически всеми инструментами моделирования онтологий, является OWL. Созданный на основе языка Java редактор онтологий Protégé существенно упрощает процесс создания онтологий, объединяя в рамках единого приложения различные инструменты по формированию иерархии классов и отношений, построению графов и т.д. Редактор онтологий Protégé позволяет использовать OWL, формировать до- кументы на основе языков разметки HTML и XML. Высокоуровневый язык Python, используемый в качестве языка общего назначения, также может эффективно применяться при ра- боте с рассматриваемой онтологией. Являясь мультипарадигмальным языком, Python поддерживает решение задач как структурного, так и объектно-ориентированного программирования [15]. Специализированная библиотека Owlready2 существенно расширяет продуктивность использования Python при работе с онтологиями, особенностью Owlready2 являются управление объектами онтологии как обычными объектами Python. Также Owlready2 поддерживает использование SPARQL-запросов и механизмов рассуждений (reasoners) [16]. Результаты исследования В рамках онтологии домена «Кластеры» рассматриваются основные экономические понятия, относящиеся к концепции кластера, а также различные виды территориальных экономических систем. Обязательное требование к представлению предметной области в виде онтологии состоит в формировании тезауруса (глоссария), охватывающего основные понятия и термины в рамках исследуемой предметной области. При разработке онтологии домена «Кластеры» с целью конкретизации области знаний был выделен отдельный класс «Неэкономические кластеры», включающий кластеры, изучаемые естественнонаучными дисциплинами (кластеры галактик, кластеры молекул и др.). Для исключения двусмысленной интерпретации используемых экономических понятий для каждого класса через rdfs:isDefinedBy было дано определение, а в разделе Description для каждого класса проведено разграничение непересекающихся классов через предикат Disjoint With. Пример ввода определения для класса «Субъект инновационной деятельности» в редакторе Protege представлен на рисунке 2. Классы понятий являются центральным элементом онтологии домена знаний «Кластеры», большинство рассматриваемых в онтологии классов имеют несколько подклассов, являющихся в большей степени конкретизированными понятиями, чем их надкласс. Верхний уровень таксономической иерархии предметной онтологии домена «Кластеры» представлен на рисунке 3. Структура таксономических отношений «A Kind Of» (АКО), определяющих уровни понятий (надкласс–класс–подкласс) формируется в виде таксономической иерархии. Например, класс «Кластер» включает в себя подклассы «Агропромышленный кластер», «Инновационный кластер», «Мультикластер», «Промышленный кластер» и «Туристско-рекреационный кластер». Класс «Территориально-отраслевая интегрированная система» включает все кластеры и схожие с ними территориальные экономические системы в виде классов «Протокластер», «Квазикластер», «Латентный кластер», «Территориально-производственный комплекс» и др. Конкретные промышленные кластеры являются как экземплярами надкласса «Территориально-отраслевая интегрированная система» класса «Кластер», так и экземплярами подкласса «Промышленный кластер» (рис. 4). Для описания сложных составных понятий, входящих в предлагаемую онтологию, используется структурное отношение «Part Of» (является частью), которое также можно интерпретировать как «входит в состав» экономических систем. Например, инновационный кластер является обязательной составной частью инновационного мультикластера, выступая в роли его научно-технологического ядра, а цифровые платформы и цифровые экосистемы входят в состав инновационного гиперкластера, являющегося подтипом инновационного мультикластера. Разработка и практическое применение предметной онтологии домена «Кластеры» включает задачу оптимизации и описания совокупности используемых в ее рамках отношений. Для специализированных онтологий наряду с общепринятыми типами отношений (таксономических, структурных и др.) вво- дятся отношения, свойственные рассматриваемому домену (предметной области). В онтоло-гии домена «Кластеры» используются следующие универсальные отношения: между объектом и классом (IsA), между подклассом и классом (AKO), части и целого (Part Of). К специфическим отношениям относятся «иметь организационно-правовую форму», «иметь основную специализацию», «иметь сопутствующую специализацию» и другие типы отношений, представленные на рисунке 5. Обсуждение результатов Обзор современных способов создания онтологий и их практического применения в рамках задач моделирования проведен в [17]. В работе сделан подробный сравнительный анализ использования ER-моделей, XML-схем, языков RDF и OWL. При этом не рассмотрены особенности применения при работе с онтологиями языка Python и специализированных библиотек, таких как Owlready2, позволяющей управлять объектами онтологии как обычными объектами Python, использовать SPARQL-запросы и механизмы рассуждений. Проблемы при работе на языке Python с русскоязычными онто- логиями с помощью библиотеки Owlready2 были описаны и решены в работе [18]. Отли- чительной особенностью онтологии домена «Кластеры», являющейся русскоязычной, является учет специфики российской экономической мысли и нормативно-правовой базы кла-стерной политики. Онтология включает как адаптированный перевод зарубежных терминов, так и свойственную советско-российской экономической географии терминологию. Подход к интеграции подпространства предметной области знаний в общее семантическое пространство представлен в работе [19]. В частности, решаются задачи добавления терминов в тезаурус, а также построения эталонного корпуса прикладной предметной области. На основе анализа существующих методик выделены следующие этапы построения онтологий: определение цели онтологии, выделение основных понятий верхнего уровня, выделение связей между ними. Использование в рамках данного исследования указанных выше подходов позволит применять онтологию домена «Кластеры», минимизируя процесс поиска данных о кластеризации экономики без потери общеэкономических результатов и выводов, содержащихся за рамками кластерной политики в таких сферах, как инновационная политика, государственное регулирование экономики и т.д. В работе [20] выделен ряд ограничений использования семантических сетей для анализа экономических текстов, при этом объект исследования ограничен публикациями экономиче- ской тематики, не рассматриваются проблемы извлечения экономических данных из других типов источников (БД и т.п.). Сделан вывод о необходимости при исследовании серьезных экономических проблем проводить кросс-текстовый анализ на основе формирования крупной семантической сети, что потенциально может привести к смешению нескольких научных подходов к проблеме. Также исследователям нужно заранее определять фокус анализа, чтобы интерпретировать экономические тексты в рамках единого подхода. Ключевым требованием к онтологии домена «Кластеры», лежащей в основе применения семантических технологий при реализации кластерной по- литики, является соответствие современным представлениям о пространственном развитии регионов и научной концепции кластера. Особое внимание при разработке онтологии уделено разграничению форм пространственного развития, относящихся к различным теоретическим подходам к проблемам экономического развития территорий, а также соотношению данных форм в контексте именно кластерной политики (фокус исследования). Это является методологическим преимуществом применения предлагаемой онтологии практиками, непогруженными в научный контекст формирования современной концепции кластера. В исследовании [21] рассмотрены научные проблемы автоматического построения семантических сетей и их применения для получения ответов на вопросы пользователей. В работе рассмотрен ограниченный набор типов вопросов, авторами планируется усовершенствование алгоритма за счет увеличения числа видов отношений между понятиями и добавления поддержки многозначных слов. В онтологии домена «Кластер» изначально учитывается многозначность общенаучного термина «кластер», а также, помимо общеэкономических отношений между понятиями, введены десять типов отношений, имеющих непосредственное отношение к кластерной политике. Введение специфических отношений, таких как «выполнять функции управляющей компании», «включать в качестве резидента», повысит качество построения семантических сетей на основе текстов научных работ и нормативных правовых актов в области кластерной политики. В работе [22] в качестве основы построения предметной онтологии на основе БД «Татнефть» используется модель данных Epicentre 3.0, представленная в виде ER-диаграмм и набора текстовых файлов на объектно-ориентированном языке Express. При этом для описания самой онтологии используется WOL. Преимуществом данного подхода является разработка он- тологии на основе Epicentre 3.0 как отраслевого стандарта логических моделей БД в нефтегазовой отрасли. Определенная сложность практического применения данного подхода заклю- чается в необходимости конвертации модели Epicentre в язык описания онтологий OWL. На сегодняшний день для российской кластерной политики нет единого отраслевого либо ведомственного стандарта модели данных о процессах кластеризации экономики, на основе которого возможно построение онтологии. Существующие БД о кластерах и объектах инновационной инфраструктуры, формируемые различными организациями, отражают отдельные аспекты кластерной политики. Предлагаемая онтология, изначально разрабатываемая на рекомендованном международным консорциумом W3C языке OWL, вносит определенный вклад в формирование стандарта модели данных в области кластерной политики. Заключение Для представления предметной области «Кластеры» построена модель знаний, при разработке которой обобщены и структурированы различные подходы к определению и классификации кластеров, а также смежных с ними экономических систем. Разработанная онтология домена «Кластеры» является основой для структурирования различных источников данных о кластерах, извлечения необходимых пользователям данных и их контекстуализации. Дальнейшее научное и практическое применение разработанной предметной онтологии рассматривается в рамках следующих направлений: - размещение в открытом доступе семантически связанной концептуальной модели кластера для широкого круга лиц, участвующих в реализации кластерной политики; - выявление неявных знаний о кластерах, актуализация и насыщение данной предметной области на основе семантических технологий; - извлечение и обработка на основе онтологии, соответствующей современной теоретиче- ской концепции кластера, неструктурированных данных о кластерах из различных БД, а также нормативных правовых актов и других источников; - создание алгоритмов и интеллектуальных систем для идентификации и классификации существующих кластеров на основе предлагаемой онтологии. Полученные научные результаты являются основой для дальнейших исследований процессов интеграции инновационных кластеров, цифровых платформ и экосистем в контексте проблем управления региональным развитием. Список литературы 1. Загородников К.А., Просвирина Н.В. Сущность и классификация кластеров в современной инновационной экономике // Экономика: вчера, сегодня, завтра. 2018. Т. 8. № 12А. С. 107–117. 2. Капогузов Е.А., Логинов К.К., Чупин Р.И., Харламова М.С. Прогноз экономической эффективности кластерных проектов в контексте сценариев кластерного развития региона // Terra Economicus. 2019. Т. 17. № 2. С. 40–59. 3. Sedita S., Caloffi A., Lazzeretti L. The invisible college of cluster research: A bibliometric core-periphery analysis of the literature. Industry and Innovatio, 2018, vol. 22, no. 2, pp. 562–584. doi: 10.1080/13662716.2018.1538872. 4. Morgulis-Yakushev S., Sölvell Ö. Enhancing dynamism in clusters: A model for evaluating cluster organizations’ bridge-building activities across cluster gaps. Competitiveness Review, 2017, vol. 27, no. 2, pp. 98–112. doi: 10.1108/CR-02-2016-0015. 5. Каленов Н.Е. Об одном подходе к формированию предметных онтологий различных областей науки // Научный сервис в сети интернет: тр. конф. 2020. С. 276–285. doi: 10.20948/abrau-2020-14. 6. Волкова И.А., Шамаева Е.Д. Экскурс в графы знаний // INJOIT. 2023. Т. 11. № 3. С. 75–83. 7. Smith B. The birth of ontology. J. Knowl. Struct. Syst., 2022, vol. 3, no. 1, pp. 57–66. 8. Грибова В.В., Паршкова С.В., Федорищев Л.А. Онтологии для разработки и генерации адаптивных пользовательских интерфейсов редакторов баз знаний // Онтология проектирования. 2022. Т. 12. № 2. С. 200–217. doi: 10.18287/2223-9537-2022-12-2-200-217. 9. Horridge M., Gonçalves R., Nyulas C., Tudorache T., Musen M. WebProtégé: A cloud-based ontology editor. Proc. WWW’19, 2019, pp. 686–689. doi: 10.1145/3308560.3317707. 10. Иванов П.И., Мышкина И.Ю., Грудцына Л.Ю. Обзор библиотеки Owlready2 для работы с онтологиями на языке Python // Науч.-технич. вестник Поволжья. 2022. № 12. С. 139–141. 11. Волчек Д.Г. Подход к обучению онтологий на основе анализа метаданных и построения универсальных зависимостей // Экономика: вчера, сегодня, завтра. 2019. Т. 9. № 8А. С. 298–304. 12. Атаева О.М., Серебряков В.А. Онтология цифровой семантической библиотеки LibMeta // Информатика и ее применения. 2018. Т. 12. № 1. С. 2–10. doi: 10.14357/19922264180101. 13. Ketels C., Protsiv S. Cluster presence and economic performance: A new look based on European data. Regional Studies, 2021, vol. 55, no. 2, pp. 208–220. doi: 10.1080/00343404.2020.1792435. 14. Дедков Д.А., Бакуменко М.А. Программные продукты для создания онтологий. Система Protege // Тенденции развития Интернет и цифровой экономики: тр. III Всерос. науч.-практич. конф. 2020. С. 205. 15. Савина А.Г., Уханов Д.В., Савин Д.А. Сферы и перспективы применения языка программирования Python // Научные записки ОрелГИЭТ. 2021. Т. 38. № 2. С. 24–28. 16. Jean-Baptiste L. Ontologies with Python: Programming Owl 2.0 Ontologies with Python and Owlready2. CA, Apress Berkeley, 2021, 344 p. doi: 10.1007/978-1-4842-6552-9. 17. Антонов А.А., Быков А.Н., Чернышев С.А. Обзор существующих способов формирования онтологии предметной области при моделировании // Междунар. журнал информационных технологий и энергоэффективности. 2021. Т. 6. № 4. С. 12–17. 18. Щукарев И.А. Особенности работы с русскоязычными онтологиями с помощью библиотеки Owlready2 на языке Python // Программные продукты и системы. 2023. Т. 36. № 2. С. 223–227. doi: 10.15827/0236-235X.142.223-227. 19. Атаева О.М., Серебряков В.А., Тучкова Н.П. Интеграция подпространства предметной области в семантическое пространство «математика» // Программные продукты и системы. 2023. Т. 36. № 1. С. 83–96. doi: 10.15827/ 0236-235X.141.083-096. 20. Пашков С.Г. Семантический сетевой подход: возможности и ограничения (пример образа инфляции в СМИ) // Социологический журнал. 2020. Т. 26. № 2. С. 8–30. doi: 10.19181/socjour.2020.26.2.7262. 21. Потараев В.В., Серебряная Л.В. Автоматическое построение семантической сети для получения ответов на вопросы // Докл. БГУИР. 2020. Т. 18. № 4. C. 44–52. doi: 10.35596/1729-7648-2020-18-4-44-52. 22. Гусенков А.М., Бухараев Н.Р., Биряльцев Е.В. Построение онтологии предметной области на основе логической модели данных // Russian Digital Libraries J. 2020. Т. 23. № 3. С. 390–417. doi: 10.26907/1562-5419-2020-23-3-390-417. References 1. Zagorodnikov, K.A., Prosvirina, N.V. (2018) ‘Essence and classification of clusters in modern innovation economy’, Economics: Yesterday, Today, Tomorrow, 8(12А), pp. 107–117 (in Russ.). 2. Kapoguzov, E.A., Loginov, K.K., Chupin, R.I., Kharlamova, M.S. (2019) ‘The forecast of cluster economic efficiency in the context of regional cluster development scenarios’, Terra Economicus, 17(2), pp. 40–59 (in Russ.). 3. Sedita, S., Caloffi, A., Lazzeretti, L. (2018) ‘The invisible college of cluster research: A bibliometric core-periphery analysis of the literature’, Industry and Innovatio, 22(2), pp. 562–584. doi: 10.1080/13662716.2018.1538872. 4. Morgulis-Yakushev, S., Sölvell, Ö. (2017) ‘Enhancing dynamism in clusters: A model for evaluating cluster organizations’ bridge-building activities across cluster gaps’, Competitiveness Review, 27(2), pp. 98–112. doi: 10.1108/CR-02-2016-0015. 5. Kalenov, N.E. (2020) ‘About one approach to the formation of subject ontologies for science various fields’, Proc. Conf. Sci. Service on the Internet, pp. 276–285 (in Russ.). doi: 10.20948/abrau-2020-14. 6. Volkova, I.A., Shamaeva, E.D. (2023) ‘Excursus in knowledge graphs’, INJOIT, 11(3), pp. 75–83 (in Russ.). 7. Smith, B. (2022) ‘The birth of ontology’, J. Knowl. Struct. Syst., 3(1), pp. 57–66. 8. Gribova, V.V., Parshkova, S.V., Fedorishchev, L.A. (2022) ‘Ontologies for development and generation adaptive user interfaces of knowledge base editors’, Ontology of Designing, 12(2), pp. 200–217 (in Russ.). doi: 10.18287/2223-9537-2022-12-2-200-217. 9. Horridge, M., Gonçalves, R., Nyulas, C., Tudorache, T., Musen, M. (2019) ‘WebProtégé: A cloud-based ontology editor’, Proc. WWW’19, pp. 686–689. doi: 10.1145/3308560.3317707. 10. Ivanov, P.I., Myshkina, I.Y., Grudcyna, L.Y. (2022) ‘Overview of the Owlready2 library for working with python ontologies’, Sci. and Tech. Volga Region Bull., (12), pp. 139–141 (in Russ.). 11. Volchek, D.G. (2019) ‘An approach to training ontologies based on the analysis of metadata and the construction of universal dependencies’, Economics: Yesterday, Today and Tomorrow, 9(8А), pp. 298–304 (in Russ.). 12. Ataeva, O.M., Serebryakov, V.A. (2018) ‘Ontology of the digital semantic library LibMeta’, Informatics and Applications, 12(1), pp. 2–10 (in Russ.). doi: 10.14357/19922264180101. 13. Ketels, C., Protsiv, S. (2021) ‘Cluster presence and economic performance: A new look based on European data’, Regional Studies, 55(2), pp. 208–220. doi: 10.1080/00343404.2020.1792435. 14. Dedkov, D.A., Bakumenko, M.A. (2020) ‘Software products for creating ontologies. The Protege system’, Proc. III All-Russ. Conf. Trends in the Development of the Internet and Digital Economy, pp. 205 (in Russ.). 15. Savina, A.G., Sukhanov, D.V., Savin, D.A. (2021) ‘Areas and prospects of application the python programming language’, Sci. J. of OrelSIET, 38(2), pp. 24–28 (in Russ.). 16. Jean-Baptiste, L. (2021) ‘Ontologies with Python: Programming Owl 2.0 Ontologies with Python and Owlready2’, CA: Apress Berkeley, 344 p. doi: 10.1007/978-1-4842-6552-9. 17. Antonov, A.A., Bykov, A.N., Chernyshev, S.A. (2021) ‘Review of existing methods of formation of domain ontology in modeling’, Int. J. of Information Technology and Energy Efficiency, 6(4), pp. 12–17 (in Russ.). 18. Shchukarev, I.A. (2023) ‘Features of working with Russian-language ontologies using the Owlready2 library in Python’, Software & Systems, 36(2), pp. 223–227 (in Russ.). doi: 10.15827/0236-235X.142.223-227. 19. Ataeva, O.M., Serebryakov, V.A., Tuchkova, N.P. (2023) ‘Integrating the subject area subspace into the “mathematics” semantic space’, Software & Systems, 36(1), pp. 83–96 (in Russ.). doi: 10.15827/0236-235X.141.083-096. 20. Pashkov, S.G. (2020) ‘The semantic network approach: opportunities and restrictions (example of inflation image in the media)’, Sociological J., 26(2), pp. 8–30 (in Russ.). doi: 10.19181/socjour.2020.26.2.7262. 21. Potaraev, V.V., Serebryanaya, L.V. (2020) ‘Automatic generation of semantic network for question answering’, Doklady BGUIR, 18(4), pp. 44–52 (in Russ.). doi: 10.35596/1729-7648-2020-18-4-44-52. 22. Gusenkov, A.M., Bukharaev, N.R., Biryaltsev, E.V. (2020) ‘Building subject domain ontology on the base of a logical data mod’, Russ. Digital Libraries J., 23(3), pp. 390–417 (in Russ.). doi: 10.26907/1562-5419-2020-23-3-390-417. |
http://swsys.ru/index.php?id=5072&lang=.docs&page=article |
|