Распространение научных знаний является неотъемлемым атрибутом современного общества. В доцифровую эпоху важнейшей составляющей этого процесса являлось издание многотомных энциклопедий, содержащих достоверную, проверенную временем научную информацию. Для обеспечения актуальности отражаемой информации периодически прихо- дилось допечатывать новые тома, а по прошествии определенного времени полностью переиздавать многотомное издание. Многие страны выпускают собственные национальные энциклопедии, включающие многоаспектную важнейшую мировую информацию, относящуюся ко всем сторонам жизни общества. Подобные энциклопедии выпускались в дореволюционной России, в Советском Союзе и в современной России. Последней печатной версией Российской энциклопедии является отраженное в каталоге Российской государственной библиотеки (РГБ) многотомное издание, датированное 2015 годом [1]. Очевидно, что энциклопедии прошлых лет выпусков содержат значительный объем информации, относящейся к историческим событиям, персоналиям, научным достижениям, актуальной и в настоящее время, поэтому в сети представлены цифровые варианты печатных версий, в частности, 3-е издание Большой советской энциклопедии [2]. Эта цифровая версия организована по аналогии с печатными указателями (пользователь выбирает по алфавиту том и его часть, содержащую интересующую его статью, и, пролистывая текстовый файл, переходит к нужной статье). Текст статьи содержит html-разметки, позволяющие переходить к смежным статьям. В данной версии отсутствует возможность поиска статей по названиям или по фрагментам текста.
Современные технологии позволяют создавать цифровые энциклопедии, доступные практически неограниченному кругу пользователей и содержащие актуальную в каждый момент времени информацию. Подобными проектами являются, в частности, создание электронной версии Большой российской энциклопедии (БРЭ) и анонсированное в [3] формирование на ее базе портала «Знание» [4] как альтернативы Википедии. Но и БРЭ, и портал «Знание» являются по сути достаточно тривиальным развитием традиционных подходов к построению энциклопедических словарей – по непрозрачным критериям отбираются специалисты, которым заказываются слоты (статьи, содержащие описания того или иного объекта). В тексте слота даются ссылки на статьи, относящиеся к другим объектам, в той или иной мере связанным с данным, и библиографические ссылки на издания, в которых подробно рассматривается описываемый объект.
Проблема при создании энциклопедических ресурсов, если говорить о научных понятиях и достижениях, состоит в том, что они должны содержать полную и актуальную информацию, относящую к каждой научной области. А выполнение этого требования в значительной мере определяется выбором авторов и набором статей, отражающих данное научное направление. Одним из инструментов определения перечня необходимых статей и подбора их авто- ров может являться экспертная система, в рамках которой широкий круг специалистов оценивает целесообразность того или иного варианта и на основании этих оценок принимается окончательное решение.
Энциклопедические справочные материалы, безусловно, необходимы широкому кругу пользователей, но они не дают непосредственных ответов на фактографические вопросы, не отражают различные виды связей между объектами. Принципиально новой информационной системой хранения и распространения научной информации является Единое цифровое пространство научных знаний (ЕЦПНЗ). В соответствии с концепцией, отраженной в [5–8], ЕЦПНЗ представляет собой совокупность разнородных информационных ресурсов, сгруппированных в тематические подпространства, объединяемые единой онтологией и отражающие многоаспектные связи между объектами и их свойствами. ЕЦПНЗ декларируется как интегратор существующих информационных систем (в том числе БРЭ, БСЭ, Википедии, НЭБ и др.), обеспечивающий обработку, хранение и распространение «отборных» материалов, достоверно отражающих научные достижения, при минимальном дублировании. Пользователь (в том числе элемент искусственного интеллекта) должен получать из ЕЦПНЗ информацию, не требующую дополнительного анализа и выбора. В этом состоит одно из отличий ЕЦПНЗ от других научных информационных систем.
Вопрос отбора изданий, подлежащих отражению в цифровом виде в ЕЦПНЗ, исключительно важен. В общем случае при формировании ЕЦПНЗ возникает вопрос отбора для включения в пространство не только цифровых публикаций, но и других видов ресурсов, представленных в мировом информационном пространстве в виде практически идентичных реализаций. Это могут быть документальные и фактографические БД, каталоги ресурсов, коллекции фотографий и т.п.
Для обеспечения высокого качества и исключения дублирования информации отбор контента для включения в ЕЦПНЗ должен базироваться в значительной мере на экспертных оценках однотипных ресурсов. Очевидно, что в современных условиях экспертные оценки необходимо собирать и обрабатывать с помощью специализированных автоматизированных систем.
Анализ подобных систем, представленных в информационном пространстве, показывает, что разрабатываются узконаправленные системы, ориентированные на оценку тех или иных материалов в вузе или на промышленном предприятии [7–9]. Информацию о наличии web-ориентированной системы, настраиваемой на определенный круг экспертов и материалов, обладающих теми или иными свойствами, подлежащими оценке, обнаружить не удалось.
Для решения вышеперечисленных задач в МСЦ РАН в 2020 г. была разработана система «Экспертиза» [10], целью которой является формирование рейтингового списка подлежащих отбору цифровых объектов на основании оценок, присвоенных им группой авторизо- ванных экспертов. В 2021–2022 гг. система «Экспертиза» получила свое дальнейшее развитие.
В новой версии системы было определено понятие «совокупность объектов». В качестве совокупности может выступать группа объектов, объединенных некоторой характеристикой. Это могут быть учебники или научные издания по определенной тематике, фактографические или документальные БД по тому или иному научному направлению, студенческие работы, фотографии и т.п. Система может поддерживать несколько таких совокупностей, обеспечивая работу с ними как администраторов, так и экспертов.
Каждая совокупность определяет массив оцениваемых объектов (объекты совокупности). Объекты совокупности (метаданные и ссылки на их цифровые копии) загружаются в пакетном режиме или вводятся вручную.
При настройке системы для каждой совокупности формируются следующие таблицы: виды объектов, тематические разделы, оцениваемые характеристики объектов, оценки.
Виды объектов, например, для совокупности научных изданий – монография, справочник, учебное пособие и др. Таблица тематических разделов представляет собой названия тематик, определенных в той или иной совокупности. Объект совокупности может относиться к нескольким тематикам. Система позволяет использовать сформированную таблицу тематических разделов некоторой совокупности для других совокупностей.
Объекты в системе оцениваются по характеристикам, определенным для данной совокупности. Например, для совокупности научных изданий характеристики, по которым оцениваются объекты, могут включать научную новизну, теоретическую и практическую значимость, качество оформления и т.д.
Для каждой характеристики формируется набор оценок: наименование оценки и ее допу- стимые числовые значения, представляющие собой заданный числовой диапазон либо перечень значений. Профиль метаданных оценок содержит указание на оцениваемую совокупность, наименование оцениваемых характеристик объектов, входящих в данную совокупность, и набор пар «числовое значение–словесное выражение» по каждой оцениваемой характеристике.
Объекты совокупности оцениваются авторизованными экспертами. Система поддерживает БД экспертов и БД организаций, в которых работают эксперты.
Каждый эксперт может оценивать объекты только тех тематик, которые соответствуют его научному профилю. Элементы, отражающие научный профиль эксперта, указываются в тех же терминах, что и тематика. Они представлены в метаданных каждого эксперта вместе с относительным весом данного элемента для данного эксперта. Относительный вес – число, устанавливаемое администратором системы в зависимости от квалификации эксперта по данному научному направлению. У одного эксперта может быть несколько пар «элемент научного профиля–относительный вес».
Структура системы
Система обеспечивает создание и поддержку следующих взаимосвязанных сущностей: совокупность объектов, объект, тематическая таблица, тематика, вид объекта, характеристика объекта, оценка, эксперт, ученая степень, организация, вес эксперта, полученная оценка объекта.
Представим профили метаданных сущностей.
Совокупность объектов: идентификатор совокупности, наименование, информация о совокупности, идентификатор тематической таблицы, дата начала экспертизы, дата окончания экспертизы.
Объект: идентификатор объекта, идентификатор совокупности, к которой относится объект, наименование объекта, описание объекта, URL объекта, тематики (1:n), идентификатор вида объекта, дата начала экспертизы, дата окончания экспертизы.
Тематическая таблица: идентификатор, наименование таблицы, тематики (1:n).
Тематика, Вид объекта, Ученая степень: идентификатор, наименование.
Характеристика объекта: идентификатор записи, наименование характеристики, идентификатор совокупности объектов.
Оценка: идентификатор записи, идентификатор характеристики, наименование оценки, вид оценки (числовой интервал или конкретное значение), числовое значение (для вида оцен- ки – конкретное значение), интервал оценки от (для вида оценки – числовой интервал), интервал оценки до (для вида оценки – числовой интервал).
Эксперт: идентификатор записи, фамилия, имя и отчество, электронный адрес, логин, пароль, организация (1:n), ученая степень (1:n), научный профиль + «вес» эксперта в данной области науки (1:n), совокупность объектов, для которой является экспертом (1:n).
Организация: идентификатор, название организации, контактные данные, дополнительная информация.
Вес эксперта: идентификатор записи, наименование, числовое значение.
Полученная оценка объекта: идентификатор записи, идентификатор объекта, идентификатор эксперта, идентификатор характеристики, идентификатор оценки, числовое значение, комментарий эксперта.
Система реализована на основе технологии Microsoft ASP.NET 4 на платформе Microsoft .NET Framework в среде разработки Microsoft Visual Studio 2019 и состоит из двух модулей: административного (http://dirsmsc.ru/exprt/adm. html) и пользовательского (http://dirsmsc.ru/ exprt/).
Реализации системы
В 2021 г. на базе новой версии системы «Эксперт» были проведены две сессии, организованные издательским домом «Директ-Медиа»: «Конкурс учебников и учебных пособий» и «II Всероссийский конкурс монографий». Проиллюстрируем интерфейс работы с системой на примере проведения «Конкурса учебников и учебных пособий».
Настройка системы на конкретный конкурс осуществляется в административном модуле. Для проведения конкурса была определена новая совокупность объектов с именем «Конкурс учебников и учебных пособий». Для данной совокупности создана тематическая таблица «Направления конкурса учебников и учебных пособий» (рис. 1). В систему в пакетном режиме были загружены 157 работ, которые являются объектами данной совокупности.
Далее администратором системы были определены характеристики, по которым должны оцениваться объекты. Для данного конкурса была задана одна характеристика с именем «Научная значимость», а затем для нее введены оценки – словесное выражение и числовое значение (рис. 2). Администратором также была сформирована таблица «весов» для экспертов.
Из базы экспертов системы выбираются эксперты, которые будут оценивать объекты данной совокупности. Для каждого такого эксперта в режиме «Редактирование эксперта» указывается совокупность «Конкурс учебников и учебных пособий», затем выбирается тематика (научный профиль) и для нее «вес» эксперта (рис. 3). У эксперта может быть несколько научных профилей с соответствующими «весами».
Эксперты, работая в пользовательском модуле системы, знакомятся с представленными в системе объектами, соответствующими их научному профилю, и присваивают каждой характеристике объекта оценку из предложенного системой списка наименований оценок. По каждой присвоенной оценке вводится комментарий – текстовое обоснование ее выбора. На рисунке 4 приведен пример оценки экспертом произведения, представленного в данном конкурсе.
При проведении экспертизы эксперты имеют возможность менять ранее присвоенные оценки. После окончания срока экспертизы, отражаемого в метаданных объекта, оценки изменить невозможно.
Во время проведения экспертизы администратор системы имеет возможность просмотреть текущие оценки по каждому объекту, присвоенные различными экспертами (табл. 1), объекты, которые оценил каждый эксперт, выявить объекты, не получившие оценок, получить данные об интенсивности работы каждого эксперта.
По окончании экспертизы система формирует различные рейтинговые списки объектов с указанием числовых значений полученных оценок. При подсчете каждая оценка, присвоенная экспертом, умножается на «вес» эксперта по данному тематическому направлению.
Система также выдает статистику работы экспертов: какое количество объектов и по каким научным направлениям оценено (табл. 2), какие оценки и каким объектам присвоены данным экспертом или выбранной по тому или иному признаку группой экспертов.
Заключение
Разработанная система прошла апробацию при проведении ряда конкурсов на лучшую научную студенческую работу и лучшую научную публикацию, организованных издательством «Директ Медиа» при участии МСЦ РАН. В планах развития системы – ее настройка для использования в качестве цифровой платформы при организации рецензирования статей, поступающих в научные журналы, и рассмотрении издательствами предложений авторов о публикациях научных монографий.
Работа выполнена в МСЦ РАН – филиале ФГУ ФНЦ НИИСИ РАН в рамках государственного задания по теме FNEF-2022-0014.
Литература
1. Осипов Ю.С. и др. Большая российская энциклопедия. М.: Большая российская энциклопедия, 2015.
2. Большая советская энциклопедия. URL: http://bse.uaio.ru/BSE/bse30.htm (дата обращения: 01.08.2022).
3. Большая российская энциклопедия. URL: https://bigenc.ru (дата обращения: 01.08.2022).
4. РАН. Новости. Энциклопедический портал «Знания» как альтернатива Википедии. URL: http://www.ras.ru/news/shownews.aspx?id=b2fbc33e-71bb-4f9d-8d47-8afe983cfd01&fbclid=IwAR16wo Chih0c_jKUnGlbEl2CZjloFowUdpdnHLGVO_450COlexAi1hUxgpY (дата обращения: 01.08.2022).
5. Антопольский А.Б., Каленов Н.Е., Серебряков В.А., Сотников А.Н. О едином цифровом пространстве научных знаний // Вестн. Российской академии наук. 2019. Т. 89. № 7. С. 728–735. DOI: 10.31857/S0869-5873897728-735.
6. Савин Г.И. Единое цифровое пространство научных знаний: Цели и задачи // Информационные ресурсы России. 2020. № 5. С. 3–5. DOI: 10.51218/0204-3653-2020-5-3-5.
7. Мезенцева М.С., Камальдинова З.Ф. Информационная система дистанционного проведения конкурса научных работ // Цифровизация и управление в социальных системах: сб. науч. тр. 2019. С. 42–46
8. Кочитов М.Е., Баженов Р.И. Проект разработки информационной системы «Сервис» по организации конкурсов научно-исследовательских работ (НИР) // Постулат. 2018. № 12. С. 1–11.
9. Круглик Р.И., Баженов Р.И. Разработка ВЕБ-ориентированного сервиса организации и поддержки конкурсов научно-исследовательских работ // Постулат. 2017. № 5-1 (19). С. 1–7.
10. Власова С.А., Каленов Н.Е., Сотников А.Н. Web-ориентированная система формирования контента единого цифрового пространства научных знаний // Программные продукты и системы. 2020. Т. 33. № 3. С. 365–374. DOI: 10.15827/0236-235X.131.365-374.
References
1. Osipov Yu.S. Great Russian Encyclopedia. Moscow, Great Russian Encyclopedia Publ., 2015 (in Russ.).
2. Great Soviet Encyclopedia. Available at: http://bse.uaio.ru/BSE/bse30.htm (accessed August 01, 2022) (in Russ.).
3. Great Russian Encyclopedia. URL: https://bigenc.ru (accessed August 1, 2022).
4. RAS. News. Encyclopedic Portal "Knowledge" as an Alternative to Wikipedia. Available at: http://www.ras.ru/news/shownews.aspx?id=b2fbc33e-71bb-4f9d-8d47-8afe983cfd01&fbclid=IwAR16woChih0c_jKUnGlbEl2CZjloFowUdpdnHLGVO_450COlexAi1hUxgpY (accessed August 01, 2022) (in Russ.).
5. Antopolskii A.B., Kalenov N.E., Serebryakov V.A., Sotnikov A.N. Common digital space of scientific knowledge. Vestn. Rossijskoj Akademii Nauk, 2019, vol. 89, no. 7, pp. 728–735. DOI: 10.31857/S0869-5873897728-735 (in Russ.).
6. Savin G.I. Common digital space of scientific knowledge: goals and objectives: Goals and tasks. In-formation Resources of Russia, 2020, no. 5, pp. 3–5. DOI: 10.51218/0204-3653-2020-5-3-5 (in Russ.).
7. Mezentseva M.S., Kamaldinova Z.F. An information system for holding a competition of scientific works remotely. Proc. Digitalization and Management in Social Systems, 2019, pp. 42–46 (in Russ.).
8. Kochitov M.E., Bazhenov R.I. The project of developing the information system "service for the or-ganization of contests for science-research works (SRW)". Postulat, 2018, no. 12, pp. 1–11 (in Russ.).
9. Kruglik R.I., Bazhenov R.I. Development of a web-based service organization and support science-research competitions. Postulat, 2017, no. 5, pp. 1–7 (in Russ.).
10. Vlasova S.A., Kalenov N.E., Sotnikov A.N. A web-based content generation system for a common digital space of scientific knowledge. Software & Systems, 2020, vol. 33, no. 3, pp. 365–374. DOI: 10.15827/0236-235X.131.365-374 (in Russ.).