ISSN 0236-235X (P)
ISSN 2311-2735 (E)

Journal influence

Higher Attestation Commission (VAK) - К1 quartile
Russian Science Citation Index (RSCI)

Bookmark

Next issue

4
Publication date:
09 September 2024

Multistep alternatives search in an information catalogue

The article was published in issue no. № 3, 2013 [ pp. 291-295 ]
Abstract:Despite the fact that data catalogues are widely used in different areas, data search that is considered as thema-jor part of data systematization, is being done with strictly formulated search requests that result in a search results list. How-ever, quite often it is impossible to state a specific search request. It is also impossible to state search criteria specifically. To avoid restricting the access to full information in givencatalogues, it is recommended to provide quality system access. The article addresses software solutions for systematization of heterogeneous data. The article gives solutions description in words and parameters to provide forming a ranked search results list that matches a search request best. The article proves motivation for the use of basic principles of fuzzy systems principles when selecting solutions in registers and catalogues. The article describes an algorithm of multistep decision making process for an original problem with a fixed number ofsteps. It also demonstrates how this system works in a data catalogue.
Аннотация:Несмотря на обширно представленное направление каталогизации информации в различных областях, обеспечение поиска данных, являющееся одним из самых главных разделов систематизации информации, осуществляется на основе строго сформулированного посредством языков манипулирования данными запроса пользователя. Зачастую запрос к системе невозможно четко сформулировать, нельзя однозначно указать критерии, на которых базируется поиск информации. Для того чтобы избежать ограничения доступа пользователей к полному объему информации, содержащейся в используемых реестрах и каталогах, целесообразно представлять запрос к системе в качественном виде. В работе представлена программная реализация подходак систематизации разнородной информации. Приведено ее описание в семантическом и параметрическом видах с целью обеспечения формирования максимально точно отвечающего пользовательскому запросу ранжированного списка возможных вариантов решений поставленной задачи. Приводится обоснование целесообразности использования основных принципов теории нечетких систем при выборе решений в реестрах и каталогах. Представлен алгоритм построения многошагового процесса принятия решений поставленной задачи при фиксированном количестве шагов. Продемонстрирован результат применения программной реализации многошаговой системы поиска альтернатив в информационном каталоге.
Authors: Palyukh B.V. (pboris@tstu.tver.ru) - Tver State Technical University, Tver, Russia, Ph.D, I.A. Egereva (irina.egereva@gmail.com) - Tver State Technical University (Associate Professor), Tver, Russia, Ph.D
Keywords: multistep task solving, fuzzy systems theory, information search, catalogue of services, systematization
Page views: 8021
Print version
Full issue in PDF (13.63Mb)
Download the cover in PDF (1.39Мб)

Font size:       Font:

В современных условиях пользователи зачастую прибегают к применению различных функциональных подсистем для оптимизации процедуры формирования комплекса решений возникающих задач.

Существует огромное количество решателей, доступ к которым из-за их сложной организации часто нельзя осуществить. Для обеспечения пользователю возможности применять существующие разработки, знакомиться с опытом их использования, оценивать степень возможности применения того или иного сервиса для решения возникшей задачи создаются отдельные каталоги сервисов по различным предметным областям, такие как Mathtree – древовидный каталог математических интернет-ресурсов, разработанный Институтом систем информатики им. А.П. Ершова СО РАН [1]; проект Wolfram MathWorld, в котором, кроме энциклопедических данных, пользователям сайта предоставляется возможность решать несложные математические задачи [2]; проект nigma [3]; каталоги различных сервисов [4, 5] и др.

При разработке структуры подобных каталогов учитываются стандартные подходы к их состав- лению, предложенные Декларацией о международных принципах каталогизации, которая распространяется на область применения, объекты, атрибуты, связи, задачи и функции каталога [6]. Применяется также опыт составления рубрикаторов, представляющих собой иерархическую классификацию областей знания, принятую для сис- тематизации всего потока научно-технической информации. На основе рубрикаторов строится система локальных (отраслевых, тематических, проблемных) классификаторов научно-техничес­кой информации. Кроме того, существует ряд требований, определяемых ГОСТами ISO 8000 (ГОСТ Р ИСО 8000) «Качество данных», ISO 22745 (ГОСТ Р ИСО 22745) «Системы промышленной автоматизации и их интеграция. Открытые технические словари и их применение к основным данным» и др.

Несмотря на широкое распространение ката- логизации информации в различных областях, обеспечение поиска данных, являющееся одним из самых главных разделов систематизации информации, осуществляется на основе строго сформулированного посредством языков манипулирования данными запроса пользователя, в результате выполнения которого ему представляется список вариантов.

Однако зачастую невозможно четко сформулировать запрос к системе, ключевые слова могут не совпадать с заранее заданным перечнем термов в семантическом описании сервиса. Невозможно также однозначно указать критерии, на которых базируется поиск информации. Из представленного списка разделов, относящихся к определенной предметной области, пользователь сам должен выбрать раздел, к которому относится стоящая перед ним задача, что, как показывает практика, зачастую нельзя сделать, так как пользователь может просто не знать, какими, например, разделами математики пользовался автор методики при разработке определенного сервиса. Чтобы из- бежать ограничения доступа пользователей к полному объему информации, содержащейся в ка- талогах, целесообразно представлять запрос к системе в качественном виде, кроме того, такая информация лучше формализуется с помощью нечетких множеств.

Подпись:  
Рис. 1. Постановка задачи многошагового процесса принятия решения в общем виде
В работе [7] описан подход к задачам принятия решений, когда цели и ограничения нечеткие. Главными элементами процесса принятия решения являются множество альтернатив, множество ограничений и цели, ставящие в соответствие каждой альтернативе выигрыш (или проигрыш), который будет получен в результате ее выбора. Важным является то, что цели и ограничения рассматриваются как расплывчатые множества в пространстве альтернатив, это позволяет не делать между ними различия при формировании решения. Решение, в свою очередь, определяется как расплывчатое множество в пространстве альтернатив, получающееся в результате пересечения заданных целей и ограничений. Задача построения системы поиска альтернатив в информационном каталоге в настоящей работе будет интерпретироваться как задача построения многошагового алгоритма.

Постановка задачи

Пусть имеется система, содержащая каталог сервисов, применение которых связано с решением задач, возникающих в процессе функционирования предприятия.

Подпись:  
Рис. 2. Упрощенная схема структуры каталога
 
Рис. 3. Формирование семантического множества 
искомых альтернатив
ЛПР, а именно пользователь информационной системы, формирует запрос к системе с формулировкой задачи, подлежащей решению. Система обращается к каталогизированному набору сервисов для формирования ранжированного перечня возможных альтернатив (рис. 1). При этом предполагается, что число шагов отбора сервисов фиксированное.

Задача состоит в том, чтобы разработать такую информационную систему, которая позволила бы сформировать перечень альтернатив, максимально удовлетворяющий запросу, за фиксированное число шагов принятия решения.

Многошаговый алгоритм процесса принятия решений при поиске альтернатив в информационном каталоге

Пусть множество X={x} – каталог сервисов {x1, x2, … , xn}. Нечеткое множество Yx={yx} содержит семантическое описание каждого сервиса каталога, а Hx={hx} – параметрическое описание сервисов (рис. 2).

Запрос к системе (рис. 3) формулируется в семантическом виде, состоит из множества термов из поисковой строки Zx1={zx1}, дополнительного множества слов-синонимов Zx2={zx2}, дополнительного множества схожих по значению и близких по смыслу слов Zx3={zx3} и составляет множество Zx={zx} или Zx=Zx1ÈZx2ÈZx3.

Решение – это сформированное в процессе функционирования многошаговой системы поиска альтернатив множество сервисов Dx, максимально отвечающее поставленным в запросе условиям. Следуя [7], будем представлять решение как слияние целей и ограничений.

Введем множество соответствия Ix={ix}, где 0£ix£1, включающее в себя индексы соответствия заданного описания объектов Yx={yx} запрашиваемому Zx={zx} и формируемое в результате вычисления степени совпадения содержания пользовательского запроса и семантического описания сервисов в реестре. Сервисы с наименьшим индексом соответствия не рассматриваются, поэтому целесообразно ограничить множество Ix требуемым процентным выражением сходства семантического описания ax. Используя идентификатор сервиса в множестве Ix|ax множества Ix, в результате ограничения исходного множества X={x} получаем множество XIx|axÌX.

Следующий шаг реализуется в случае, когда ограничения Ix|ax недостаточно. Кроме стандартного повторения процедуры формирования множества соответствия Ix и множества XIx|ax на основе корректировки семантического множества искомых альтернатив Zx и ограничений ax, возможно формирование уточняющего семантического множества Bx, с помощью которого не нужно полностью переформулировать запрос к системе. Достаточно ввести некоторые уточнения при поиске необходимых решателей в уже сформированном множестве. Результатом данного этапа является множество XIx|ax|bx. Если данный этап работы с системой пропущен, множество XIx|ax|bx=XIx|ax.

При выборе наиболее подходящего для решения поставленной задачи сервиса необходимо использовать систему параметров Сx, оценивающих содержание сервисов и их функциональность.

После сравнения данных, содержащихся в множестве параметрического описания сервисов Hx, с искомыми требованиями формируется множество СxÇHx. Возможно формирование ранжированного списка сервисов, содержащихся в множестве =, в соответствии с заданными параметрами. Далее множество  ограничивается системой параметров СxÇHx.

Результатом решения поставленной задачи является множество Dx=XIx|ax|bxÇСxÇHx,, представляющее собой пересечение целей и ограничений.

На рисунке 4 отображена схема работы системы многошагового процесса принятия решений.

Программная реализация

Подпись:  
Рис. 4. Схема функционирования системы многошагового процесса принятия решений
В качестве примера использования предложенного подхода к принятию решений в нечетких условиях рассмотрим веб-каталог информационных сервисов для различных предметных областей. При работе с каталогом пользователь в строке поиска указывает несколько ключевых слов или фраз, характеризующих задачу, требующую решения. Например, при запросе «Периодические и близкие к ним решения дифференциальных уравнений» система, используя словари синонимов, близких по значению и смыслу слов, осуществляет запрос по таким тематикам, как «динамические системы», «непрерывные периодические системы», «дифференциальные включения», «интегральные уравнения», «уравнения в банаховых пространствах» и т.д. (список может быть расширен в процессе накопления информации в каталоге). Кроме того, при поиске нужной информации учитывается система параметров, устанавливаемая пользователем в качественном виде.

Техническая реализация сайта выполнена с помощью средств PHP и БД MySQL.

В заключение отметим, что в статье обоснована целесообразность использования основных принципов теории нечетких систем при поиске сервисов в реестрах и каталогах, осуществлена постановка задачи, представлен алгоритм построения многошагового процесса принятия решения в нечетких условиях, рассмотрен пример программной реализации предложенного подхода.

В настоящее время в ТвГТУ в рамках проекта «Интеллектуальная распределенная система информационной поддержки инноваций в науке и образовании» ведется разработка информационной системы оценки инновационных проектов, которая позволит проанализировать предлагаемые варианты решений стоящей перед пользователем задачи и сделать вывод о целесообразности применения данного сервиса на практике.

Литература

1.     Каталог математических интернет-ресурсов. URL: http://www.mathtree.ru (дата обращения: 06.05.2013).

2.     Проект Wolfram Mathworld. URL: http://mathworld. wolfram.com (дата обращения: 06.05.2013).

3.     Проект Нигма.РФ, раздел «Математика». URL: http:// www.nigma.ru/index.php?t=math& (дата обращения: 06.05.2013).

4.     Проект Biocatalogue. URL:  http://www.biocatalogue.org/ (дата обращения: 06.05.2013).

5.     Проект Programmable web. URL: http://www.program­mableweb.com/ (дата обращения: 06.05.2013).

6.     Декларация о международных принципах каталогизации. URL: http://www.ifla.org/files/cataloguing/icp/icp_2009-ru.pdf (дата обращения: 06.05.2013).

7.     Беллман Р., Заде Л. Принятие решений в расплывчатых условиях. М.: Мир, 1976. 46 с.

8.     Проект MathCloud. URL: http://mathcloud.org/ru/ (дата обращения: 06.05.2013).

9.     Астафьев А.С., Афанасьев А.П., Лазарев И.В., Сухорослов О.В., Тарасов А.С. Научная сервис-ориентированная среда на основе технологий Web и распределенных вычислений // Научный сервис в сети Интернет: масштабируемость, параллельность, эффективность: тр. Всерос. суперкомп. конф. (21–26 сентября 2009 г., Новороссийск). М.: Изд-во МГУ, 2009. С. 463–467.

10.  Сухорослов О.В. Унифицированный интерфейс доступа к алгоритмическим сервисам в Web // Проблемы вычислений в распределенной среде: тр. ИСА РАН. М.: КРАСАНД, 2009. Т. 46. С. 60–82.

11.  Палюх Б.В., Егерева И.А. Методы классификации вычислительных сервисов // Вестн. ТвГТУ. 2012. Вып. 20. С. 14–19.

References

1.     Katalog matematicheskikh internet resursov [The catalog of mathematical Internet resources], available at: http://www.math­tree.ru (accessed 6 May 2013).

2.     Wolfram Mathworld Project, available at: http://math­world.wolfram.com (accessed 6 May 2013).

3.     Nigma.RF Project, available at: http://www.nigma.ru/in­dex.php?t=math& (accessed 6 May 2013).

4.     Biocatalogue Project, available at: http://www.biocata­logue.org/ (accessed 6 May 2013).

5.     Programmable web Project, available at: http://www.pro­grammableweb.com/ (accessed 6 May 2013).

6.     Deklaratsiya o mezhdunarodnykh printsipakh katalogiza­tsii [Notice on the int. principles of cataloguing], available at: http://www.ifla.org/files/cataloguing/icp/icp_2009-ru.pdf (accessed 6 May 2013).

7.     Bellman R., Zade L., Prinyatie resheniy v rasplyvchatykh usloviyakh [Decision making under fuzzy conditions], Moscow, Mir, 1976.

8.     MathCloud Project, available at: http://mathcloud.org/ru/ (accessed 6 May 2013).

9.     Astafyev A.S., Afanasyev A.P., Lazarev I.V., Sukhoroslov O.V., Tarasov A.S., Trudy Vseros. superkomp. konf. “Nauchny servis v seti Internet: masshtabiruemost, parallelnost, effektivnost” [Proc. all Russian supercomp. conf. “Internet scientific service: scalability, concurrency, efficiency”], Moscow, Lomonosov MSU Publ., 2009, pp. 463–467.

10.   Sukhoroslov O.V., Trudy ISA RAN [Proc. of ISA RAS], Vol. 46, Moscow, KRASAND, 2009, pp. 60–82.

11.  Palyukh B.V., Egereva I.A., Vestnik TvGTU [The bulletin of TSTU], 2012, iss. 20, pp. 14–19.


Permanent link:
http://swsys.ru/index.php?page=article&id=3606&lang=en
Print version
Full issue in PDF (13.63Mb)
Download the cover in PDF (1.39Мб)
The article was published in issue no. № 3, 2013 [ pp. 291-295 ]

Perhaps, you might be interested in the following articles of similar topics: