Терехин А.Н. () - | |
Ключевое слово: |
|
Ключевое слово: |
|
|
Исследование различных задач информационного поиска удобно проводить в рамках линейной алгебраической модели [1-3], где поисковые образы документов и запросов представляются элементами конечномерного векторного пространства, а поиск сводится к решению поискового уравнения, определяемого запросом, на конечном множестве. Рассматриваемый подход, как и большинство моделей поиска [4], отражает в большей степени попытку связать между собой представления документов в хранилищах данных и информационных запросов, нежели имитирует реальные процессы, в действительности происходящие при поиске. Характер этой связи описывается таким понятием, как релевантность, которое в данной модели интерпретируется путем введения мер близости между векторами. В работе рассматривается многокритериальная задача информационного поиска, описанная в рамках указанной модели, обсуждаются некоторые подходы к ее решению. Рассмотрим многокритериальную задачу:
где каждая задача r рассматривается на конечном множестве
а через G – совокупность симметрик rs: G={rs Класс G достаточно широк и применим на практике [5]. Приведем несколько примеров: – мера близости Минковского r1(x,y)= – мера близости Расела-Рао r2(x,y)=( – мера близости Танимото-Роджерса r3(x,y)= – геометрическая мера близости r4(x,y)= Если для решения задачи (1) использовать способы сведения к однокритериальной задаче (к примеру, путем линейной свертки), то она фактически сведется к задаче (2). Построение множества Введем в рассмотрение следующие понятия. Определение. Любые два вектора t', t" Неравенства вида
при этом отметим, что R={ Утверждение 1. Справедливо следующее вложение: Доказательство. Пусть Следствие 1. Справедливо вложение
Подмножества R и P, которые представляют собой псевдорелевантное и релевантное подмножества векторов соответственно, являются своего рода первым приближением множеств Следствие 2. Если Определим далее для Утверждение 2. Если Доказательство следует из построения векторов Следствие 1. Если приведенное утверждение выполнено для всех с= Следствие 2. Если Следствие 3. Алгоритм расширения подмножества 1. Построить подмножество
2. Определить подмножество
3. Если все 4. Построить множество 5. Для каждого
6. Для каждого
где 7. Стоп. Заметим, что построение подмножества R по причинам, приведенным выше, может вызвать затруднение. В этом случае следует положить Подытожим полученные результаты. Метод построения множества Конечно, такое дополнение следует проводить в том случае, если полученных решений явно недостаточно. В частности, по приведенной методике можно получать и точные решения поискового уравнения (все сделанные постро- ения и алгоритм поиска универсальны для определения как точных, так и приближенных решений). Утверждение 3. Задачу (1) можно свести к задаче вида
для нахождения хотя бы одного решения в случае использования метода линейной свертки при сведении задачи (1) к однокритериальной задаче. Задачу (1) можно решать методом введения метрики в пространстве целевых функций. Покажем, как, учитывая приведенные выше рассуждения, можно эффективно использовать этот метод для построения хотя бы одного решения задачи (3) – множества Утверждение 4. Пусть для каждого s определены различные
где Чтобы найти все решения задачи (3), следует получить решения каждой из задач минимизации, используя алгоритм расширения, а далее решать задачу (4) на Для нахождения всех решений рассматриваемой задачи (1) можно использовать идею алгоритма отсечения [6-8]. Представим множество T в виде
Введем следующие обозначения: I={1, …, c, …, p},
Утверждение 5. Пусть подмножества Тогда, если Доказательство. и соответственно
Тогда по условию справедливы следующие неравенства:
Пусть
С учетом определения (2) утверждение доказано. Утверждение 6. Пусть Тогда Доказательство. Пусть r Утверждение доказано. Следствие. Алгоритм отсечения для зада- чи (2). 1. Вычислить значения 2. Упорядочить 3. Определить множества индексов J:
4. Если 5. Определить множество индексов 6. Вычислить 7. Определить множество индексов 8. Перейти к п. 4. 9. Стоп. Понятно, что в случае сведения задачи (1) к однокритериальной целесообразно использовать приведенные выше утверждения для оптимизации ее решения [9]. Рассмотрим в данном случае возможность эффективного использования метода введения метрики в пространстве целевых функций. Утверждение 7. Пусть для каждого s определим различные где Доказательство. Пусть Так как rs Далее очевидно, что Тогда Из изложенного выше видно, что использование алгоритма отсечения в данном случае может оказать двойную услугу: во-первых, при решении задач вида (3) и, во-вторых, как следствие, представляется возможность решать задачу минимизации критерия h на множестве меньшей мощности. Список литературы 1. Решетников В.Н. Алгебраическая теория информационного поиска. // Программирование. - 1979.- № 3. - C. 78-83. 2. Решетников В.Н. Моделирование информационного поиска в информационно-поисковых системах. // Кибернетика. - 1979. - №5. - C. 129-132. 3. Решетников В.Н. Алгебраические модели информационного поиска. // Математические методы в исследовании операций. -М.: Изд-во МГУ, 1981. - С.186-192. 4. Boyce B., Kraft D.H. Principles and theories in information science. // Annv.Rev.Inf.Sci.Tech.1985.20.P.153-178. 5. Лейбкинд А.Р., Рудник Б.В. Моделирование организационных структур. - М., 1981. 6. Сотников А.Н. Алгоритм отсечения для различных мер сходства в задаче информационного поиска. // Вестник Моск. ун-та. Сер.15: Вычисл. матем. и киберн. - 1986. - №1. - С.70-77. 7. Решетников В.Н., Сотников А.Н. Алгоритмы отсечения для построения псевдорелевантных множеств.//Программное обеспечение вычислительных комплексов. - М.: Изд-во МГУ, 1985. - С.60-64. 8. Терехин А.Н. О применимости алгоритма отсечения для решения задач многокритериального информационного поиска. // Вестник Моск. ун-та. Сер.15: Вычисл. матем. и киберн. - 1989. - №4.- С.57-62. 9. Терехин А.Н., Пшенко С.Ю. О решении многокритериальных задач информационного поиска на матричных архивах. // Программное обеспечение и модели системного анализа. - М.: Из-во МГУ, 1991.- С.19-26. 10. Cотников А.Н. Терехин А.Н. Методы исследования задач псевдорелевантного информационного поиска. // Вопросы кибернетики. Анализ больших систем. - М., 1992. - С. 166-178. |
http://swsys.ru/index.php?id=625&lang=.docs&page=article |
|