Управление текстом и гипертекст: чему учит аризонская аналитическая информационная система

Подать статью

Авторитетность издания

ВАК - К1

RSCI, ядро РИНЦ

Добавить в закладки

Следующий номер на сайте

№4

Ожидается:

09 Декабря 2024

Выпуски

2024

2023

№4 2023

все выпуски

все статьи

Подписаться на RSS

Управление текстом и гипертекст: чему учит аризонская аналитическая информационная система

Статья опубликована в выпуске журнала № 3 за 1990 год.
Аннотация:
Abstract:

Авторы: Макгенри В. () - , Линч К. () - , Хупс Л. () -
Ключевое слово:
Ключевое слово:
Количество просмотров: 10018	Версия для печати

Начало восьмидесятых годов часто называют началом революции н области использования микроЭВМ. С 1980 по 1990 гг. пользователи приобрели миллионы копий пакетов обработки текстов и

систем управления базами данных (СУБД). Однако, несмотря на большое количество созданных систем, почти все СУБД ориентированы исключительно на обработку числовых и коротких текстуальных полей. В некоторых системах возможна обработка длинных текстовых полей, но все же эти поля довольно коротки с точки зрения текста. Возможность исчерпывающего редактирования и форматирования текстов такими сисгемами не обеспечивается.

Для устранения этого недостатка при обработке текстов были созданы многочисленные системы типа "оболочек", которые предоставляют пользователям некоторые возможности для оршнизации своих файлов. Наиболее предприимчивые пользователи создали собственные системы управления текстами на базе таких пакетов, как dBASE III Plus, но этот путь неприемлем для большинства пользователей. Кроме того, практически в любом случае такие продукты, как dBASE III Plus, имеют ограниченные возможности для поддержки систем управления и обработки текстов.

Информационно-поисковые системы чаще всего реализуются на крупных ЭВМ почти с момента появления вычислительной техники. Почти все они ориентированы лишь на ввод рефератов, а не на обработку и управление произвольным количеством текстуальной информации. Принимая во внимание стоимость больших ЭВМ и программного обеспечения, можно утверждать, что затраты на эти системы в значительной мере определяют сферу их применения. Чаще всего они используются лишь в очень крупных организациях. Этот вывод подтверждает предположение, что только информация, представляющая интерес для большинства пользователей, должна вводиться в систему. В свою очередь, удобство работы и простота доступа к микроЭВМ, большое разнообразие пакетов программ для обработки текстов и работа с настольными издательствами гарантируют, что большая часть работы с текстами будет выполняться на микроЭВМ, а не в среде больших ЭВМ. Итак, основное количество современных систем не ориентировано на наиболее целесообразное их применение на ЭВМ - управление текстами и их обработку.

В последние годы появился новый класс систем - гипертекст. Его определяют следующим образом: гипертекст, в самом общем смысле, - это СУБД которая позво-ляет объединять (частично или полностью) фрагменты отображаемой на экране информации, используя ассоциативные связи. На более сложном уровне гипертекст представляет собой программную среду, обеспечивающую совместную работу, связь и приобретение знаний. Продукты гипертекста напоминают способность человеческого мозга хранить и выбирать информацию с помощью справочных саязей для быстрого и интуитивного доступа. Имеющиеся программы гипертекста не исполь-т?ют типичных записей баз данных и файловых структур. Их база данных обычно состоит из рабочих пространств, определяемых размером выводимой на жран информации и называемых узлами. Большинство реализаций гипертекста соединяет у. лы либо иерархически либо неиерархически- Некоторые из них поддерживают Ы. структуры [5J.

Идею ассоциативной связи можно понимать двояко. В самом широком смысл это ■ любая связь, которую хотел бы создать пользователь независимо от того, ясш или скрыты отношения между узлами. Один из критиков назвал такое повимани структуры связи "отталкивающим", но он же считает, что такое определение обесвч чивает более полное описание интересуемой предметной области [14]. В более уз ком смысле ассоциативная связь - это связь, которую невозможно создать обычны* путем на основе исследования прямого содержимого двух узлов.

Гипертексты начали привлекать внимание после того, как фирма Apple начал распространять свой пакет HyperCard вместе с продажей компьютеров Macintosh.( тех пор пакеты гипертекстов стали появляться на рынке, как грибы после дождя. Га рантией того, что число их будет расти, является продукт Agenda фирмы Lotus дт компьютеров IBM PC. Смогут ля эти продукты удовлетворить все потребности в ул равлении и обработке текстов? Попробуем дать ответ на примере Аризонскои ана литической информационной системы (Arizona Analyst Information System - AAIS).

AAlS - исследовательская система, которая разрабатывалась на факультете еж тем управления информатики в университете штата Аризона с 1982 г. Она иснолъза валась в качестве испытательного стенда для получения ответов на вопросы о наиболее подходящих средствах для управления и обработки текстов в многопользовательской среде. Система создана на базе реляционной системы управления базами данных Ingres в операционной среде VMS для ЭВМ типа VAX.

Требования к программам управления текстами

При определении требований к про(раммам управления текстами системным аналитик должен начинать с изучения всего цикла деятельности, которую выполняет пользователь при использовании текста, обработке и управлении им. Предполагая, что пользователи не храпят тексты просто ради хранения, будем рассматривать хранение и поиск текста как специфичную проблему или как проблему принятия решения. В случае, когда пользователь работает на домашнем компьютере, проблема сводится к простому поиску адреса.

Одно из первых применений пакета HyperCard фирмы Apple - обработка епископ персональных телефонов и связанных с этими номерами телефонов адресами. Администратор в этом случае может связать хранение и выборку текста с любой частью процесса принятия решения, включая сбор информации о задаче, формулирование и оценку альтернатив и оценку результатов. Для научных сотрудников (как практиков, так и теоретиков) текст используется в таком же исследовательском цикле: нахождение информации для генерации или поддержки идеи эксперимента или статьи, выполнение дополнительных исследований иа основе анализа текста по мере реализации проекта и записи информации о нем, записи и просмотра результатов.

Для исследователя и руководителя текст может сопровождаться комментариями. Конечные продукты в виде замечаний, отчетов, статей и различной документации становятся доступными для последующей выборки и работы с ними.

Следовательно, программы управления и обработки текстов должны поддерживать весь цикл как при принятии решения, так и при проведении исследования. Они должны обеспечивать хранение, выборку и манипулирование текстовыми объектами любого размера. В отличие от информационно-поисковых систем, информация, которая может храниться в таких системах, может быть любого уровня специфичности. Программа управления текстами должна стать элекгронной записной книжкой; подобные программы будут называться интегрированными. Исходя из сказанного , нетрудно представить конечную интегрированную среду, представляющую собой набор объектов с ассоциативными программами для манипулировапия этими объектами, объединенные в виде узлов. Например, при чтении статьи может встретиться таблица данных, которую можно не рассматривать, а сразу начать работать с данными, используя программу электронной таблицы. Чтобы достигнуть этой цели, необходимо по крайней мере гарантировать, чтобы все текстовые объекты могли быть обработаны с помощью стандартного пакета обработки слов но выбору пользователя.

После краткого обзора проблемы управления текстами как центрального проДес-са при работе с компьютерами следует рассмотреть пять дополнительных вопросов. Во-первых, как должна храниться текстовая информация, чтобы ее поиск легко осуществлялся простым пользователем? Надо ли индексировать информацию традиционным способом? Могут ли связи гипертекста обеспечить приемлемые возможности для поиска?

Второй вопрос касается интерфейса с пользователем. Очевидно, пользователю должна предоставляться возможность просматривать наборы текстов на экране таким образом, как если бы их просматривали (или выбирали) с использованием традиционных средств. Пользователю должна быть предоставлена возможность выполнить поиск и использовать Булевы операторы для включения и исключения текстовых узлов. Выбор интерфейса пользователя, который бы строго О1раничивал эти виды операций с целью упрощения системы, будет безусловно препятствовать использованию всех функций системы.

В-третьих, каким образом системы управления текстами будут приспосабливаться к среде пользователя? Очевидно, пользователи хотели бы иметь все возможности управления текстами наряду с традиционными функциями баз данных. Возможность объединения адресов из пакета баз данных в пакете обработки слов является примером низкого уровня такого интерфейса. Коща исследователь при вычислениях создает текстовую базу данных, он может захотеть также ввести , например, список процессоров, скорости обработки и размера слов. Это означает, что пользователь должен иметь возможность просто преобразовывать информацию из текста в ноля с указателями на исходный текст, а система управления текстом должна отреагировать, чтобы приспособиться к среде пользователя.

В-четвертых, ясно, что большинство администраторов и ученых не принимает решений или не ведет исследований в вакууме. Системы управления текстами должны предоставлять возможность группе работать над проектом совместно. Когда несколько человек вводит связанные элементы исследования, то может возникнуть много неожиданных связей, так как каждая вновь введенная информация расширяет значение уже находящегося в системе, и это настолько существенно, что нет смысла использовать системы гипертекста для одного пользователя.

Последний вопрос связан с эффективностью. Какой механизм следует использовать для обеспечения всех этих функций и какой из них наиболее целесообразен?

Поддержка операций полного цикла

Исследовательская среда системы AAIS поддерживает все этапы исследований: от первоначального сбора данных до распределения информации по отчетам, статьям, книгам и информационным сообщениям. Первой операцией цикла исследования является определение проблемной области. Это можно сделать априори или с помощью AAIS для генерации новых идей. Следующий этап исслецования обычно включает ввод нового текста.

Ввод текста. Основным конструктивным элементом в базе данных AAIS является текстовой "атом", который содержит информацию по какой-то одной или ио нескольким связанным темам, подобно тому, как это делается при заполнении вручную справочной карточки. Текстовой "атом" содержит информацию на уровне, необходимом исследователю, отражая в каждый конкретный момент опыт исследователя, определяя тем самым ее полезность, правдивость, своевременность и доказательность [11]. Текстовой "атом" обеспечивает хранение "смеси" текстуальных данных Такие данные могут быть неполными, двусмысленными или даже противоречивыми, так что их сортировка в традиционных структурах записи, ще предполагается, что есть только одно правильное значение, непроизводительна или даже невозможна [11]. Одна из определяющих причин развития и использования системы управления текстами состоит именно в необходимости хранить и использовать такую информацию.

Программа ADD является основным межсетевым интерфейсом для информапин в базе данных AAIS. Программа ADD использует полноэкранный редактор и ввод данных на основе шаблонов. Существует много преимуществ в использовании того же полноэкранного редактора для ввода, который обычно применяется аналитиками для записи. Тот же редактор имеется в электронной почте, что позволяет исследователям коллективно применять возникшие идеи и анализировать их с помощью тех же инструментальных средств, которые используются для ввода и поиска данных. Вводить данные становится так же просто, как и выполнять комментарии, а так как наборы шаблонов, заполняемых входной информацией, могут поступать в базу данных не сразу, то пользователь получает свободу при переделывании работы или же при манипулировании входными наборами по мере прочтения исходного материала. Пакеты текстовых вводов могут готовиться на микроЭВМ и ра31ружаться для ввода. Новый, ориентированный на нужды пользователя редактор обеспечивает запросы к базе данных в реальном времени. Запросы могут включать проверку ссылок, индексной информации, контрольного отчета или аннотации.

В самом тексте можно выполнять индексацию, используя специальные символы для разграничения начальных и конечных точек. Б то же время индексы могут специфицироваться и благодаря использованию меток так же, как ори вводе библиографической информации, упрощая тем самым конструкции шаблонов с точки зрения программирования. Этот подход использовался при реализации управляемого словаря ключевых слов нескольких исследователей путем обработки свободного текста и сравнения с заранее определенными ключевыми словами.

Аннотация. Важной при вводе текста является возможность пользователя добавить любую аннотацию, соответствующую каждому текстовому "атому". Именно так система AAIS обеспечивает сбор и обработку исследовательского опыта для того, чтобы со временем поддержать компетентный совместный анализ и принятие решений. Учет в системе взаимодействия специалистов позволяет при принятии решении проследить процесс генерации идей, разработки ж проведения анализа для более эффективной поддержки решений. База данных AAIS, таким образом, выступает как долгосрочная "объединенная память" взаимосвязанных исследовательских усилий, направленных на получение унифицированного представления заключений с аспектами каждою участника. Аннотации могут использоваться на любом этапе процесса принятия решения. Более 10% текстовых атомов самой большой базы данных включает аннотации в той или иной форме (11].

Выборка текстовых атомов. Выборка производится с помощью программы VIEW. Программа VIEW поддерживает как интерфейс командного языка, так и интерфейс

меню, позволяя сжимать сложные запросы в хомпактную синтаксическую форму. Например, для того, чтобы отыскать все текстовые "атомы", которые относятся и к гипертексту, и к информационным поисковым системам, пользователю необходимо просто ввести:

$ view/keyword = ("hypertext","information retrieval systems")/and.

Оценка. В процессе исследовательского цикла часто возникает необходимость проверить информацию по ее источникам. Система AAIS требует, чтобы каждый текстовой "атом" ассоциировался с уникальным источником; один источник может ассоциироваться с рядом текстовых "атомов". Источники могут включать статьи, книги, технические отчеты, беседы, телевизионные или радиосообщения, анализы, диссертации или другие объекты, которые исследователь определяет как "источник" генерируемой части текста. Исходная информация включает библиографическую часть базы данных AAIS, а также может включать информацию, специфицирующую автора, редактора и издательство. Уникальный исходный идентификатор ассоциируется с каждым текстовым "атомом". Этот идентификатор включается в отчет, получаемый при использовании системы для генерации библиографии - процесса, который управляется другими инструментальными средствами. Так как такой отчет ввовь возвращается в систему, завершая этап исследовательского цикла, то в системе формируется контрольный журнал - журнал системы. Система AAIS обеспечивает непрерывный анализ и принятие решений, основанных на результатах анализа и на новой информации.

Несмотря на то внимание, которое уделяется системам гипертекста, очевидно, что большинство из них не поддерживает диапазон деятельности, охватывающий весь цикл процесса принятия решения или исследования [5]. Например, существующие системы гипертекстов не предъявляют жестких требований при связи узлов с их источниками. Мало внимания уделялось в системах гипертекста и вопросам поиска, за исключением поиска по ранее определенным связям, а в более общем смысле -вопросу организации и деятельности больших групп, которые в совместной работе будут формировать базы данных гипертекстов [1].

Гибкий поиск

В системе AAIS многочисленные идентификаторы, дифференцированные по предварительно определенным категориям, определяют каждый текстовой "атом" [1]. Эти категории включают людей, места и организации, а также общие ключевые слова или фразы, типичные для информационных поисковых систем [13]. Индексирование специфичности помогает существенно увеличить точность поиска. Базы данных AAIS используют неконтролируемые словари для ключевых слов и контролируемые словари для организаций и места их нахождения. Неконтролируемые словари имеют терминов в среднем на порядок больше, чем контролируемые [10]. Организации могут формировать иерархию, просто указав "родительскую" организацию. Файлы AAIS группируют текстовые "атомы" в соответствии с темой, предоставляя удобные хранилища для аяалитической работы. База данных - конкретная иерархия каталога - организует виртуальные файлы AAIS в узлы гипертекста [2]. Инструментальные средства системы AAIS обеспечивают просмотр иерархии и процесс составления файлов. Узлы каталогов и файлы могут иметь текстуальные описания, выводимые на дисплей во время просмотра [6]; файлы могут быть "открыты" для просмотра включенных текстовых "атомов". Иерархически организованные наборы текстовых атомов создают структуру метаданных, недоступную в традиционных информационно-поисковых системах [1]. К тому же иерархический каталог представляет собой тип управляемого словаря, так как текстовые "атомы" наследуют ключевые слова за счет связи с файлом в конкретном месте иерархии [11]. Семантические индексы, объединенные с файлами и иерархией каталога, составляют аналитическую часть базы данных AAIS.

Так как исследователи часто ассоциируют текстовые "атомы" с файлами AAIS, то эти файлы представляют результаты многих решений в соответствии с корреляцией между данным текстовым файлом и определением файла. В большинстве случаев файлы представляют ответ на запрос, определенный самим файлом. Например, исследователю выдается команда отослать все примеры локальных сетей (LANS), которые работают со скоростью „больше 10 Мбит в секунду, в файл, названный BIG-LANS.DAT. Пользуясь традиционной информационно-поисковой системой, очень трудно идентифицировать все рефераты, относящиеся к локальным сетям данного гипа, а в системе AATS достаточно указать:

$ view/file = biglans.dat

Файлы также предоставляют исследователям средства категоризации, что значительно облегчает интеллектуальную нагрузку при анализе. Иерархия каталога предоставляет средства сужения и расширения просмотра базы данных, недоступные в типичных информационно-поисковых системах. По этой причине вопрос о том, где разметаются файлы и иерархия каталога, является очень важным и критическим с точки зрения среды исследований системы AAIS.

Рассмотрим отличия в системах с гибким поиском и гипертекстом. Индексы, обычно используемые в AAIS, отражают содержимое узлов, которые они представляют. Значительные усилия были направлены на исследования автоматических методов индексирования, хотя ни один из них полностью пока не удовлетворяет современным требованиям [13]. Тем не менее, пользуясь индексами, пользователи могут осуществить поиск наборов узлов по интересующим их темам и выяснить, сколько узлов можно использовать перед их выборкой. Выбираемый набор можно упорядочить хронологически или в порядке ввода, но не в порядке релевантности к поставленному запросу. С другой стороны, гипертекст предоставляет пользователям возможность просмотреть узлы в соответствии с набором ранее установленных связей. Связи могут устанавливаться только на основании содержания или быть полностью accoi шативными.

Система шпертекста обеспечивает жесткое структурирование, поэтому доступ к узлам всегда производится с тем же отношением их друг к другу; нет способа определить, начинать ли просмотр или установить количество узлов, к которым необходим доступ, до тех цор, пока не-будут найдены все релевантные узлы. Для простых, очевидных, понятных связей жесткость связи гипертекста является преимуществом, так как она гарантирует, что пользователь перейдет к работе с самым релевантным узлом. Однако для сложных и нечетких запросов становится все труднее ориентироваться в базе данных гипертекста и управлять сю, что может привести к нецелесообразности вести какой-либо поиск вообще |5|. Объединяя некоторые аспекты ор!шш-зации узлов гипертекста с возможностями мношасиектной выборки через иерархию файлов, система AAJS реализует лучшие черты обеих моделей.

Интерфейс пользователя

Так как система AAIS ориентирована в основном на мини-ЭВМ, то ей присущ ряд недостатков относительно интерфейса с пользователем. У пользователя должно быть некоторое представление об операционной системе VAX VMS, редакторе EDT и программе MAIL для того, чтобы успешно работать с системой AAIS.

Образование "окон" эмулируется вставкой в программы вызываемых интерфейсов, поэтому большинство программ может вызываться из других пакетов, но эти "окна" в основном не видимы друг для друга. Нет поддержки для устройства типа "мышь".

Было бы хорошо иметь такую возможность, но гораздо важнее предоставить пользователям достаточно развитые основные инструментальные средства, чем функционально ограниченный дружественный интерфейс. Доступ к этим инструментальным средствам обеспечивается с помощью меню или команд, имеющих вид и действующих как команды VMS. Если пользователь знаком с командами VMS, то работать с командами системы AAIS ему очень просто. Применение этих средств гарантирует, что сложные запросы могуг быть выражены в компактной форме, предоставляя неподготовленным пользователям доступ ко всем возможностям системы. Во всех про1раммах имеются средства помощи, ориентированные на контекст.

Программа VIEW обеспечивает выборку и организацию данных, составление отчета о данных и возможносгь гснерации библиографии программного обеспечения AA1S. Широкие возможности выборки данных и составления отчетности позволяют использовать программу VIEW как фильтр для информации базы данных посредством выборки объектов AAIS в терминах логических комбинаций других объектов AAIS [7]. Используя программу VIEW, пользователи могут формировать сложные Булевы запросы на просмотр индексов и создание отчетов. Запросы могут объединять как традиционные информационные индексы (типа "выборка", "полный текст"), так и иерархические идентификаторы типа "гипертекст". Имеются также возможности гибкой генерации библиографии и просмотра иерархии. По умолчанию программа VIEW ведет просмотр и выборку текстовых "атомов", основанные на любом под-наборе индексов, а также полных текстов в любой комбинации. ПрО1рамма VIEW наиболее часто используется для выборки текста, она же обеспечивает выборку других объектов базы данных, создание библиографии, генерацию отчетов и оформляет их в любом виде. При выборке текста про1рамма VIEW выводит на экран отдельные текстовые "атомы" для работы с конкретным просматриваемым текстовым "атомом" или целым набором выбираемых текстовых "атомов".

Операции просмотра предусматривают возможность перемешения между текстовыми "атомами" в выбранном наборе. В режиме поиска производится контроль всех выбираемых текстовых "атомов" наличия специфицированной символьной строки. На экран дисплея выводятся все текстовые "атомы", в которых обнаружена эта строка. Средство индексирования выводит на дисплей идентификатор ссылки и 60 символов текста для каждого текстового "атома" в выбранном наборе. Дисплей позволяет легче передвигаться к интересующему текстовому "атому".

Из интерфейса VIEW можно редактировать текст (используя тот же редактор, что и для ввода данных), чтобы включить аннотацию или результат анализа. Дополнительные индексы могут связываться с текстовым "атомом" в зависимости от потребностей каждого пользователя. Он может просмотреть все индексы, связанные с выводимым на дисплей текстовым "атомом". Если пользователь запрашивает информацию об организации или о персональных индексах, связанных с текстовым "атомом", то ему предоставляется информация, касающаяся использования этих индексов к базе данных в целом. VIEW обеспечивает и слияние наборов идентификаторов, основанных на Булевых комбинациях.

Иерархия файлов и каталогов может варьироваться в зависимости от конкретных потребностей и интересов пользователя. Первоначально из-за недостаточности информации очень трудно сформировать требуемые иерархии [6]. Изменения в логической структуре иерархий, а также содержимого файлов часто вызываются необхо-

димостью, так как в них включается дополнительная информация или же уточняет i ся круг интересов пользователя. При этом используются другие наборы текущей ин- i формации ш1Я создания базы вновь возникшего интереса. База данных просматри j вается на наличие информации, соответствующей запросам, а затем с иомощьк профаммы VIEW могут быть созданы файлы и совершенно новые узлы в каталоге Возможность передать сообщение в набор текстовых "атомов" о новой тематической области, т.е. создать файл и разместить его в иерархии каталога, делает прог рамму VIEW очень эффективным инструментальным средством, используемым для создании и управления связями в сети гипертекста [1]. VIEW обеспечивает просмотр индексов посредством их выборки и ввода значения частичной выборки. Затем можно просмотреть индексы на их совпадение для частичного поиска и выбрать такие, на которых будут базироваться последующие выборки. Это особенно важж для индексов ключевых слов и индексов пользователя, где наиболее часты синтаксические синонимы. Если системы гипертекста будут поддерживать все виды деятельности пользователя, то они должны включать богатый набор ин струм ентальньп средств для манипулирования узлами.

Создание системы AA1S в соответствии с конкретными условиями Одпим из наиболее важных выводов, сделанным по результатам работы с системой AAIS, является то, что использование систем типа "гипертекст" наиболее целесообразно, если они ориентированы на решение вопросов конкретной области информации |1). Обеспечивается это главпым образом за счет иерархии файлов. В каталоге AAIS и иерархии файлов отражаются концепту ал ьны'е модели пользователей, создающих их. Это в свою очередь определяет значение выбираемых терминов ключевых слов и помогает во всем процессе организации базы данных. В системе AAIS используются конкретные эвристические алгоритмы для организации каталогов. Среда гипертекстов должна обеспечивать расширения, чтобы приспособить ее к особенностям конкретных областей данных.

Среда коллективных пользователей Программное обеспечение, базы данных и иерархия каталогов и файлов образуют

пользовательскую среду AAIS. Все пользователи могут быть связаны с одной базой данных, а отдельный пользователь - со многими. В каждой базе дапных существует созданная пользователем иерархия каталога и файла. Важным критерием эффективной поддержки решения является возможность перехода к разным базам данных и соответствующим им иерархиям каталогов и файлов с помощью одной команды, которая специфицирует "текущую" базу данных [12]. Так как система AAIS создана на основе реляцйошюй СУБД, то-обеспечиваются средства целостности данных, их совместного использования, восстановления и защиты [3].

Для обеспечения целостности данных очень важна обработка транзакции. Файлы системы AAIS также являются механизмом, используемым для маршрутизации интересующих специалиста текстовых "атомов". Например, если один специалист занимает локальную сеть, то по соглашению текстовой "атом" касающейся локальной сети будет связан с текущим файлом этого специалиста. Это целесообразно в том случае, когда пользователи, работающие с разными областями, неосторожно относятся к собственной информации или же когда новые пользователи недостаточно хорошо знают иерархию файлов. Текстовой "атом" можно связать с файлом, специально установленным для информации локальной области. Концепция файла необходима, так как специалист в процессе исследования обычно интересуется несколькими областями информации. Он может мгновенно выбрать самую свежую

информацию, введенную в базу данных. Для пользователей это очень важная форма коммуникации. С помощью интерфейса VIEW можно довольно просто выполнить перем аршрутизацию.

Эффективность

Благодаря использованию системы Ingres AAIS эффективно интегрирует возможности выборки информации [4,8]. Библиографическая и аналитическая часть базы данных AAIS формирует набор отношений, который составляет схему базы данных AAIS. Описание текстового "атома", справочная и аналитическая информация обеспечивают эффективное хранение и поиск данных, которые меняются как по формату, так и по содержанию и по возможным уровням анализа. Использование многочисленных индексов с богатой семантикой уменьшает обитую стоимость запроса и повышает надежность и точность ответа [10]. Такая схема обобщает основные принципы исследований в любой области. Гибкость схемы определяется текстовым "атомом" как центральным звеном схемы; при использовании этой схемы возможен просмотр иерархии и нахождение необходимой фактографической информации. Ко-нечпо, предполагается дополнительное усложнение схемы для выполнения этих работ в "беспорядочной" среде данных |9|. Обычно пользователи редко используют схему непосредственно, хотя имеющийся язык запросов СУБД обеспечивает выборку и манипулирование данными в базе дапных AA1S. Сжатие данных в Ingres и средства сортировки индексов экономят память. Каждый индекс используется в базе данных в форме указателя, с тем чтобы не распространялись многочисленные копии избыточной информации. Схема AAIS и программное обеспечение осуществляют контроль избыточности данных.

Способ реализации программы VIEW обеспечивает значительную гибкость с минимальным объемом программы. Программа VIEW управляет всеми объектами с помощью гибкого интерфейса обработки запросов, названного общим процессором запросов (GQP) [7]. Процессор GQP является интерфейсом на программном уровне, который предоставляет простое и естественное средство для описания и осуществления доступа к элементам базы данных с помощью логических объектов. Процессор создаст и выполняет синтаксически правильный запрос, основанный на лшической цели запроса и квалификации объекта. Логические целевые объекты идентифицируют наборы пар RELATION-ATTRIBUTE, которые определяют, какие значения базы данных должны выбираться. Логические объекты квалификации идентифицируют наборы нар RELATION-ATTRIBUTE, определяющих путь от значения выборки к целевому объекту. Во время выполнения каждый объект расширяет синтаксически правильные составные части, что позволяет изменять объекты без рекомпиляции программы, так как определения объекта находятся вне компилируемого кода. Например, запрос на просмотр, приведенный выше (view/keyword = ("hypertextVinformation retrieval systerns")/and), будет автоматически анализироваться посредством GQP на эквивалентное представление OUEL: RangcofrlisINDX Rangeofr2inINDX

Retrieve (rl.textid)where rl.keyword = "hypertext" and r2.keyword = "information retrieval system" and rl. text id = r2.textid

(Выбрать (rl, идентификатор текста), где rl. - ключевое слово = "гипертекст" и г2. - клочевос слово = "информационная поисковая система" и rl. - идентификатор текста = г2.-идентификатортекста).

Неподготовленному пользователю довольно трудно создать такой запрос.

Это происходит потому, что система AAIS создана на основе СУБД с заранее определенными характеристиками. Можно считать это одной из причин того, что епк не настало время переноса AAIS в микросреду. Поставщики системы пшертексп должны будут считаться почти со всем диапазоном возможностей, предоставляв мых СУБД, если они захотят предоставить возможности интегрированного управле ния текстом.

В прошлом системы управления текстами использовались лишь на больших ЭВМ что было очень дорого, поэтому могли поддерживаться только очень большие бая текстов. Системы управления базами данных на микроЭВМ предлагают замаичиш перспективы управления текстом, но не обеспечивают достаточной поддержи даже основных функций. Создаются новые инструментальные средства генерации гипертекста с вводом на уровне микроЭВМ. Нами был рассмотрен желаемый набор функций для управления текстом и показана реализация данного набора в одной ш исследовательских систем. 18 систем гипертекста, описанных Конклииом в 1987 г. (из которых только 4 системы используются в настоящее время), имели характеристики, сравнимые с характеристиками AAIS /2j. Объем работ, необходимый дм ввода и обработки баз данных гипертекстов, очень велик, и не имеет смысла создавать систему для одного пользователя или систему, которая не поддерживает хота бы описанные функции.

СПИСОК ЛИТЕРАТУРЫ

1. Carmel,E.,McHenry,W К., Cohen ,Y.," Building Large. Оулаггис Hypertext, How Do We Link Intelligently', to eppear Journal of Manaflemtni Information Syitont.Fall. 1909-

2. Cortklin. Jeff, ■ Hypertext - an Introduction ana Survey. IEEE Computer 20,9(SepL.19a7), 00 17-41,

3. Oale.C.J.. An Introduction -i '^^M-yuY. 3rd Ed., Reading.MA,: Addison-Westay pubinding Company, 198?.

4. DobOK.J. SiymanAi, В.,"An Implementation ol a Helalional Inteiface to an Information Retrieval System", Informatjon Syilerm, 6, 3 [1981). pp. 219-228.

5. Fioorio, Janet, "Д Grand Vhiion'. Byte. Oct. 198S. pp. 237-2SJ.

6. Haiaaz, Fran* G.. "Refleclione on Nolocsrda: Seven Uttuec for the Next Generation or Hypermedia SyHem*,1 Communication* ol the ACM, 31,? (Jury 1ЭВ8), PC. 836^55.

7. Lynch, K. J,. Hoopei. L. M . 'An ln»(»« I» Rapid prototyping sr>d Evolutionery Support of Del»b4M-lntan

Creation and Ргосви1вп of Hypertext].' Нйучно-текнивеская Информации, Cepun 2: Информационные Процессы и Системы [Scientific

Technical Information, Sarraa 2: Information processes and Systems], May, 1988, pp. 2-6.

Постоянный адрес статьи: http://swsys.ru/index.php?id=1419&page=article	Версия для печати
Статья опубликована в выпуске журнала № 3 за 1990 год.

Возможно, Вас заинтересуют следующие статьи схожих тематик:

Назад, к списку статей

Программные продукты и системы

Авторитетность издания

Добавить в закладки

Следующий номер на сайте

Выпуски

Управление текстом и гипертекст: чему учит аризонская аналитическая информационная система