На правах рекламы:
ISSN 0236-235X (P)
ISSN 2311-2735 (E)

Авторитетность издания

ВАК - К1
RSCI, ядро РИНЦ

Добавить в закладки

Следующий номер на сайте

4
Ожидается:
09 Сентября 2024

Открытость структур в эволюционной модели данных

Статья опубликована в выпуске журнала № 2 за 2009 год.
Аннотация:
Abstract:
Авторы: Дрождин В.В. (drozhdin@yandex.ru) - Пензенский государственный педагогический университет им. В.Г. Белинского, г. Пенза, Россия, кандидат технических наук
Ключевые слова: семантика данных, операции над структурами данных, преобразование структур данных, структура данных, эволюционная модель данных, модель данных, информационная система, самоорганизующаяся система
Keywords: , , , data structure, , Data Model, information system, self-organizing system
Всего комментариев: 1
Количество просмотров: 11386
Версия для печати
Выпуск в формате PDF (4.72Мб)

Размер шрифта:       Шрифт:

Эволюционная модель данных (ЭМД) предназначена для создания активных самоорганизующихся информационных сред (СИС), способных самостоятельно поддерживать информационные модели с высокой степенью адекватности отражаемой предметной области в течение длительного времени. Это требует наличия в ЭМД очень мощных средств для организации информации об объектах различной структуры и сложности и возможности формирования представлений объектов с требуемой степенью детализации, включающих обобщенные (укрупненные, интегральные) показатели.

В [1] на основе системного подхода определяется пятислойная организация данных локальных систем. Эта организация данных является достаточно гибкой и может быть адаптирована для создания СИС. При этом различают структуры Si, являющиеся целостными объектами-системами и представляющие один объект i-го уровня, и структуры Ri, являющиеся множествами допустимых структур Si [2].

В таблице приведены слои организации данных локальной системы с их описаниями.

Номер слоя

Структуры слоя

Описание структур

Отношения между данными

Ограничения на данные

0

S0, R0

Абстрактный тип данных

1

S1, R1

Допустимое подмножество абстрактного типа данных

Ограничения на атомарные данные

2

S2, R2

Структура с жесткими (логическими) связями

Отношения (взаимосвязи) между данными типа функциональных и многозначных зависимостей

Ограничения на наличие и определенность ключей и др.

3

S3, R3

Структура, представляющая совместно используемые данные

Отношения, определяющие совместное использование данных

Ограничения на совместное использование данных

4

S4, R4

Структура, представляющая всю совокупность данных локальной системы

Отношения, определяющие автономную совокупность данных

Ограничения на автономность данных

Приведенные структуры конструктивно имеют следующие характеристики:

R0 – тип данных языка программирования или абстрактный тип данных, определенный и реализованный в системе, элементами которых являются атомарные объекты S0;

R1 – подмножество базового типа R0, объекты S1 которого получены по закону f (в частном случае тривиальному) из объектов S0;

R2 – множество сложных объектов S2, каждый из которых является композицией объектов S1;

R3 – более сильно связанная (совместно используемая) часть объектов S2 или совместно используемые S2 и ранее созданные объекты S3';

R4 – единственный объект S4, представляющий всю взаимосвязанную совокупность данных S2 и S3 локальной системы.

Можно провести определенную аналогию между структурами ЭМД и структурами реляционной модели данных (РМД) соответственно: S1 – элемент домена; R1 – домен; S2 – кортеж; R2 – отношение; S3 – кортеж представления; R3 – представление; S4, R4 – базы данных.

Как видно из характеристики структур и проведенной аналогии их со структурами РМД, открытость структур ЭМД вверх до формирования единой структуры, содержащей всю БД локальной системы, не содержит серьезных (логических) ограничений, следовательно, может считаться вполне приемлемой для организации данных в рамках ЭМД. Однако открытость структур вниз (до байтов и битов) ограничивается структурами R1, объекты S1 которых обладают изначально минимальной семантикой в моделируемой предметной области и представляют, например, фамилии, адреса, даты рождения и др. Но возникшая потребность в более точном моделировании предметной области часто требует выделения отдельных компонентов из принятых изначально минимальных объектов, например, названия населенного пункта из адреса или фамилии из ФИО. Поэтому необходима разработка методов и средств, позволяющих декомпозировать целостные структуры S1 на более мелкие подструктуры S-1 с возможностью восстановления из них исходных структур S1.

Для декомпозиции и согласования структур S1 и S-1 будем использовать две операции – q1 и q–1, которые определим следующим образом:

 .

Операция q1 осуществляет декомпозицию структуры S1 на две более низкого уровня,  и , выделением по определенному закону из структуры S1 подструктуры  и формированием оставшейся части структуры , а операция q–1 выполняет композицию структур  и  в структуру S1 по закону, обратному q1. Из объектов  и  формируются, соответственно, объекты  и , которые в общей структуре объектов будут соответствовать объектам уровня R1.

Использование объектов  и  ничем не отличается от использования обычных объектов R1, и только для восстановления исходного объекта R1 необходимо применить ко всем объектам  и  операцию q–1.

Последовательное применение операций  к остаточной структуре предыдущего разбиения   позволяет декомпозировать исходную структуру S1 на m+1 структур более низкого уровня, а последовательность операций  восстанавливает исходный объект S1, то есть

.

В качестве простой операции q1 может использоваться операция выделения одного или k первых слов из S1, в результате чего S1 разбивается на  и , причем в  может содержаться не более одного или k слов, а в  – оставшаяся часть строки S1. При этом операция q–1 будет выполнять конкатенацию, то есть приписывание в конец строки  строки .

В более сложных случаях операция q1, например, может выделять различные компоненты адреса, заданного строкой символов, и некоторую подстроку из строки по заданному условию, декомпозировать числовое значение на два значения путем использования операции взятия по модулю и другие. Операция q–1 всегда будет восстанавливать из объектов  и  исходный объект S1.

Типы данных объектов  и , то есть объекты  и , из которых формируются объекты  и , могут совпадать с объектом S0, из которого формировался исходный объект S1, или отличаться от него. Например, при выделении фамилии из ФИО как S0, так и  и  являются строками символов, а при выделении почтового индекса из адреса  может быть преобразован в целое число, но , как и S0, останется строкой символов.

Семантика объектов  и  может быть двоякой. Если для реализации операции q1 используется поименованный запрос или хранимая процедура, то их имя присваивается объекту , а объект  будет иметь имя исходной структуры R1. Поэтому после декомпозиции объекты  и  будут опять обладать семантикой в терминах предметной области.

Если же для реализации операции q1 используется общая часть часто задаваемых запросов, то объекту  присваивается некоторое стандартное (внутрисистемное) имя и он будет обладать только конструктивной семантикой, которая отражает целостность и способ получения объектов . Интерпретации в предметной области объекты  в этом случае иметь не будут. Однако если при дальнейшем функционировании СИС встретится поименованный запрос, выбирающий все объекты , объекту  будет присвоено имя этого запроса и объекты  приобретут семантику в терминах предметной области.

Если операция q1 осуществляет разбиение объекта S1 на  и , то после формирования объектов  и  путем применения q1 ко всем S1ÎR1 операция q1 становится тривиальной, а операция q–1 – эквивалентной обычной операции композиции объектов S1’ и S1”, что позволяет удалить специализированные операции q1 и q–1. Наиболее часто разбиением является деление строки на две подстроки. Например, после выделения из всех адресов почтового индекса могут считаться самостоятельными структурами  – «почтовый индекс» и  – «адрес», операции выделения почтового индекса и восстановления полного почтового адреса могут быть удалены.

Проблема формирования обобщенных показателей существенно более сложная, поэтому в данной работе рассмотривается только простейший вариант обобщения объектов.

Простое обобщение можно сформировать на основе принципа совместного использования данных. Например, если имеются отдельные парамет-

ры «число», «месяц» и «год», «часы», «минуты» и «секунды» или «фамилия», «имя» и «отчество», а их данные в подавляющем большинстве случаев используются совместно, то целесообразно композировать их в укрупненные параметры «дата», «время» и «ФИО» с указанием местоположения каждого отдельного параметра в укрупненном параметре. При этом отдельные параметры будут соответствовать структурам ,  и , а укрупненный параметр – структуре S1. Осуществление композиции укрупненного параметра из отдельных параметров будет соответствовать операции q–1, а выделение отдельных параметров из укрупненного параметра – операции q1.

Укрупнение параметров позволяет стандартно уменьшать количество компонентов в СИС без организации дополнительных слоев, что повышает эффективность обработки данных. Взаимообратные операции q–1 и q1, введенные для осуществления композиции и декомпозиции структур, являются операциями-шаблонами, для которых известны назначение, принцип действия и требования к исходным данным и результату. Особенности выполнения операций зависят от типов обрабатываемых данных и методов преобразования структур, поэтому их реализация на основе запросов пользователей будет определять возможности конкретных СИС в эволюции внутренней организации данных и достижении определенного максимума эффективности обработки данных.

Таким образом, открытость структур данных вверх и вниз в ЭМД позволяет создавать информационные модели предметной области с произвольной степенью детализации и последующим уточнением или огрублением этой модели с помощью средств, имеющихся в ЭМД.

Литература

1. Дрождин В.В. Системный подход к построению модели данных эволюционных баз данных // Программные продукты и системы. 2007. № 3. С. 52–55.

2. Система, симметрия, гармония. М.: Мысль, 1988. 315 с.


Постоянный адрес статьи:
http://swsys.ru/index.php?page=article&id=2270
Версия для печати
Выпуск в формате PDF (4.72Мб)
Статья опубликована в выпуске журнала № 2 за 2009 год. Версия для печати с комментариями

Возможно, Вас заинтересуют следующие статьи схожих тематик: