ISSN 0236-235X (P)
ISSN 2311-2735 (E)

Journal influence

Higher Attestation Commission (VAK) - К1 quartile
Russian Science Citation Index (RSCI)

Bookmark

Next issue

2
Publication date:
16 June 2024

The article was published in issue no. № 4, 2007
Abstract:
Аннотация:
Author: () -
Page views: 9217
Print version
Full issue in PDF (2.00Mb)

Font size:       Font:

Огромное количество существующих в настоящее информационных систем функционирует на основе так называемых классификаторов – линейных или древовидных списков параметров, позволяющих описывать информацию с некоторой точки зрения.

Одной из основных особенностей по обработке информации, которую должна учитывать подобная система, является периодическое изменение схем, описывающих данные. Под схемой понимается совокупность параметров определяющих некоторый информационный срез. Следует учитывать, что в каждый момент времени данные должны представляться в соответствии с актуальным на данный период классификатором и со связанной с ним схемой. При этом должна присутствовать возможность сопоставления информации за разные исторические периоды. В настоящей статье предлагается один из вариантов решения данной проблемы.

Под классификацией будем понимать группу классификаторов, описывающих одну и ту же информацию, но в разные временные периоды.

Выделим два вида классификаций:

·     базовые классификации, содержащие условно постоянную информацию (к таким классификациям относятся в первую очередь те, которые идентифицируют временную принадлежность различных данных: «года», «периоды»);

·     классификации, содержащие периодически изменяемую информацию.

Классификаторы, входящие в состав одной и той же классификации могут различаться как структурой, так и своим содержанием. Базовые классификации представлены единственным классификатором, практически не изменяющимся с течением времени (возможно только его дополнение, а изменение информации в нем или ее удаление запрещено).

Определяющим атрибутом классификатора, является его период действия – временной интервал, заключенный между датой начала периода  и датой конца , . Период действия уникальным образом идентифицирует классификатор, с его помощью задается порядок на множестве группы. Классификатор A предшествует классификатору B, в этом случае A и B имеют смежные периоды:  и  соответственно, . Исключено существование классификаторов с пересекающимися периодами действия. Таким образом, объединение периодов действия классификаторов дает непрерывный период существования группы .

Содержание классификатора будем определять конечным множеством кодов. Код имеет основное числовое представление (код может быть представлен буквенно-цифровой комбинацией, составленной по определенным правилам), задающее его уникальность в пределах классификатора и строковую расшифровку в виде наименования. Систему кодов предлагается задавать в виде иерархической структуры (конкретное правило формирования кода можно задавать в зависимости от смысловой нагрузки классификаторов).

Ассоциация классификаторов – это необходимый механизм для осуществления связи систем кодов двух классификаторов. Имеет смысл ассоциировать классификаторы, имеющие единую структуру данных, то есть принадлежащие одной классификации. Кроме того, эти классификаторы должны иметь соприкасающиеся периоды, иначе говоря, быть смежными.

Ассоциирование должно выполняться по принципу «один-к-одному», это означает, что код одного классификатора может быть связан только одним кодом другого классификатора. Соблюдение данного принципа связано с необходимостью ассоциации несмежных классификаторов транзитивно через последовательность смежных.

Таким образом, задача ассоциации двух классификаторов  и  состоит в задании бинарного отношения между множествами их кодов: .

Для этого отношения необходимо выполнение условия, чтобы любой элемент из области определения отношения  был связан отношением с одним и только одним элементом области значений  и наоборот. Другими словами, отношение должно быть биективным:

; .

Возможны различные варианты задания отношения ассоциации классификаторов, среди которых выделяются: прямая ассоциация по числовому коду, косвенная и смешанная ассоциации.

Прямая ассоциация по числовому коду. Как правило, числовое представление кода классификации не меняется в течение длительного периода. Принимая во внимание его уникальность в рамках самого классификатора, приемлемо задание ассоциации по равенству этих числовых кодов. Отличительной особенностью данного способа ассоциации является то, что, он имеет достаточно простую реализацию на практике и предоставляет быстрый алгоритм связывания классификаторов.

Косвенная ассоциация. При вводе в действие с какого-либо периода классификатора с новой системой кодов становится невозможным задание прямой ассоциации. Поэтому возникает потребность задания отношения косвенно. При этом отношение может быть задано таблично, по смысловой нагрузке, возложенной на наименование строки классификатора. Следовательно, таблица отношения может быть получена по соответствию наименований кодов классификаторов. Задача соответствия наименований разрешается с помощью оценки релевантности символьных строк.

Смешанная ассоциация. Слияние двух описанных ранее подходов при задании отношения делает механизм ассоциации наиболее гибким. Приоритет между вариантами должен устанавливаться в зависимости от конкретной ситуации.

Для выбора актуального классификатора, необходимого как для представления данных, так и для построения цепочки ассоциаций, предлагается ряд правил.

Чтобы выбрать из группы классификатор, необходимо знать временной интервал, за который требуются данные. Для определения данного интервала используется механизм пересечения базовых классификаторов. Базовый классификатор входит в состав базовой классификации и является у нее единственным. Особенность построения базового классификатора заключается в том, что он не имеет периода действия (является бессрочным), однако каждая его строка имеет свой период действия. Периоды действия строк в пределах одного классификатора могут пересекаться. Периоды действия строк и периоды действия справочников существенно различаются, если у классификатора период задается с помощью двух полных дат (день, месяц, год), то у строки базового справочника даты могут быть неполными (например, 1 августа – 31 августа, без указания года и т.п.)

При определении параметров отбора надо учитывать, чтобы среди них обязательно были базовые классификации. Условием достаточности количества привязанных базовых классификаций является то, что в пересечении периодов строк базовых классификаторов образуется временной интервал, у которого начальная и конечная даты полные (день, месяц, год). В соответствии с полученным интервалом и будет отобран соответствующий ему классификатор.

Таким образом, предложенный вариант позволяет достаточно эффективно учитывать изменения классификаторов и связанных с ними схем с течением времени.


Permanent link:
http://swsys.ru/index.php?page=article&id=305&lang=en
Print version
Full issue in PDF (2.00Mb)
The article was published in issue no. № 4, 2007

Back to the list of articles