Модели активной памяти на бинарных полях в технологиях виртуализации каналов передачи и хранения информации

Send article

Journal influence

Higher Attestation Commission (VAK) - К1 quartile

Russian Science Citation Index (RSCI)

Bookmark

Next issue

№4

Publication date:

09 December 2024

Issues

2024

2023

№4 2023

all issues

Models active memory on binary fields in virtualization technologies of channel transmission and storage information

The article was published in issue no. № 1, 2010
Abstract:The methodology for the design and implementation virtualization technologies of channels transmission and storage information, using a model of active memory for binary fields. Virtualization and models of active memory for binary fields for channel storage and information objects is as follows. First, any information object is considered as a binary set. Secondly, this model defines a set of active memory, which is a logical «breaks» in his active and passive virtual cells.
Аннотация:Рассматривается методология разработки и реализации технологий виртуализации каналов хранения и передачи информации с использованием модели активной памяти на бинарных полях. Виртуализация модели активной памяти на бинарных полях для каналов хранения и передачи информационных объектов проявляется в том, что любой информационный объект рассматривается как бинарное множество, на котором определяется модель активной памяти, логически разбивающая его на активные и пассивные виртуальные ячейки.

Authors: Myshev A.V. (mishev@iate.obninsk.ru) - Obninsk Institute for Nuclear Power Engineering of the National Research Nuclear University "MIPhI", Obninsk, Russia, Ph.D

Keywords: virtual cell, binary information set, models active memory, virtualization technologies
Page views: 10541	Print version Full issue in PDF (4.03Mb) Download the cover in PDF (1.25Мб)

Разработка методологии построения оптимальных моделей активной виртуальной памяти в технологиях виртуализации каналов передачи и хранения информации является новым направлением в создании информационных систем другого поколения и ведется с использованием средств и способов интеллектуализации систем – виртуализации и когнитивных возможностей. Интеллектуализация таких систем во многом предопределяет динамику, надежность и независимость информации в каналах передачи и хранения, а также когнитивные возможности (представления и интерпретации логических построений, сложных явлений и процессов обмена информацией в каналах таких систем). Интеллектуализация информационных систем в прикладном аспекте – это и актуальность, и жизненная необходимость, а модели активной памяти являются одним из эффективных и возможных способов практической реализации технологических цепочек таких систем в каналах передачи и хранения.

В рассматриваемой методологии информационные объекты компьютерных систем и сетей, например, файловые структуры любой природы и более сложные системные и программные объекты, описываются посредством виртуальных моделей активной памяти на бинарных информационных множествах физической памяти, на которых определяются информационные пространства различной природы. Тогда любой носитель информации таких систем можно рассматривать, с одной стороны, как физическую среду памяти реальных компьютерных систем и сетей, а с другой – как систему виртуальной реальности, в которой протекают процессы виртуализации на разных уровнях иерархии памяти и каналов передачи, а также реализуется независимая виртуализация физического пространства памяти каналов хранения и передачи. Интеллектуализация реальных компьютерных систем и сетей в этом случае будет проявляться в том, что логическая организация, хранение и динамика информации в каналах хранения и передачи определяются процессами виртуализации, а аппаратные и программные средства являются физической средой протекания таких процессов.

Постановка задачи и способы ее решения. В классической чисто дедуктивной математической постановке задача для информационных каналов передачи и хранения в узком смысле может рассматриваться как задача построения кодера и декодера. Но в практической реализации и разработке моделей алгоритмов и процедур программных компонент информационных технологий для каналов передачи и хранения дедуктивный подход малоприменим и неэффективен. Здесь необходимо использовать другие подходы, учитывать процессы виртуализации и динамику информации на логическом уровне. В связи с этим предлагается индуктивный подход как в формулировке, так и в способах решения исходной задачи, который можно описать в виде следующей логической схемы:

- определить любой информационный объект (IO) (файлы и логические структуры) как бинарное множество;

- задать схему и алгоритм построения оптимального информационного пространства на этом множестве;

- определить модель и логическую схему организации заголовков для загрузки исходного IO в информационную «тару» (логические и физические элементы) памяти каналов передачи и хранения.

Рассмотрим следующие конфигурации информационных пространств для обозначенной задачи.

Первая определяется в виде кортежа , где X – множество цепочек символов алфавита N, а N, в свою очередь, представляет конечное множество цепочек переменной или фиксированной длины символов булевой логики, то есть нулей и единиц. Для описания и представления исходного IO в таких пространствах используются таблицы его информационной насыщенности на конечных топологиях информационных бинарных множеств, которым является любой IO системы или сети. Такие таблицы в первом приближении представляют собой дискретные распределения вероятностей букв алфавитов N информационных пространств для конкретного IO и являются основой для разработки и реализации способов (логических и алгоритмических) представления одного объекта в различных виртуальных информационных пространствах. Они, с одной стороны, отражают степень насыщения IO (файл или любая другая логическая структура) элементами алфавита N в информационном пространстве , а с другой, позволяют построить отображение φ (прототип модели кодера) исходного IO, определенного в , в любое другое информационное пространство , где N1 также представляет собой множество бинарных цепочек постоянной или переменной длины. Тогда обратное отображение φ-1 (прототип модели декодера) позволяет восстановить IO.

В зависимости от целевой установки такие отображения исходного IO позволяют изменять его физические размеры в каналах хранения и увеличивать скорость его транспортировки в каналах передачи, а также повышать физическую помехозащищенность и сохранять конфиденциальную защищенность на уровне как восприятия, так и перехвата информации. Совокупность алфавитов N и N1, представленных в виде матрицы A(2,L), где L – размерность алфавитов, образует формальный словарь. Отображение φ является формальной математической моделью построения алфавита N1 на основе исходного IO и алфавита N, а способы ее реализации могут быть различными (например, для технологий сжатия – метод Хаффмена и др.).

Элементы алфавитов формального словаря являются бинарными векторами и могут быть как фиксированной, так и переменной длины. В практической реализации для программных продуктов такие словари могут иметь следующие конструкции. Во-первых, элементы алфавитов N и N1 являются бинарными векторами фиксированной и одинаковой длины. Такие конструкции используются в классических схемах построения технологий криптографической защиты информации и других преобразований. Во-вторых, бинарные цепочки как физические прототипы элементов алфавитов N и N1 имеют фиксированные длины l и l1 при условии, что l1>l. Структуры такого типа используются для разработки технологий физической помехозащищенности IO для любого формата данных в каналах хранения и передачи. В-третьих, элементы алфавита N являются бинарными векторами фиксированной длины, а элементы алфавита N1 – переменной. Эти конструкции находят свое отражение в разработке технологий сжатия информации без потерь на основе методов энтропийного и арифметического кодирования, а также других префиксных способов. В-четвертых, элементы алфавитов N и N1 – это бинарные цепочки переменной длины.

Следует отметить, что последние конструкции мало исследованы и детально не изучены как в чисто математическом аспекте (теория кодирования информации), так и в прикладном – разработка и реализация компьютерных технологий и программных продуктов для передачи, хранения и защиты информации в каналах информационных систем на основе различных моделей кодеров и декодеров, а также способов сортировки и технологий виртуализации информации в каналах хранения и передачи. Тем не менее, построение математической теории исследования таких структур словарей для моделей алгоритмов и процедур кодеров и декодеров, а также разработка общей методологии создания технологий хранения, передачи и защиты IO в информационных каналах компьютерных систем и сетей на основе моделей активной памяти на бинарных полях и технологий виртуализации с использованием указанных конструкций словарей представляется актуальным и перспективным направлением.

Последняя конструкция словаря исследовалась автором по следующей схеме: элементы алфавитов словаря представлялись не как строки матрицы A(2,L), а определялись в виде подграфа на графе-шаблоне с динамически формируемой топологией связей. Вершины графа-шаблона однозначно соответствуют бинарным цепочкам переменной длины, а вершины, соответствующие цепочкам одинаковой длины, образуют подграф на графе-шаблоне, который в этом случае представляет структуру логически объединенных подграфов с заданной топологией связей и между вершинами подграфа, и между подграфами. В этом случае граф в памяти определяется в виде матрицы, элементами которой являются структурные объекты-числа. Модель такой матрицы определяется в алгоритмах кодера и декодера. Тогда словарь однозначно задается и определяется на графе-шаблоне и описывается алгоритмической моделью матрицы структурных чисел. В такой логической конструкции словаря в технологиях сжатия IO, даже на основе методов префиксного кодирования, эффективность подобной процедуры повышается за счет уменьшения физического объема словаря, когда формально он увеличивается, то есть имеет место виртуализация исходного IO в физической памяти.

В моделях алгоритмов и процедур программных компонент технологий сжатия IO на основе словарных методов используются логические структуры, которые описывают область памяти, где разместится формальный словарь. Такие структуры (назовем их заголовками) описывают поля памяти, в которых будут располагаться и служебная информация, и сам формальный словарь с кодируемым или декодируемым IO, то есть они определяют замкнутую структурированную динамически изменяемую область памяти. Поля таких областей будут как постоянной и переменной длины, так и с динамически изменяемой структурой [1]. В информационных технологиях такие структурированные поля памяти (заголовки) представляют собой информационный объект, связанный с некоторым исходным IO. Тогда заголовок можно определить как виртуальный объект в реальной физической памяти, имеющей виртуальную организацию.

Виртуальная организация размещения заголовка в информационном пространстве физической памяти каналов хранения и передачи компьютерных систем и сетей, с одной стороны, заключается в том, что она (физическая память), представляемая в виде бинарного информационного пространства, логически разбивается на виртуальные ячейки следующих типов. Первый тип – пассивные ячейки, размерность их фиксированная и информация в них (бинарная цепочка) не изменяется. Второй тип – пассивно-активные ячейки, размерность их фиксированная, но информация в них изменяется. Третий тип – активные ячейки, размерность и информация в них изменяются. Четвертый тип – активно-пассивные ячейки, изменяется их размерность, но не смысловая информация. А с другой – представляет собой способ структурирования и размещения виртуальных ячеек, на которые заголовок логически разбивается или сегментируется, в физической среде реальной памяти с жесткой адресной и логической организацией. В этом случае заголовок можно определить, с одной стороны, как образ, представленный в виде комбинации логически связанных виртуальных ячеек разных типов c учетом содержащейся в них информации, а типы ячеек и информация в них образуют систему непроизводных элементов образа, а с другой – как модель виртуальной памяти на бинарном поле.

Для более компактного представления (сжатия) образа исходного IO и его описания используются схемы кодирования, квантования и другие типы аналитических и дискретных аппроксимаций. Тогда исходную задачу кодирования и декодирования можно описывать и решать, используя аппарат теории образов, то есть рассматривать ее как задачу синтеза и распознавания образа исходного IO на бинарных полях, а методы решения таких задач определяются в рамках синтаксического (структурного) подхода.

Вторая конфигурация информационных пространств определяется в виде кортежа , где G – алгебраическая или логическая структура, заданная на . Как частный случай таких структур автором исследуются грамматики образов. Это обусловлено тем, что образное представление информации является более содержательным, позволяет использовать технологии систем научной визуализации и когнитивной компьютерной графики для выявления скрытых закономерностей в информационной и смысловой структуре исходного IO, а также является фактором, влияющим на когнитивные функции восприятия, анализа и формирования новых знаний [2].

При разработке и реализации технологий безопасной и компактной транспортировки и виртуализации заголовков и исходных IO различной природы в каналах передачи и хранения реальных компьютерных систем и сетей форматы файловых и других логических структур выступают в виде образов «тары» с заданными параметрами в конкретной физической среде памяти информационной транспортной системы, в которой размещаются и упаковываются и заголовок, и исходный IO.

В такой информационной среде систем виртуальной реальности заголовок и исходный IO представляются как неидентифицированный и неинициализированный информационный бинарный поток в каналах передачи и хранения компьютерных систем и сетей. Это означает, что они физически не привязаны к каким-либо форматам файлов, типам данных и логическим структурам, которые могут выступать в функциональной схеме технологий виртуализации каналов либо как атрибуты управления, либо как логически структурированные потоки информации. Такой подход создания технологий передачи, хранения и защиты информации определяет остов и методологию их разработки и реализации в каналах систем виртуальной реальности, когда с любым IO идет работа на физическом уровне. Последнее означает, что он (IO) изначально задается как бинарное множество, на котором определяются различные логические структуры, используя при этом формализм модели активной памяти на бинарных полях и ее виртуализацию. Эти способы позволяют изначально как в рамках одной модели памяти IO и технологий виртуализации его на бинарных полях, так и в рамках класса моделей проанализировать IO на физическом уровне. А результаты анализа позволят выбрать наиболее оптимальную модель памяти и технологий преобразования в каналах хранения и передачи, но уже в рамках новой парадигмы – виртуализация информационного объекта на бинарном поле с заданной моделью памяти, сортировка и размещение его в информационной «таре» каналов хранения и передачи конкретной информационно-транспортной системы.

Поскольку исходный IO является бинарным информационным множеством, на котором определены одна из конструкций информационного пространства и формальный словарь, IO можно описать в двумя способами, а именно: определить X или как множество статистически независимых символьных цепочек алфавита N, или как множество статистически зависимых символьных цепочек. Следует заметить, что в существующих технологиях сжатия информации без потерь на основе традиционных методов префиксного и арифметического кодирования и комбинаторного подхода [3] используется первый способ представления файловых структур – как множество статистически независимых элементов заданного формата (например, типа JPEG, TXT, DOC, BMP, MP3 и др.). Второй способ не применялся и, по-видимому (по общедоступным источникам), не исследовался относительно как его практического применения для разработки технологий кодирования, так и выявления его возможностей в методологии разработки технологий передачи, хранения и защиты информации. Разработка технологий кодирования IO на основе второго способа в классическом варианте предполагает использование метода L-грамм и других аналогичных способов. В логических схемах и моделях алгоритмов компьютерных технологий сжатия информации этот метод не нашел своего применения, так как в рамках парадигмы применения традиционных методов для разработки таких технологий он, на первый взгляд, представляется трудоемким, ресурсоемким и неэффективным. Проведенные автором исследования этого метода на предмет его применения для разработки компьютерных технологий передачи, хранения и защиты информации показали иные результаты.

Во-первых, этот метод можно использовать для разработки программных продуктов технологий сжатия, защиты и восстановления информации, учитывая корреляционные и статистические связи символьных цепочек в пространстве виртуальных ячеек активной памяти, хотя для разработки последних в рамках традиционного подхода он не применялся, по-видимому, в силу того, что не относится к методам кодирования в каналах с помехами. Во-вторых, при построении логической структуры и организации заголовка, который включает в себя размещение и сортировку как словаря, так и закодированного IO, очень полезную роль играют статистические связи и корреляции между L-граммами в формальном словаре или на графе-шаблоне, модель виртуальной активной памяти и способ заполнения содержимого за- головка в информационную «тару» канала. В-третьих, логическая организация и размещение заголовка в памяти строятся на основе модели виртуальной активной памяти с динамически формируемой структурой связей элементов виртуального объекта в адресном и информационном пространстве физической памяти [2].

Для анализа исходного IO как потока информации, определенного на бинарном множестве, в конкретной конфигурации информационного пространства с целью выбора параметров модели активной памяти и типа ее виртуализации для разработки оптимальной технологии передачи, хранения и защиты IO в каналах реальных систем и сетей, а также идентификации бинарного информационного потока (например, определить тип формата, к которому относится поток, – DOC, TXT, JPEG или др.), представляющего либо часть, либо целое неизвестного формата полученных данных, используются интегральные характеристики IO в конкретной модели памяти (B-энтропия, шенноновская энтропия, фрактальная размерность и др.). То есть в этом случае определяются такие параметры модели и тип ее виртуализации, при которых технология хранения, передачи и защиты будет оптимальной с точки зрения преобразования IO, его защиты, восстановления и идентификации. После выполнения процедуры анализа IO и определения оптимальных параметров модели памяти и типа ее виртуализации сначала разрабатывается логическая схема организации заголовка для выбранной конструкции формального словаря либо в виде матрицы, либо как структуры графа-шаблона, а затем проводится оптимизация схемы с целью эффективного размещения заголовка в информационной «таре» каналов хранения и передачи. В этом случае программные процедуры затаривания IO в физической памяти каналов хранения и передачи реализуются на основе технологий их виртуализации в отличие от традиционных алгоритмов и процедур на основе методов кодирования и декодирования информации в каналах.

На основе кратко изложенной и развиваемой методологии нового подхода построения моделей памяти IO и типов ее виртуализации на бинарных полях были разработаны и реализованы модели алгоритмов и программ компьютерных технологий сжатия, защиты, восстановления и анализа информации для файловых структур любой природы [2] в каналах передачи и хранения. Программная реализация технологий и анализ их практической реализации относительно программных продуктов аналогичного характера (например, технологии сжатия информации, криптографическая защита и др.) позволили получить уникальные результаты и сделать следующие выводы [4].

Во-первых, модели активной памяти и ее виртуализация на бинарных полях для компьютерных технологий передачи, хранения и защиты в каналах информационных систем позволяют повысить инвариантную защищенность IO относительно средств передачи и хранения и способов размещения их в информационной «таре» файловых структур любой природы и физической среды. Это означает, что такие модели дают одинаковый эффект как по архивации и сжатию IO, так и по защищенности в любой физической и информационной среде с точностью до бинарного отображения IO в ней, а образы этих структур в виртуальной памяти обладают информационной связан- ностью. Во-вторых, разработанные технологии сжатия информации и их практическая реализация на основе моделей активной памяти на бинарных полях в их самых простых реализациях позволили получить для рассмотренных классов IO результаты намного лучшие (на порядок, а для отдельных объектов и выше), чем дают широко распространенные архиваторы на основе алгоритмов Лемпела, Зива и др. [3], в то время как последние не предоставляют пользователю особой степени свободы и независимости для безопасной и быстрой транспортировки и обработки информации в каналах хранения и передачи компьютерных систем и сетей [2, 4]. В-третьих, разрабатываемый подход является новым способом разработки технологий виртуализации систем хранения и каналов передачи, но уже не в виде симметричных и асимметричных решений или аналогичных им, а на логическом уровне – модели активной памяти на бинарных полях и технологии виртуализации каналов хранения и передачи.

Литература

1. Мышев А.В., Тимашов А.А. Информационные технологии сжатия данных на основе динамически формируемой структуры связей // Микроэлектроника и информатика – 2008: тез. докл. М.: МИЭТ, 2008. С. 13.

2. Мышев А.В. Модели памяти на бинарных информационных полях для компьютерных технологий хранения, защиты и восстановления информации // Науч. сессия МИФИ-2008: сб. науч. тр. В 15 т. М.: МИФИ, 2008. T. 12. С.107–108.

3. Методы сжатия данных. Устройство архиваторов, сжатие изображений и видео / Д. Ватолин [и др.]. М.: Диалог-МИФИ, 2002. 384 с.

4. Мышев А.В. Когнитивные модели памяти на бинарных полях и методы data mining в технологиях хранения, передачи, анализа и защиты информации // Математические проблемы защиты информации и анализа данных: сб. науч. тр. Х Белорусс. матем. конф. Минск: Ин-т матем. НАН Беларуси, 2008. Ч. 5. С. 57–58.

Permanent link: http://swsys.ru/index.php?id=2427&lang=en&page=article	Print version Full issue in PDF (4.03Mb) Download the cover in PDF (1.25Мб)
The article was published in issue no. № 1, 2010

Perhaps, you might be interested in the following articles of similar topics:

Back to the list of articles

Software & Systems

Journal influence

Bookmark

Next issue

Issues

Models active memory on binary fields in virtualization technologies of channel transmission and storage information