ISSN 0236-235X (P)
ISSN 2311-2735 (E)

Journal influence

Higher Attestation Commission (VAK) - К1 quartile
Russian Science Citation Index (RSCI)

Bookmark

Next issue

2
Publication date:
16 June 2024

The article was published in issue no. № 4, 2007
Abstract:
Аннотация:
Authors: (chti@chti.ru) - , Ph.D, (chti@chti.ru) - , Ph.D
Page views: 9423
Print version
Full issue in PDF (2.00Mb)

Font size:       Font:

В настоящее время наблюдается серьезное увеличение объема корпоративной информации. В соответствии с отчетами IDC, рост объемов хранимых и обрабатываемых данных составляет более 70 % в год. В некоторых специфичных отраслях, например в медицине, наблюдается экспоненциальный рост информационных объемов. Ситуация осложняется требованиями нормативных актов и внутрикорпоративных стандартов, предписывающих длительное хранение некоторых видов информации, иногда в течение 5-10 лет. А это значит, что компания, имеющая корпоративные данные скромного объема в 1 Тбайт и показывающая рост этих объемов на 60 % в год, через 10 лет будет хранить уже 110 Тбайт информации. Проблема взрывного роста объемов данных тесно связана с другой проблемой – постоянно усложняющимися процессами управления хранением данных.

Управление информацией включает решение задач, связанных с организацией хранения, доступа, защищенности, производительности, то есть с обеспечением гарантированного уровня обслуживания. Размещение информации должно осуществляться, с одной стороны, на тех носителях, характеристики которых удовлетворяют заданным параметрам уровня обслуживания. С другой стороны, необходимо добиваться снижения затрат на их хранение. При организации хранения информации выбор носителя является определяющим (Жесткие диски вчера, сегодня, завтра //Системы хранения данных. 2005, №3).

Как правило, специалисты выбирают либо дорогостоящие средства хранения, максимально удовлетворяющие требования к уровню сервиса, либо недорогие запоминающие устройства. В этом случае возникают риски, связанные с потерей качества обслуживания информации (снижение надежности, потеря производительности и т.д.). Добиться оптимального распределения ресурсов хранения при снижении затрат на хранение и сопровождение информации можно, формируя информационные ресурсы в виде многоуровневой блочной среды.

С этой целью необходимо классифицировать корпоративную информацию по степени ее значимости для бизнес-процессов компании и применять инструменты управления размещением данных на устройствах хранения в соответствии с этой классификацией. В этом случае среда хранения формируется как совокупность дисковых массивов различных типов для каждого класса информационных ресурсов (ИР.)

Таким образом, можно сформулировать задачу, заключающуюся в оптимизации параметров многоуровневой среды хранения ИР с заданными локальными характеристиками каждого уровня и в то же время объединенными совокупностью ограничений на всю среду хранения. Оптимальным планом является номенклатура дисковых массивов и количество внешних запоминающих устройств (ВЗУ), составляющих дисковый массив, при минимальной суммарной стоимости хранения. В такой постановке задачу можно рассматривать как задачу математического программирования с блочной (многоуровневой) структурой. Одна система ограничений содержит все переменные и образует блок-связку, другая – лишь часть переменных и формирует блочную структуру (Глухов В.В., Медников М.Д., Коробко С.Б. Математические методы и модели для менеджмента. СПб., 2000).

С учетом вышесказанного дадим формализованное описание задачи. Пусть имеем P уровней и mp, p=1..P параметров, характеризующих ресурс, наличие каждого i-го параметра составляет наименьшее bpi и наибольшее Bpi, i=1… mp (значения в соответствующих единицах измерений). Эти параметры предназначены для формирования np типов дисковых массивов. Каждая единица j-го типа дискового массива содержит aij единиц i-го параметра ресурса. Требуется определить, какие типы дисковых массивов и какое количество дисков необходимо для формирования многоуровневой среды хранения с наилучшими показателями для принятого критерия оптимальности.

Обозначим через xpj количество единиц j-го типа дисковых массивов на p-м уровне, тогда математическую постановку задачи можно записать в виде:

                           (1)

при ограничениях

,                                      (2)

,                                       (3)

,                                                        (4)

, i=1…mp, p=1...P,                        (5)

, i=1..mp, p=1..P,                             (6)

, j=1..np, p=1..P,                                     (7)

где P – общее количество локальных блоков; m0 – число ограничений в блоке-связке; np – число переменных в p-м локальном блоке; mp – число ограничений в p-м локальном блоке; vpj – объем диска j-типа в p-м локальном блоке; cpj – стоимость хранения информации на диске j-типа в p-м локальном блоке; b0 – общее количество дисков  для хранения ИР; bpi, Bpi – наименьшее и наибольшее значения параметра ИР;  – множество целых, положительных чисел.

Условия (2)–(4) описывают блок-связку, (5), (6) – отдельные блоки (уровни), (7) – условие целочисленного значения переменной xpj.

Организация среды хранения ИР по заданной классификации может характеризоваться следующими основными параметрами: V – максимальный объем, Мб; Ps – пропускная способность, Мб/с; С – стоимость хранения, руб/Мб.

В ходе исследования проведены расчеты для случая трехуровневой среды хранения при следующих значениях параметров модели: P=3, m0=2, m1=2, m2=2, m3=2, n1=3, n2=2, n3=3, b0=100 с учетом изменяющихся параметров ИР. На рисунке приведены графики, отражающие зависимость объема и стоимости хранения при организации одноуровневой и многоуровневой среде хранения. Как показывают сравнительные результаты расчета, использование многоуровневой среды хранения снижает затраты на хранение ИР. При этом обеспечивается гарантированный уровень обслуживания информации. Однако использование многоуровневой среды хранения эффективно при достижении объема ресурса сотен Гбайт.

Подпись:  
Изменение стоимости хранения с ростом ИР
Проведенные исследования показывают, что использование многоуровневой структуры среды хранения позволяет сократить затраты за счет оптимального использования дисковых устройств. Если учитывать полную стоимость обслуживания информации, включающую затраты на поддержку информации на всех стадиях ее жизненного цикла, то эффект от внедрения многоуровневой среды будет расти. Введение такой структуры ИР позволяет обеспечить уровни сервиса в соответствии с потребностями бизнеса. В частности, в модели рассмотрены показатели производительности и объема. Данную модель можно расширить, добавив в качестве ограничений такие показатели сервиса, как требования к надежности и восстанавливаемости.


Permanent link:
http://swsys.ru/index.php?page=article&id=294&lang=en
Print version
Full issue in PDF (2.00Mb)
The article was published in issue no. № 4, 2007

Back to the list of articles