ISSN 0236-235X (P)
ISSN 2311-2735 (E)

Journal influence

Higher Attestation Commission (VAK) - К1 quartile
Russian Science Citation Index (RSCI)

Bookmark

Next issue

4
Publication date:
09 December 2024

Dataflow modeling in the distributed computer systems

The article was published in issue no. № 1, 2010
Abstract:When select planning method of computer dataflow processing in the distributed computer systems the task of design adequacy input dataflow model is the most currency. In the article suggested flexible structurally and parametrically adaptive dataflow model, based on which experimentalist can generate half-size dataflow model with required for experiments adequacy.
Аннотация:При выборе метода планирования процессов обработки потока запросов в распределенных вычислительных системах особенно актуальна задача разработки адекватной модели входного потока. В работе предложена гибкая структурно и параметрически настраиваемая модель потока запросов, на основе которой можно генерировать полунатурные модели потоков с требуемой для проведения экспериментов адекватностью.
Authors: Loginov I.V. (liv@academ.msk.rsnet.ru) - Academy of the Federal Guard Service of the Russian Federation, Orel, Russia, Ph.D, (liv@academ.msk.rsnet.ru) - , Ph.D
Keywords: planning, input dataflow, distributed computer systems
Page views: 12651
Print version
Full issue in PDF (4.03Mb)
Download the cover in PDF (1.25Мб)

Font size:       Font:

Планирование процессов обработки потока запросов в распределенных вычислительных системах (РВС) осуществляется исходя из цели, архитектуры вычислительной системы и модели потока запросов. Существует множество методов планирования, отличающихся целью, используемыми моделями РВС и потоками запросов, а также алгоритмами распределения ресурсов. Эффективность использования существующих методов планирования в большой степени зависит от их соответствия области применения. Основной задачей при планировании является обеспечение требуемого качества предоставляемых услуг по обработке запросов пользователей. Для этого необходимо выбрать и применить оптимальный для конкретной области метод планирования. Наличие множества различных по эффективности альтернатив обусловливает сложность выбора. Снижение оперативности, простой ресурсов в результате неоптимального выбора определяют особую актуальность задачи оценивания методов планирования процессов обработки запросов в РВС.

Подпись:  
Рис. 1. Порядок генерации модели потока запросовПри сравнительной оценке методов планирования широко применяется моделирование процесса обработки запросов в РВС, в том числе с использованием полунатурных моделей. Согласно работе [1], для оценивания методов планирования необходимы модели вычислительной системы, входного потока запросов и системы планирования. В настоящее время существуют полунатурные модели РВС и систем планирования, которые могут использоваться при исследовании процесса обработки запросов. Кроме того, есть адекватные модели потоков запросов для имитационных систем моделирования, например, в системах SimGrid, OptorSim. Полунатурные модели, представленные в виде генераторов нагрузки, не обладают требуемой для оценивания методов планирования точностью, что приводит к необходимости разработки новой модели для каждой исследуемой РВС. Отсутствие полунатурных моделей с требуемой адекватностью и значительные потери при необоснованном выборе метода планирования определяют особую актуальность задачи разработки полунатурной структурно и параметрически настраиваемой модели потока запросов в РВС.

К модели предъявляются следующие требования:

– адекватность, определяемая возможностью настройки структуры модели и ее параметров по критерию пригодности в соответствии с требованиями эксперимента по выбору метода планирования;

– обеспечение повторяемости реализаций моделей потоков запросов, а также взаимодействия с различными системами планирования.

Поток запросов L состоит из последовательности запросов. При этом он является случайным и представляет собой последовательность событий, наступающих в случайные промежутки времени. Событием является факт поступления запроса пользователей в РВС для обработки. Каждый запрос QÎL требует выделения ресурсов из их ограниченного множества. Для оценивания метода планирования предлагается использовать модель потока запросов , которая генерируется системой генерации G из исходной гибкой модели потока запросов F(L) путем ее структурной и параметрической настройки:

,                             (1)

где S – структурная, P – параметрическая настройка исходной модели; G – генерация полунатурной модели.

Предлагается моделировать поток запросов с использованием концептуальной модели следующего вида (рис. 1):

,              (2)

,                                                             (3)

где PL – параметры модели потока запросов; F(li) – параметрически и структурно настраиваемая модель потока однотипных запросов (единичный поток); n – количество единичных потоков в модели; r – связи между потоками. Количество параметров может изменяться экспериментатором в зависимости от условий. Обоснованность выделения потоков однотипных запросов определяется работой [2], в которой указывается, что для большинства вычислительных систем набор из порядка десяти потоков однотипных запросов определяет 85–90 % вычислительной нагрузки.

Каждая модель единичного потока формируется на основе модели запроса, образующего поток, и параметров потока:

,                                              (4)

,                                                 (5)

где  – параметры модели i-го единичного потока; F(Qi) – модель запроса; i – интенсивность поступления запросов; g – вид закона распределения времени между поступлениями запросов; {pg} – параметры закона распределения; w – закон изменения интенсивности. Список параметров модели настраивается экспериментатором в зависимости от условий проведения экспериментов.

Модель запроса описывается кортежем вида

,                                                 (6)

где x=x(t) – требования по своевременности обработки запроса; R – объективная ресурсоемкость запроса, определяющая совокупность требований к ресурсам различного типа; l – объем запроса (входных данных). Ресурсоемкость запроса R описывается кортежем вида

,                                       (7)

где v – вычислительная ресурсоемкость; op – объем требуемой оперативной памяти; net – требуемый сетевой ресурс; arch. – требуемая архитектура вычислительного узла; m – количество одновременных потоков; po – требуемое программное обеспечение (системное и прикладное).

Предлагается генерировать полунатурную модель  путем формирования потока полунатурных моделей запросов (рис. 2) системой генерации полунатурных моделей G. Полунатурная модель запроса FПН(Q) будет реализовываться в виде гибкой вычислительной задачи, которая представляет собой программу, потребляющую ресурсы в соответствии с настройками. Программа запускается как в последовательном, так и в параллельном режиме. Настройки текущего экземпляра программы передаются одновременно с самой программой. В результате прогнозирования параметров потока и образующих единичные потоки запросов на основе исходной модели запроса генерируется текущий вариант полунатурной модели  путем ее настройки. После настройки параметров и структуры образующих запросов задаются настройки единичных потоков. Единичные потоки выделяются путем проведения кластерного анализа исходной выборки. Объединение сгенерированных единичных потоков  образует полунатурную модель , требуемую для проведения экспериментов по выбору метода планирования. Период генерации потока устанавливается экспериментатором. Адекватность полунатурной модели определяется возможностью гибкой настройки модели путем определения ее структуры и параметров. Повторяемость реализаций модели потока запросов предлагается обеспечивать путем сохранения настроек всех сгенерированных моделей запросов. Для взаимодействия с различными системами планирования используются полунатурные модели запросов с настраиваемыми экспериментатором служебными заголовками.

Подпись:  Рис. 2. Алгоритм генерации полунатурных моделейпотоков запросовДля практической реализации предлагаемой гибкой полунатурной модели был разработан прототип системы генерации, состоящий из сервера генерации и программы, реализующей полунатурную модель запроса. (Программа DataFlowModel­Generator защищена свидетельством о государственной регистрации программ для ЭВМ № 2009614467 / И.В. Логинов, Е.В. Лебеденко.) Прототип сервера генерации реализован на языке высокого уровня С++ для работы в среде Windows.

Прототип полунатурной модели запроса может использоваться в операционных системах Windows и Linux. Он позволяет обеспечивать требуемую интенсивность потребления ресурсов различных типов: коммуникационных, вычислительных и оперативной памяти в соответствии с заданными настройками. Перспективой развития сервера генерации моделей потоков запросов является его реализация на языке сценариев для обеспечения возможности использования на вычислительных узлах с различной архитектурой. Интенсивность потребления ресурсов вычислительного узла моделью запроса определяется файлом настроек, формируемым сервером генерации для каждого запроса. Такой файл представляет собой документ типа XML, в котором содержатся все настройки модели запроса.

Согласно алгоритму на рисунке 2 была разработана полунатурная модель потока запросов к распределенному почтовому серверу, состоящему из двух вычислительных узлов. В процессе анализа входного потока в нем были выделены три единичных потока, образованных почтовыми запросами разного типа. С использованием прототипа сервера генерации настроена модель  и осуществлена генерация полунатурной модели . Анализ результатов обработки полунатурной модели потока запросов на узлах сервера показал ее адекватность для выбора метода планирования.

В результате исследований предложена гибкая параметрически и структурно настраиваемая модель потока запросов, предназначенная для использования при анализе систем планирования процессов обработки запросов в РВС. Предложенный алгоритм генерации позволяет получать полунатурную модель потока запросов с требуемой для проведения экспериментов адекватностью путем настройки гибкой исходной модели с использованием сервера генерации.

Литература

1.   Проблемы моделирования GRID-систем и их реализации // О.И. Самоваров [и др.] // Научный сервис в сети Интернет: решение больших задач: тр. Всеросс. науч. конф. (22–27 сентября 2008 г., Новороссийск). М.: Изд-во МГУ, 2008. 468 с.

2.   Ларионов А.М., Майоров С.А., Новиков Г.И. Вычислительные комплексы, системы и сети. Л.: Энергоатомиздат, 1987. 288 с.


Permanent link:
http://swsys.ru/index.php?id=2435&lang=en&page=article
Print version
Full issue in PDF (4.03Mb)
Download the cover in PDF (1.25Мб)
The article was published in issue no. № 1, 2010

Perhaps, you might be interested in the following articles of similar topics: