ISSN 0236-235X (P)
ISSN 2311-2735 (E)

Journal influence

Higher Attestation Commission (VAK) - К1 quartile
Russian Science Citation Index (RSCI)

Bookmark

Next issue

4
Publication date:
09 December 2024

Modeling in computing clusters technical support system

Date of submission article: 14.08.2014
UDC: 004.75
The article was published in issue no. № 3, 2014 [ pp. 72-78 ]
Abstract:The problems of technical support for high-performance computing systems in comparison with traditional da-ta-processing systems are considered in the article. The problems of technical support for high-performance computing sys-tems class with essential role of functional viability are identified. The paper describes an approach to using simulation in the organization of a computing cluster administrative system built on the principles of its life cycle information and simulation support. The authors offer applying information modelling and simulation to improve the efficiency of computing clusters technical support. The article describes a conceptual framework for a technical support system using information and com-puter simulation model of a cluster and its using.
Аннотация:В настоящей работе рассматриваются проблемы технической поддержки высокопроизводительных вычислительных систем по сравнению с технической поддержкой в традиционных информационно-вычислительных системах. Выявляются проблемы технической поддержки класса высокопроизводительных вычислительных систем, для которых существенную роль играет функциональная живучесть. Описывается подход к использованию моделирования при организации системы административного управления вычислительным кластером, строящейся на принципах информационно-имитационной поддержки его жизненного цикла. Предлагается совместное использование информационного и имитационного моделирования для повышения эффективности процесса технической поддержки вычислительных кластеров. Рассматривается концептуальная схема организации службы технической поддержки с помощью информационно-имитационной модели вычислительного кластера и описывается ее использование.
Authors: Frolov D.V. (frolov_dv@academ.msk.rsnet.ru) - Academy of the Federal Guard Service of the Russian Federation, Orel, Russia, Ph.D, Grishakov V.G. (liv@academ.msk.rsnet.ru) - The Academy of the Federal Guard Service of the Russian Federation, Orel, Russia, Ph.D
Keywords: virtual environment, administrative management system, simulation, information modeling, cals, life cycle, functional vitality, technical support, computing cluster
Page views: 15155
Print version
Full issue in PDF (5.36Mb)
Download the cover in PDF (1.03Мб)

Font size:       Font:

В последнее время широко распространены высокопроизводительные вычислительные системы, развертываемые на базе вычислительных кластеров общего назначения. С их помощью решаются различные научно-технические задачи, требующие от аппаратной платформы высокой производительности. При этом современный вычислительный кластер представляет собой объединение большого числа высокопроизводительных серверных компьютеров, соединенных друг с другом локальной высокоскоростной магистралью для достижения максимальной производительности и являющихся с точки зрения пользователя единым аппаратным ресурсом [1].

 

Для большинства высокопроизводительных систем на базе вычислительных кластеров реализуется частичное изменение функций в процессе их жизненного цикла. Изменение этих функций происходит за счет модификации ПО и изменения (модернизации) аппаратной части вычислительного кластера. С точки зрения особенностей организации эксплуатации при изменении функций все высокопроизводительные вычислительные сис- темы можно разделить на два класса: высокопроизводительные системы научных и исследовательских организаций и высокопроизводительные системы промышленной сферы. Большинство систем первого класса, используемых, например, в научной сфере, отличается от систем второго класса тем, что изменение (модификация) и соответственно сопровождение ПО осуществляются самой организацией-эксплуатантом. К высокопроизводительным системам второго класса можно отнести ряд решений для государственной, банковской, промышленной сфер, а также сферы информационных технологий (ИТ). Наиболее актуальной для них является обработка больших массивов (потоков) данных – работы с БД и БЗ. В настоящий момент активные разработки в этом направлении ведут все лидирующие производи- тели БД, от Oracle до Microsoft. Для этих вычислительных кластеров решающее значение имеет их функциональная живучесть [2], ведь даже временный простой в работе информационных систем может привести к огромным финансовым потерям.

В данной работе рассматриваются высокопроизводительные системы именно такого класса. Выпускаются такие системы малыми сериями или в одном экземпляре, для чего привлекаются специализированные научные организации, промышленные предприятия и поставщики оборудования. В качестве ПО используются часто меняющиеся специализированные программные продукты (как правило, разработанные различными компаниями).

Сопровождение и обслуживание программного и аппаратного обеспечения играют важнейшую роль в обеспечении функциональной живучести таких высокопроизводительных вычислительных систем. Совокупность процессов сопровождения принято называть технической поддержкой. Обычно техническую поддержку таких вычислительных кластеров осуществляет головной производитель (для ИТ-сферы получивший наименование «системный интегратор»), который собирает в единое целое всю информацию об аппаратно-программном обеспечении высокопроизводительной вычислительной системы. В связи с тем, что организация технической поддержки такой системы у системного интегратора или в ИT-службах организации-эксплуатанта не всегда отвечает предъявляемым требованиям по функциональной живучести, актуально исследование вопросов обоснования перспективной архитектуры такой системы.

Анализ вариантов реализации систем технической поддержки высокопроизводительных вычислительных систем

В настоящее время для технической поддержки высокопроизводительных вычислительных систем используются традиционные методы технической поддержки, применяющиеся для вычислительных систем (ПЭВМ, информационно-вы­числительных сетей). Согласно ITIL, поддержка пользователей осуществляется сервисами Help­Desk и ServiceDesk [3]. Они представляют собой организационно-технические системы (службы технической поддержки (СТП)) с информационными системами технической поддержки, которые выполняют функции начальной технической поддержки и призваны разрешать инциденты – частные проблемы пользователей компьютерного, аппаратного и программного обеспечения. В основе сервиса HelpDesk лежит принцип единой точки входа для обработки запросов пользователей, который позволяет избегать различных непродуктивных способов разрешения инцидентов, таких как попытки решить проблему самостоятельно, обращение за помощью к коллегам, обращение к случайному сотруднику технической поддержки и т.п. Решение проблем происходит по цепочке, состоящей из нескольких уровней. ServiceDesk – более широкое понятие, подразумевает функции приема и обработки обращений от пользователей в соответствии с требованиями ITIL.

Существенное значение при решении инцидентов имеет уровень квалификации персонала СТП. Обусловлено это как задачами самой службы по качественному обслуживанию пользова- телей, так и предоставлением полномочий по принятию решений (в зависимости от сложности инцидента) сотруднику с соответствующей квалификацией. Такая организация СТП позволяет решать задачи с высоким уровнем сложности без привлечения специалистов сторонних организаций, что предполагает наличие высокого уровня профессиональной подготовки и большого опыта у персонала.

Организация СТП рассмотрена в большинстве стандартов управления ИТ-инфраструктурой организации [3]: в ITIL, CobIT, ISO-20000. Разработано и поддерживается значительное количество информационных систем для автоматизации СТП как специализированного ПО, так и аппаратных платформ [4]. Работы и исследования в области совершенствования организаций СТП реализуются для учебных, государственных и коммерческих организаций [3, 5, 6]. В [5] представлены схема и задачи разработанного на основе концепции ITSM Центра поддержки пользователей Югорского государственного университета, а также требования к СТП и способ их реализации через веб-приложение с пятью уровнями доступа к системе. В [3] приведен пример совершенствования СТП на основе методик и рекомендаций ITIL, выполненных в рамках проекта KISMET в Финляндии. В [7] рассмотрен подход к решению задач оптимизации организационной структуры ServiceDesk на основе следующих этапов: формирование группы сотрудников, формализация правил взаимодействия пользователей с СТП, оптимизация процессов взаимодействия СТП с другими подразделениями, автоматизация деятельности, создание механизма контроля.

Важным аспектом является совершенствование отдельных компонентов СТП применительно к частным задачам технической поддержки. Так, работа [8] посвящена вопросам управления взаимоотношениями с клиентами через СТП, в ней дан критический анализ основных проблем взаимоотношений. В [9] рассмотрена организация СТП для предприятия с числом АРМ больше 100 на основе информационной системы HP OpenView Service Desk, в [10] – эволюция систем управления знаниями как составной части СТП. В [6] дается краткий анализ систем автоматизации СТП, по итогам которого делается вывод о необходимости формирования критериев выбора таких систем. В [11] описан процесс синтеза структур адаптивной сложной системы на основе СТП.

Не менее важной задачей является оценка эффективности СТП и ее компонентов с точки зрения обеспечения решения проблем пользователей. В [6] рассмотрен подход к оценке СТП на основе совокупной стоимости владения. На основе обработки потока запросов получены формулы для расчета качества работы отдельного сотрудника [9]. В [11] на основе имитации работы СТП дискретной ситуационной сетью представлена методика оптимизации структуры СТП по критерию минимума времени реакции с использованием алгоритма Форда–Фалкерсона.

К СТП высокопроизводительных вычислительных систем предъявляется ряд требований с целью обеспечения их живучести. Основные требования – оперативное решение возникающих инцидентов без приостановки выполняемых функций кластера и прогнозирование возникновения потенциальных инцидентов технической поддержки. Как показывает практика, существующие СТП, использующие в том числе системы Helpdesk/ServiceDesk, не удовлетворяют предъявляемым к ним требованиям без наличия второго комплекта высокопроизводительной системы. Такое положение дел не позволяет достичь необходимой функциональной живучести вычислительного кластера, что обусловливает необходимость совершенствования СТП с целью повышения указанной живучести, в первую очередь за счет исключения случаев необходимости использования второго вычислительного кластера.

Применение концепции CALS/ИПИ для поддержки высокопроизводительных вычислительных систем

Необходимость обеспечения живучести высокопроизводительных вычислительных систем обусловливает требование непрерывного учета и контроля всех их особенностей в процессе всего жизненного цикла. Для управления и интеграции такой информации применяется адаптированная к информационно-телекоммуникационным объектам методология управления жизненным циклом на основе информационной модели [12]. Она разработана на базе методологии информационной поддержки жизненного цикла изделия [13] (так называемой CALS- или ИПИ-концепции), предназначенной для информационной поддержки управления единичными наукоемкими продуктами. Основой методологии является использование единой информационной модели, объединяющей всю информацию об изделии в рамках его жизненного цикла. Анализ применения в промышленности и ИТ-сфере показывает возможность ее использования для совершенствования процессов технической поддержки. Для информационно-телекоммуникационной сферы предусматривается расширение такой методологии в направлении использования информационно-имитационного (так называемого гибридного) подхода [12]. В част- ности, в литературе рассматриваются вопросы автоматизации процессов поддержки программного обеспечения [4] как одного из компонентов ИТ-инфраструктур.

В рамках применения концепции CALS к технической поддержке возможно развертывание полунатурной модели высокопроизводительной вычислительной системы с возможностью оперативной загрузки адекватного состояния при осуществлении удаленной технической поддержки. Для этого в организациях, обеспечивающих техническую поддержку вычислительных кластеров, нужно разрабатывать и совершенствовать систему административного управления [12] (рис. 1) в части, касающейся процессов технической поддержки. При этом система административного управления CALS-типа представляет собой распределенную организационно-техническую структуру, обеспечивающую управление вычислительным кластером на всех стадиях его жизненного цикла. Она объединяет в своем составе множество информационно-управляющих систем по мониторингу, анализу, поддержке принятия решений и их реализации [12]. СТП является выделенным компонентом системы административного управления и, как правило, включает в себя людей (сотрудников СТП), аппаратные средства, методики и другие регламенты.

Сотрудники СТП в зависимости от своей квалификации могут выполнять различные функции:

-      прием и проверка полноты информации об инциденте;

-      тестирование специализированного ПО при возникновении ошибок или проверка полноты выполняемых функций исправленного (модернизированного) специализированного ПО;

-      выезд на объект организации-эксплуатанта для выявления причин инцидента или внедрения исправленного (модернизированного) специализированного ПО.

К аппаратным средствам СТП относятся средства вычислительной техники, локальные и натурные стенды вычислительных кластеров, на которых проводится тестирование при возникновении инцидентов технической поддержки. Программные средства являются информационными системами типа ServiceDesk или HelpDesk, поддерживающими гибридную модель высокопроизводительной вычислительной системы. К методикам СТП относятся методики испытания вычислительного кластера и установленного на нем ПО на предмет их соответствия требованиям заказчика.

Концептуальная схема организации СТП

Совершенствуя процессы технической поддержки высокопроизводительных вычислительных систем в соответствии с расширенной методологией CALS [12], авторы предлагают для снижения потребности в вычислительных кластерах применять гибридную модель, исполняемую на базе стенда виртуализации. Концептуальная схема СТП представлена на рисунке 2.

 

 

Информационная модель интегрирует в себе информацию о вычислительном кластере и его ПО на всех стадиях жизненного цикла кластера. На этапе эксплуатации информационный компонент модели пополняется информацией о работе операционной системы, специализированного ПО, работы служб и сервисов вычислительного кластера. На этапе замысла и разработки информационная модель пополняется техническими данными, проектной документацией, нормативными документами по работе с вычислительным кластером. Имитационный компонент модели представляет собой актуальную модель высокопроизводительной вычислительной системы, способную с нужной адекватностью воспроизводить инциденты технической поддержки. Из-за невозможности тестирования специализированного ПО на реально действующем вычислительном кластере такую среду необходимо эмулировать. Для обеспечения эмуляции следует применять методы имитационного моделирования, позволяющие предсказывать резуль- таты управляющих воздействий по внедрению и модификации специализированного ПО. Стандартным способом эмуляции аппаратной среды вычислительного кластера могут выступать средства виртуализации. В настоящее время на рынке средств виртуализации имеется большое количество программных продуктов различных компаний. Лидерами в этой области являются компании Miscosoft, VMWare, Citrix.

На этапах создания и модернизации высокопроизводительных вычислительных систем создается их исходная информационная и имитационная модель, которая на других этапах жизненного цикла может дополняться актуальными данными и с помощью системы генерации имитационных моделей порождать актуальную модель вычислительной системы. Эта модель представляет собой макет вычислительного кластера, развернутый в виртуальной среде вместе с установленным специализированным ПО. При необходимости решения задач технической поддержки в виртуальной среде может развертываться соответствующий макет вычислительного кластера, актуализируемый за счет данных, получаемых от разработчиков компонентов СПО и организации-эксплуатан­та.

Очевидно, что для поддержки информационной модели вычислительного кластера необходима соответствующая система информационного моделирования [14], функционирующая в интересах технической поддержки на всех этапах жизненного цикла. Имитационная модель в свою очередь должна поддерживаться соответствующей системой имитационного моделирования, обеспечивающей симуляцию внедряемого ПО и эмуляцию аппаратно-программных средств, виртуализируя программно-техническое окружение вычислительного кластера на основе формализованных представлений, полученных в результате взаимодействия с системой информационного моделирования. Без такой имитационной модели вычислительного кластера СТП придется разрешать инциденты на реальном вычислительном кластере, для чего необходимо выезжать на территорию организации-эксплуатанта. Стоит отметить, что при наличии виртуальной копии вычислительного кластера СТП может снять большинство вопросов по решению инцидентов, однако это обусловливает и ряд недостатков, таких, например, как обязательное наличие высокопроизводительной аппаратной платформы для развертывания среды виртуализации.

Разработку информационно-имитационной мо­дели вычислительного кластера необходимо выполнять на этапе его создания, что дает дополнительную нагрузку на разработчика высокопроизводительной вычислительной системы. Предполагается, что предложенный вариант организации системы технической поддержки на основе использования информационно-имитационной модели вычислительного кластера позволит повысить эффективность технической поддержки, что приведет к увеличению функциональной живучести высокопроизводительной вычислительной системы за счет уменьшения времени реакции на решение возникающих инцидентов технической поддержки.

Таким образом, система административного управления, полученная с использованием CALS-подхода к управлению на всех этапах жизненного цикла высокопроизводительной вычислительной системы, должна осуществлять сбор и формализацию информации о процессах жизненного цикла и состояниях вычислительного кластера, а на основе собранной информации создавать и обеспечивать функционирование имитационной модели для предсказания результатов управляющих воздействий системы технической поддержки внедрения модифицируемого ПО. Использование информационно-имитационного моделирования в компаниях, занимающихся технической поддержкой таких высокопроизводительных вычислительных систем, может повысить качество и скорость решения инцидентов технической поддержки. Направлениями для дальнейших исследований являются решение актуальной научной задачи поиска аппарата информационного и имитационного моделирования вычислительных кластеров и их программно-техническая реализация.

Литература

1.     Шпаковский Г.И. Реализация параллельных вычислений: кластеры, многоядерные процессы, грид, квантовые компьютеры. Минск: Изд-во БГУ, 2010. 155 с.

2.     Бородакий Ю.В., Тарасов А.А. О функциональной устойчивости информационно-вычислительных систем // Информационное противодействие угрозам терроризма. 2006. № 7. С. 79–93.

3.     Jäntti M., Shrestha A., Cater-Steel A. Towards an Improv­ed IT Service Desk System and Processes: A Case Study // Intern. Journ. on Advances in Systems and Measurements, 2012, vol. 5, no. 3–4, pp. 203–215.

4.     Гришаков В.Г., Логинов И.В. Автоматизация процессов сопровождения программного обеспечения // Информационные системы и технологии. 2010. № 2. С. 5–13.

5.     Татаринцев П.Б., Семенов С.П. Helpdesk центра поддержки пользователей Югорского государственного университета // Вестн. Югорского гос. ун-та. 2011. № 3. С. 128–134.

6.     Науменко С.А., Науменко А.И. Подходы к оценке систем автоматизации служб технической поддержки // Сибирская финансовая школа. 2009. № 2. С. 81–87.

7.     Злотко А.А. ИТ-менеджмент начинается с Service Desk // T-Comm: Телекоммуникации и транспорт. 2010. № 3. С. 28–31.

8.     Dehinbo O.J. Enhancing Service Desks Customers Relationship Management in a South African Contact and e-Service Organizations. Proc. of the World Congress on Engineering and Computer Science (WCECS 2011), (October 19–21, 2011), San Francisco, USA, 2011, vol. I, pp. 72–78.

9.     Романенко А.Г., Лещев В.И. Организация службы технической поддержки информационных систем на предприятии // Межотраслевая информационная служба. 2007. № 2. С. 26–36.

10.  Halverson C.A., Erickson T., Ackerman M.S. Behind the Help Desk: Evolution of a Knowledge Management System in a Large Organization. Proc. of CSCW 2004. NY, ACM Press, 2004, pp. 304–313.

11.  Десятов А.Д., Сирота А.А. Оценка времени реакции в условиях управления структурной динамикой сложной системы (на примере службы поддержки на предприятии в сфере оказания информационных услуг) // Вестн. Воронежского гос. ун-та. Сер. Системный анализ и информационные технологии. 2009. № 1. С. 5–12.

12.  Гришаков В.Г., Логинов И.В., Христенко Д.В. Управление модернизацией АСУ предприятия на основе информационной поддержки ее жизненного цикла // Информационно-управляющие системы. 2012. № 3 (58). С. 84–90.

13.  Бакаев В.В., Судов Е.В., Гомозоев В.А. [и др.]. Информационное обеспечение, поддержка и сопровождение жизненного цикла изделия; [под ред. Бакаева В.В.]. М.: Машиностроение-1, 2004. 624 с.

14.  Гришаков В.Г. Система поддержки гибридной модели ИТ-инфраструктуры в условиях использования внешних сервисов // Информационные системы и технологии. 2012. № 2. С. 39–47.

References

1.     Shpakovskiy G.I. Realizatsiya parallelnykh vychisleniy: klastery, mnogoyadernye protsessy, grid, kvantovye kompyutery [Implementing parallel computing: clusters, multicore processes, grid, quantum computers]. Minsk, BGU Publ., 2010, 155 p.

2.     Borodakiy Yu.V., Tarasov A.A. On functional robustness of information and computing systems. Informatsionnoe protivo­deystvie ugrozam terrorizma [Information counteraction to the terrorism threat]. 2006, no. 7, pp. 79–93 (in Russ.).

3.     Jäntti M., Shrestha A., Cater-Steel A. Towards an improved IT service desk system and processes: a case study. Intern. journ. on advances in systems and measurements. 2012, vol. 5, no. 3–4, pp. 203–215.

4.     Grishakov V.G., Loginov I.V. Automation of software support processes. Informatsionnye sistemy i tekhnologii [Informa­tion systems and technologies]. 2010, no. 2, pp. 5–13 (in Russ.).

5.     Tatarintsev P.B., Semenov S.P. A user support cener help­desk of Yugra State University. Vestnik Yugorskogo gosudarstven­nogo universiteta [The bulletin of Yugra State University]. 2011, no. 3, pp. 128–134 (in Russ.).

6.     Naumenko S.A., Naumenko A.I. Approaches to evaluation of technical support services automation systems. Sibirskaya finan­sovaya shkola [Siberian finance school]. 2009, no. 2, pp. 81–87 (in Russ.).

7.     Zlotko A.A. IT management starts from Service Desk. T-Comm: Telekommunikatsii i transport [T-Comm – Telecommunications and Transport]. Media Publ., 2010, no. 3, pp. 28–31 (in Russ.).

8.     Dehinbo O.J. Enhancing service desks customers relationship management in a South African contact and e-service organizations. Proc. of the World Congress on Engineering and Computer Science 2011 (WCECS 2011), San Francisco, USA, 2011, vol. I, pp. 72–78.

9.     Romanenko A.G., Leshchev V.I. Organizing technical support service for information systems in company. Mezhotrasle­vaya informatsionnaya sluzhba [Interindustry information service]. 2007, pp. 26–36 (in Russ.).

10.  Halverson C.A., Erickson T., Ackerman M.S. Behind the Help Desk: evolution of a knowledge management system in a lar­ge organization. Proc. of CSCW 2004. NY, ACM Press, 2004, pp. 304–313.

11.  Desyatov A.D., Sirota A.A. Evaluation of response time when managing structural dynamics of a complex system (in case of IT company support service). Vestnik Voronezhskogo gos. univ., Seriya: Sistemny analiz i informatsionnye tekhnologii [The bulletin of Voronezh State Univ. “System analysis and IT” series]. 2009, no. 1, pp. 5–12 (in Russ.).

12.  Grishakov V.G., Loginov I.V., Khristenko D.V. Administrative management of mis modernization based on lifecycle information support. Informatsionno-upravlyayushchie sistemy [Information and Control Systems]. Politekhnika Publ., 2012, no. 3 (58), pp. 84–90 (in Russ.).

13.  Bakaev V.V., Sudov E.V., Gomozoev V.A. Informatsion­noe obespechenie, podderzhka i soprovozhdenie zhiznennogo tsikla izdeliya [Information support and maintenance for a product life cycle]. Moscow, Mashinostroenie-1 Publ., 2004, 624 p.

14.  Grishakov V.G. IT infrastructure hybrid model support system using external services. Informatsionnye sistemy i tekhnolo­gii [Information systems and technologies]. 2012, no. 2, pp. 39–47 (in Russ.).


Permanent link:
http://swsys.ru/index.php?id=3863&lang=en&page=article
Print version
Full issue in PDF (5.36Mb)
Download the cover in PDF (1.03Мб)
The article was published in issue no. № 3, 2014 [ pp. 72-78 ]

Perhaps, you might be interested in the following articles of similar topics: