Journal influence
Higher Attestation Commission (VAK) - К1 quartile
Russian Science Citation Index (RSCI)
Bookmark
Next issue
№4
Publication date:
09 September 2024
Metamonitoring system for high-performance computing environment
The article was published in issue no. № 2, 2014 [ pp. 45-48 ]Abstract:The paper discusses an approach to the creation of metamonitoring system for high -performance computing environ-ment intended to solve resource-intensive tasks, and including a lot o f loosely-coupled multivendor computing resources. The basic purpose of this system is to provide the operator of a computing environment with structured and relevant information about a ny computing node status (CPU time usage, RAM, IO -system, network usage, etc.), current equipment state, values of the sensors (tem-perature of processors and motherboards, room temperature), engineering infrastructure devices status and others. The princip al dis-tinctive feature and novelty aspect of the developed metamonitor ing system includes creation of the universal software agents cap a-ble to collect data about state of different environment components from local monitoring systems, to unify and analyze these data, and if necessary to generate and execute automatic control actions directed on changing equipment working mode, including the shutdown in case of emergencies. Each agent of the meta -monitoring system is implemented on the same principles and includes fol-lowing subsystems: data collecting subsystem, database subsy stem, expert subsystem, and control subsystem. The approach is based on web-technologies and multi-agent technologies usage, methods of expert systems creation, methods of decentralized processing and the distributed storage of data. The developed system was successfully approved in the Supercomputer Center of ISDCT SB of the Russian Academy of Sciences.
Аннотация:В работе рассматривается подход к созданию системы метамониторинга высокопроизводительной вычислительной среды, ориентированной на решение ресурсоемких вычислительных задач и состоящей из множества разнородных программно-аппаратных ресурсов. Основное назначение такой системы заключается в обеспечении оператора вычислительной среды актуальной информацией о загрузке ресурсов, физическом состоянии вычислительного оборудования и устройств инженерной инфраструктуры. Главной отличительной особенностью и аспектом новизны разработанной системы мета-мониторинга является использование универсальных программных агентов, способных осуществлять сбор данных от локальных систем мониторинга различных компонентов среды, унифицировать и анализировать эти данные, а также при необходимости вырабатывать и исполнять в автоматическом режиме управляющие воздействия, направленные на изменение режимов работы оборудования, в том числе его отключение при возникновении аварийных ситуаций. Агенты системы мониторинга объединены в иерархическую структуру, гарантирующую высокую масштабируемость системы. В составе каждого агента системы метамониторинга реализованы подсистема сбора данных, подсистема взаимодействия с СУБД, экспертная и управляющая подсистемы. При реализации системы метамониторинга использованы современные веб -технологии, мультиагентные технологии, методы создания экспертных систем, методы децентрализованной обработки и распределенного хранения данных. Разработанная система метамониторинга успешно апробирована в суперкомпьютерном центре ИДСТУ СО РАН.
Authors: Oparin G.A. (oparin@icc.ru) - Institute of System Dynamics and Control Theory SB of the Russian Academy of Sciences, Irkutsk, Russia, Novopashin A.P. (apn@icc.ru) - Institute of System Dynamics and Control Theory SB of the Russian Academy of Sciences, Irkutsk, Russia, Ph.D, Sidorov I.A. (ivan.sidorov@icc.ru) - Institute of System Dynamics and Control Theory SB of the Russian Academy of Sciences, Irkutsk, Russia, Ph.D, Skorov V.V. (oparin@icc.ru) - Institute of System Dynamics and Control Theory SB of the Russian Academy of Sciences, Irkutsk, Russia | |
Keywords: expert systems, multi-agent technology, the automated information system, distributed computing environment |
|
Page views: 9438 |
Print version Full issue in PDF (6.10Mb) Download the cover in PDF (0.87Мб) |
Permanent link: http://swsys.ru/index.php?page=article&id=3807&lang=&lang=en&like=1 |
Print version Full issue in PDF (6.10Mb) Download the cover in PDF (0.87Мб) |
The article was published in issue no. № 2, 2014 [ pp. 45-48 ] |
Perhaps, you might be interested in the following articles of similar topics:
- Разработка прецедентного модуля для идентификации сигналов при акустико-эмиссионном мониторинге сложных технических объектов
- Возможности мониторинга динамики развития проекта в интеллектуальном проектном репозитарии
- Технологические процессы с гибкими связями типа «звезда» для интерактивных программных систем
- Разработка экспертных систем на основе трансформации информационных моделей предметной области
- Архитектура пользовательского интерфейса для взаимодействия с мультиагентной средой
Back to the list of articles