Авторитетность издания
ВАК - К1
RSCI, ядро РИНЦ
Добавить в закладки
Следующий номер на сайте
№4
Ожидается:
09 Декабря 2024
Система метамониторинга высокопроизводительных вычислительных сред
Metamonitoring system for high-performance computing environment
Статья опубликована в выпуске журнала № 2 за 2014 год. [ на стр. 45-48 ]Аннотация:В работе рассматривается подход к созданию системы метамониторинга высокопроизводительной вычислительной среды, ориентированной на решение ресурсоемких вычислительных задач и состоящей из множества разнородных программно-аппаратных ресурсов. Основное назначение такой системы заключается в обеспечении оператора вычислительной среды актуальной информацией о загрузке ресурсов, физическом состоянии вычислительного оборудования и устройств инженерной инфраструктуры. Главной отличительной особенностью и аспектом новизны разработанной системы мета-мониторинга является использование универсальных программных агентов, способных осуществлять сбор данных от локальных систем мониторинга различных компонентов среды, унифицировать и анализировать эти данные, а также при необходимости вырабатывать и исполнять в автоматическом режиме управляющие воздействия, направленные на изменение режимов работы оборудования, в том числе его отключение при возникновении аварийных ситуаций. Агенты системы мониторинга объединены в иерархическую структуру, гарантирующую высокую масштабируемость системы. В составе каждого агента системы метамониторинга реализованы подсистема сбора данных, подсистема взаимодействия с СУБД, экспертная и управляющая подсистемы. При реализации системы метамониторинга использованы современные веб -технологии, мультиагентные технологии, методы создания экспертных систем, методы децентрализованной обработки и распределенного хранения данных. Разработанная система метамониторинга успешно апробирована в суперкомпьютерном центре ИДСТУ СО РАН.
Abstract:The paper discusses an approach to the creation of metamonitoring system for high -performance computing environ-ment intended to solve resource-intensive tasks, and including a lot o f loosely-coupled multivendor computing resources. The basic purpose of this system is to provide the operator of a computing environment with structured and relevant information about a ny computing node status (CPU time usage, RAM, IO -system, network usage, etc.), current equipment state, values of the sensors (tem-perature of processors and motherboards, room temperature), engineering infrastructure devices status and others. The princip al dis-tinctive feature and novelty aspect of the developed metamonitor ing system includes creation of the universal software agents cap a-ble to collect data about state of different environment components from local monitoring systems, to unify and analyze these data, and if necessary to generate and execute automatic control actions directed on changing equipment working mode, including the shutdown in case of emergencies. Each agent of the meta -monitoring system is implemented on the same principles and includes fol-lowing subsystems: data collecting subsystem, database subsy stem, expert subsystem, and control subsystem. The approach is based on web-technologies and multi-agent technologies usage, methods of expert systems creation, methods of decentralized processing and the distributed storage of data. The developed system was successfully approved in the Supercomputer Center of ISDCT SB of the Russian Academy of Sciences.
Авторы: Опарин Г.А. (oparin@icc.ru) - Институт динамики систем и теории управления Сибирского отделения РАН, г. Иркутск, Россия, Новопашин А.П. (apn@icc.ru) - Институт динамики систем и теории управления Сибирского отделения РАН, Иркутск, Россия, кандидат технических наук, Сидоров И.А. (ivan.sidorov@icc.ru) - Институт динамики систем и теории управления Сибирского отделения РАН, г. Иркутск (научный сотрудник), Иркутск, Россия, кандидат технических наук, Скоров В.В. (oparin@icc.ru) - Институт динамики систем и теории управления СО РАН (техник ), Иркутск, Россия | |
Ключевые слова: экспертные системы, мультиагентные технологии, мониторинг, распределенные вычислительные среды |
|
Keywords: expert systems, multi-agent technology, the automated information system, distributed computing environment |
|
Количество просмотров: 10225 |
Версия для печати Выпуск в формате PDF (6.10Мб) Скачать обложку в формате PDF (0.87Мб) |
Постоянный адрес статьи: http://swsys.ru/index.php?id=3807&page=article |
Версия для печати Выпуск в формате PDF (6.10Мб) Скачать обложку в формате PDF (0.87Мб) |
Статья опубликована в выпуске журнала № 2 за 2014 год. [ на стр. 45-48 ] |
Возможно, Вас заинтересуют следующие статьи схожих тематик:
- Разработка прецедентного модуля для идентификации сигналов при акустико-эмиссионном мониторинге сложных технических объектов
- Возможности мониторинга динамики развития проекта в интеллектуальном проектном репозитарии
- Разработка экспертных систем на основе трансформации информационных моделей предметной области
- Технологические процессы с гибкими связями типа «звезда» для интерактивных программных систем
- Архитектура пользовательского интерфейса для взаимодействия с мультиагентной средой
Назад, к списку статей