Виртуализация компьютерных ресурсов, вычислительных мощностей и памяти – одно из наиболее перспективных направлений информационных технологий, а управление данными в виртуальных средах – один из наиболее актуальных вопросов параллельных и распределенных вычислений, важность которого обусловлена растущей потребностью в оптимальном использовании ресурсов и ликвидации ограничений на производительность, накладываемых коммуникационной средой систем в сложных системах реального времени, каковыми являются создаваемые средства подготовки профессиональных специалистов различных областей.
Проектирование центров обработки данных (ЦОД) является одним из возможных подходов в решении данных задач. ЦОД включает серверный комплекс, а также системы хранения данных, эксплуатации и информационной безопасности. Все компоненты, наиболее важными из которых являются система хранения и серверный комплекс, интегрированы между собой и объединены высокопроизводительной вычислительной сетью.
Система хранения данных предназначена для организации надежного хранения информационных ресурсов и предоставления сервером доступа к ним. При построении серверного комплекса целесообразно пользоваться моделью системы с многоуровневой архитектурой. Серверный комплекс обычно включает в себя: серверы информационных ресурсов, отвечающие за сохранение и предоставление данных серверам приложений; серверы приложений, выполняющие обработку данных в соответствии с бизнес-логикой проектируемой системы; серверы представления информации, осуществляющие интерфейс между пользователями и серверами приложений; служебные серверы, обеспечивающие работу других подсистем ЦОД.
Современный ЦОД строится по иерархическому принципу. На нижнем уровне находится инженерная инфраструктура, обеспечивающая жизнедеятельность IT-инфраструктуры. Следующий уровень – аппаратная IT-инфраструктура: серверы, системы хранения данных и телекоммуникационное оборудование. Основными производителями аппаратуры являются IBM, HP, Sun Microsystems. Телекоммуникационная инфраструктура создается вместе с корпоративной сетью передачи данных. Популярные торговые марки на этом рынке – Nortel, Cisco Systems, 3Com, Avaya. Последний уровень ЦОД – программное обеспечение (ПО), которое выполняет непосредственную обработку данных, используя имеющуюся IT-инфраструктуру.
Текущий процесс трансформации и разработки ЦОД можно разделить на три взаимосвязанных этапа: консолидация, виртуализация и автоматизация [1]. Консолидация позволяет переместить, к примеру, ресурсы серверов и систем хранения из разных филиалов в единый ЦОД. Виртуализация объединяет централизованные ресурсы в пулы, не зависящие от приложений. При этом уровень приложений отделяется от базовой инфраструктуры серверов и систем хранения, архитектура становится более прозрачной и менее сложной, а имеющиеся мощности используются эффективнее. В результате снижается потребность в инвестициях и сокращаются текущие расходы на управление. Автоматизация открывает путь к активной самоуправляемой инфраструктуре приложений и тем самым к гибкой синхронизации с деловыми процессами при одновременном обеспечении их необходимой стабильностью и соответствием законодательным и иным директивам.
Благодаря отделению логического уровня от физического, инфраструктура превращается в гибкий пул ресурсов. Как только все доступные емкости хранения оказываются объединенными в рамках общекорпоративной сети хранения (Storage Area Network, SAN) или среды сетевых устройств хранения (Network Attached Storage, NAS), пространство для хранения становится разновидностью сетевого сервиса, который можно дозировать в зависимости от потребностей. Таким образом, в виртуализованных средах деловые приложения и их данные перестают зависеть от определенных серверов или устройств хранения.
Перспективными технологиями ЦОД в настоящее время являются: полная виртуализация процессоров и устройств хранения; сети хранения данных с интеллектуальными коммутаторами Fibre Channel (FC), способными исполнять программы виртуализации памяти и репликации данных; ПО и инструменты общекорпоративных БД CMDB (Configuration Management Database); системы резервного копирования информации на диск [2]. Наряду с этим не менее важным является возможность предоставления конечному потребителю максимально удобного и гибкого сетевого сервиса для решения любых задач.
Концепция cloud computing. Появление современных технологий SOA, динамических композитных приложений и Web 2.0 изменило сферу стратегических бизнес-задач при построении и развертывании корпоративных приложений. Впервые появившийся в 2007 г. термин cloud сomputing объединил концепцию предоставления ПО как услуги (SaaS), удаленные хранилища данных и принципы предоставления ПО в аренду (Application Service Providers, ASP). Параллельно с этим предложенная Microsoft инициатива Software plus Services (S+S) предполагает сборку ПО с сервисами в единый, персонализированный, доступный из любого места инструмент [3]. Этот инструмент дает отдельным личностям и организациям свободу выбора в налаживании взаимодействия между людьми, в передаче и хранении информации и пр.
Архитектура вычислительного облака представлена массивом серверов, объединенных подобно технологии grid, также возможно использование средств виртуализации, чтобы максимизировать вычислительную мощность, доступную на сервере. Интерактивный интерфейс позволяет пользователю выбирать службу из каталога, этот запрос передается к управлению системы, которое находит правильные ресурсы и затем вызывает вспомогательные инструменты, извлекающие информацию из облака.
Основные элементы архитектуры [4] изображены на рисунке 1.
Хранение облака представляет собой модель центров хранения данных, где информация сохранена на множестве виртуальных серверов, управляемых с выделенных серверов. Операторы данных серверов резервируют виртуальные ресурсы согласно требованиям клиента и предоставляют их как средства, которыми могут самостоятельно управлять клиенты. Сегодня cloud computing – это сервисы Elastic Compute Cloud (EC2) и Simple Storage Service (S3) от Amazon.com по предоставлению вычислительных мощностей и емкостей хранения соответственно; совместная инициатива IBM и Google по разработке крупномасштабной среды для обеспечения университетов аппаратными и программными ресурсами и сервисами; хостинг-платформа Force.com от salesforce.com; услуги Google и возможности хостинга (GMail, Docs, Calendar, Google Base); проект Blue Cloud компании IBM по разработке ряда решений для реализации вычислительных облаков, в том числе по обеспечению безопасности, отказоустойчивости, оптимизации распределения ресурсов и возможностей самоуправления и самовосстановления инфраструктуры, а также финансируемый Евросоюзом проект RESERVOIR (Resources and Services Virtualization without Barriers – виртуализация ресурсов и сервисов без ограничений), где будут изучены возможности разработки и управления IT-сервисами в масштабах административных доменов, IT-платформ и географических регионов [5].
Информационное пространство и портал современного тренажера. Логика функционирования тренажера при использовании подхода cloud computing упрощенно может быть представлена следующим образом. Система строится на основе двух основных элементов: облака данных и набора клиентов, объединенных локальной сетью; облако данных изначально содержит все необходимые для построения множества целевых тренажеров исходные модели и информацию, набор вычислительных ресурсов и мощностей; все операции и действия внутри облака скрыты за описаниями исполняемых интерфейсов, последовательность которых строго регламентирована; набор интерфейсов включает все операции по формированию тренировки, последовательности ее проведения, завершения и выполнения всех необходимых операций; набор интерфейсов является общеизвестным и предоставляется всем желающим использовать функциональность тренажера; облако данных поддерживается собственными элементами контроля и самодиагностики; все функции серверов БД, моделирования и поддержки остальных технологических функций, а также размещения моделей и данных перемещаются в облако; клиенты системы в стандартной сетевой терминологии не являются тонкими или толстыми, а представляют собой унифицированные рабочие места, имеющие в своем распоряжении список доступных сервисов; число пользователей системы – переменная величина, влияющая не на архитектурные решения в самом облаке, а только на специфику формирования информационных потоков и модели размещения данных; клиентские терминалы оснащены минимумом функциональной нагрузки и содержат только средства управления, отображения и выведения данных на видеомониторы и другие визуальные элементы в соответствии с целями проведения тренировки; при необходимости для соблюдения ограничений функционирования обеспечиваются сопутствующие задачи повышения эффективности и быстродействия обработки также облаком данных; управление и контроль над тренажером и облаком должны производиться в визуально понятном графическом дружественном интерфейсе.
При таком представлении структуры тренажера необходимо на уровне облака данных обеспечить отказоустойчивость, оптимизацию распределения ресурсов, возможность самовосстановления инфраструктуры, соблюдение временных рамок для функционирования и обновления данных, оптимизацию размещения данных модельного мира, а также безопасность при использовании глобальных сетей. Обеспечение отказоустойчивости может осуществляться выбором надежных составляющих программного и аппаратного обеспечения. Проектирование оптимальной архитектуры с возможностью резервирования и дублирования критических приложений позволит выполнять оперативное восстановление инфраструктуры системы. Оптимизация распределения ресурсов и размещения модельного мира проводится на этапах функционирования тренажера в соответствии с определенными заранее алгоритмами и моделями [6]. На уровне клиентов рабочих мест необходимы проектирование рациональных интерфейсов доступа к данным и оптимизация размещения объектов модельного мира вне зависимости от их фактического расположения в облаке или на удаленных компьютерах.
Основной задачей проектирования данной системы является разработка схем взаимодействия аппаратно-программной составляющей облака данных, в которой можно выделить следующие подзадачи: выбор аппаратных средств серверов хранения, БД, моделирования, резервирования, поддержки функционирования, дополнительных устройств обеспечения надежности и управляемости; размещение в соответствии с функциями моделей, БД тренажера; разработка распределенного ПО и проектирование внешних интерфейсов; разработка функций поддержки единого информационного пространства, репликации и тиражирования данных. Упрощенная схема комплексного тренажера представлена на рисунке 2.
Архитектура тренажера и информационной системы при использовании концепции cloud computing является следующим шагом систем комплексирования, применения SOA и сервисных приложений и логическим продолжением и обоснованным аппаратно-программным решением для построения единого информационного пространства, объединяющего потоки данных.
Все функциональные элементы перенесены внутрь облака и скрыты за кольцом интерфейсов доступных сервисов, а само облако при этом является интеллектуальным источником распределения данных, организации обмена и построения территориально распределенной архитектуры сложного тренажерного комплекса.
Обобщенно архитектура тренажерно-моделирующего комплекса при использовании перечисленных концепций предоставления ресурсов центров данных может быть представлена в виде некоторого сложного распределенного информационного портала, предоставляющего высокоскоростные надежные и защищенные каналы информации для самых различных клиентов. Созданный и поддерживаемый портал может содержать средства как аппаратного, так и программного характера для решения задач построения комплексных тренажеров различного назначения, содержит большой набор БД и систем моделирования объектов. При этом задачи балансировки нагрузки, предоставления необходимой информации потребителям, размещения и содержания отдельных фрагментов модельного мира каждого тренажера (если одновременно их используется несколько) ложатся на интеллектуальную составляющую ЦОД. Специализированное оборудование рабочих мест обучаемых и рабочие станции любого характера для отображения, управления и ввода команд являются клиентами портала и подключаются по надежным высокоскоростным соединениям. Преимуществами такого подхода являются локализация вычислительных мощностей, их высокая работоспособность и отказоустойчивость, гибкий сервисный интерфейс и возможность сборки тренажерно-моделирующих комплексов любой степени сложности и управляемости.
На рисунке 3 представлена архитектура портала центра тренажерного обучения персонала с составом оборудования для обработки и хранения данных, набора исполнительных серверов и каналов обмена информацией. Как видно из рисунка, отдельные элементы архитектуры четко структурированы и функционально отделены друг от друга.
Описание приоритетных направлений развития и проектирования ЦОД позволило выделить основные особенности использования и построения корпоративного сетевого сервиса общего пользования. На основе анализа базовых положений, принципов работы и возможностей архитектуры cloud computing принято решение о приложении данной концепции к разработке перспективных информационных сред для создания и управления информационным пространством сложных тренажерно-моделирующих комплексов. Предложена и описана упрощенная структура тренажера на уровне основных положений и требований с введением понятия облака данных и структуры системы, на основе представления уровней которой строится вся идеология работы распределенной информационной системы и кольца интерфейсов доступа вокруг информационных объектов. Рассмотрена концепция введения портала как перспективной разработки, объединившей в себе преимущества современных ЦОД, технологии предоставления и выполнения облачных вычислений, особенностей проектирования многоуровневой структуры за счет деления функциональности и распределения нагрузки.
Литература
1. Эберхардт Р., Эшрич Э., Котро М. Новая динамика в ЦОД. URL: http://www.osp.ru/lan/list/2008/07.html (дата обращения: 21.09.2008).
2. Перспективные технологии центров обработки данных. URL: http://www.ccc.ru/magazine/depot/06_12/read.html?0102.htm (дата обращения: 10.12.2008).
3. Шепелев В. Cloud Computing: к исследованию белогривых лошадок. «Компьютерра» 24 апреля 2008 г. URL: http://www.computerra.ru/print/magazine/ 355459 (дата обращения: 21.09.2008).
4. URL: http://en.wikipedia.org/w/index.php?title=Cloud_ computing (дата обращения: 08.03.2008)
5. Концепция Cloud Computing для ЦОД. URL: http://www.bytemag.ru/articles/detail.php?ID=12174 (дата обращения: 14.11.2008).
6. Янюшкин В.В. Оптимизация размещения данных модельного мира в распределенной информационной системе тренажерно-моделирующего комплекса // Изв. вузов. Северо-Кавказский регион. Технические науки. 2008. № 4. C. 25–28.