В настоящее время резко возрастает сложность создаваемых и эксплуатируемых технических систем. В процессе проектирования и эксплуатации таких систем моделирование является эффективным методом прогнозирования основных характеристик поведения систем. Сложные технические системы, такие как вычислительные сети, обладают объективной неопределенностью, что требует дальнейшего расширения инструментария прогностики. Все чаще используются интеллектуальные методы, которые расширяют классическую классификацию прогностических методов и представляют сочетание формализованных процедур обработки информации, полученной по оценкам специалистов-экспертов. Исследования данных и их методов анализа в последние десятилетия оформились в виде отдельного направления, называемого интеллектуальным анализом данных, или Data Mining, в котором анализ временных рядов (ВР) получил понятие интеллектуального анализа ВР, или Times-Series Data Mining. Многие задачи анализа нечетких ВР (НВР) остаются нерешенными, в частности, задачи анализа нечетких тенденций (НТ) и генерации правил распознавания тенденций. Методы анализа НВР могут быть положены в основу создания библиотек имитационных моделей элементов сложных технических систем, в частности, вычислительных терминальных сетей (ВС).
Одной из задач моделирования ВС разного уровня является анализ пропускной способности сети (трафик, нагрузка, задержка и т.д.). Если для коммутирующего оборудования существует достаточно много программных библиотек, позволяющих выполнять имитационное моделирование, то для узлов-пользователей, обладающих сложной, многокомпонентной структурой, необходимо реализовывать в каждом случае свои модели. Известны подходы к моделированию работы узлов-пользователей ВС на основе генерирования исходящего трафика с использованием накопленной статистики работы узла и, как результата, моделирования обработки узлом входящего трафика.
Интеллектуальные методы анализа ВР,
используемые для моделирования
элементов ВС
Наиболее популярными интеллектуальными инструментами анализа ВР являются нейронные сети (НС) и нечеткая логика.
НВР называют упорядоченную последовательность наблюдений над некоторым явлением, состояния которого изменяются во времени, если значение состояния в момент времени выражено с помощью нечеткой метки (см., напр.: Заде Л.А. Понятие лингвистической переменной и его применение к принятию приближенных решений. М., 1976; Ярушки-
на Н.Г Вычислительный интеллект: синергизм слова и числа // Информационные технологии и вычислительные системы, 2002, № 4).
Нечеткая метка может быть сформирована непосредственно экспертом или получена на основе некоторого исходного ВР.
НТ НВР является нечеткая метка, выражающая динамику (систематическое движение) НВР. Понятие "тенденция", моделируемое нечетким множеством, может быть описано набором сконструированных эмпирических правил. Для нахождения НТ предлагается использовать нечеткие НС. Анализ НТ позволяет на основе динамики процесса прогнозировать поведение ВР путем предсказания тенденций развития изучаемого объекта. При этом не предусматривается прогнозирование численных значений ВР, что можно отнести к недостаткам предложенных методов.
Математическая модель
ВР НТ
Рассмотрим дискретный ВР Y={yt, t – последовательность моментов времени}, ytÎUy.
Определение 1. НВР называется упорядоченная последовательность наблюдений над неким явлением, характер которого изменяется во времени, если значения, принимаемые некоторой величиной в момент времени, выражены с помощью нечеткой метки: , где – i-й элемент терм-множества лингвистической переменной .
Таким образом, НВР представляет собой векторный ВР значений всех нечетких переменных: , где; n – количество терм.
Определение 2. НТ. Пусть – НВР, – множество НВР одинаковой длины. Тогда НТ t, определенная на , есть совокупность упорядоченных пар: , где представляет собой степень принадлежности к НТ t .
Определение 3. ВРНТ. Пусть множество НВР длиной m, где , t. Тогда ВРНТ есть упорядоченное во времени нечеткое множество: .
Предположим наличие зависимости между НТ, наблюдаемыми в разные моменты времени. Используя схему разностного уравнения, представим модель ВРНТ для одной переменной: , где l – временной лаг.
Для построения модели ВРНТ были определены следующие функционалы:
- Fuzzy – фаззификация и deFuzzy – дефаззификация ВР;
- Tend – описание и распознавание НТ;
- deTend – получение НВР из значений НТ.
Определение 4. Модель НТ (МНТ). Совокупность компонент и уравнений: , , , , где n – количество термов НВР; p – количество термов НТ; mj – интервал определения НТ; l – временной лаг, обозначим МНТ с характеризующими параметрами (n, p, m, l). В более подробном виде параметры можно обозначить как (n,{pk},{mk},l), где pk – количество видов тенденций, имеющих интервал определения mk.
Рассмотрим соотношение моделей НВР, ВРНТ и МНТ. Модель МНТ (n,p,1,l) является, по сути, обычной моделью НВР, использующейся в интеллектуальных методах анализа ВР. В то же время НВР – это частный случай ВРНТ, так как для НВР полагаем интервалы определения тенденций как единичные. Заметим, что МНТ (n,{pk},{1, …},l), позволяя включать как моментные, так и интервальные нечеткие характеристики ряда, является обобщением моделей НВР и ВРНТ, что позволяет в дальнейшем использовать ее не только в качестве модели ВР, но и для решения задач анализа и прогнозирования НВР.
ПРЕдставление МНТ
с помощью нечеткой НС (ННС)
В качестве инструмента построения функциональной зависимости в виде нечетких отношений используем аппарат ННС. Особенностью системы логического вывода по НТ при реализации схемы сети является то, что отсутствуют слои фаззификации и дефаззификации, так как входы и выходы – нечеткие значения (в их интерпретации). Используем классические нечеткие нейроны, в которых операции сложения и умножения заменяются треугольными нормами:
И-нейрон ,
ИЛИ-нейрон .
Порядок выявления нечетких зависимостей на основе ННС следующий: инициализация ННС; обучение (оптимизация весов сети); анализ сети (сокращение сети).
В результате получается система логического вывода, являющаяся объясняющей функцией в модели ВР. Нечеткие продукции легко интерпретируются для эксперта, так как выражены в терминах присущих исследуемой области, и отсутствуют скрытые нелинейные связи.
Программная система анализа НВР
Для анализа НВР по предложенной МНТ создано программное обеспечение FuzzyTendNet. Программа написана в среде Microsoft Visual Basic .NET, для запуска скомпилированной версии требуется Microsoft .NET Framework 1.1.
Основные задачи, решаемые системой:
- многомерный анализ данных с несколькими входными и выходными переменными;
- реализация функционалов модели Fuzzy, deFuzzy, Tend, deTend;
- реализация модели НТ (определение 4), оптимизация на основе методов НС;
- прогнозирование ВР на заданный интервал;
- графическое отображение всех ВР: исходных, нечетких переменных, НТ;
- сохранение сформированной модели во внешнем файле в формате XML.
В основе программы лежит иерархическое представление проекта, которое одновременно является представлением внутренней программной реализации на основе объектно-ориетированного программирования и форматом хранения в XML-файле.
Моделирование терминал-сервера
на основе ВРНТ
На основании рассмотренной модели проанализирована работа одного из узла вычислительной сети вуза. Узлом является сервер, работающий под Microsoft Windows 2003, выполняющий приложения в терминальном режиме. Основное пользовательское приложение: БД «1С:Предприятие», работающее в файл-серверном режиме, где данные расположены на этом же сервере. Для моделирования трафика на основе предложенного подхода были выбраны семь параметров работы узла, из которых сформированы ВР.
Анализ производился в авторской программе FuzzyTendNet. Для всех параметров установлены нечеткие переменные НВР, описывающие значения: «высокое», «низкое». Установлены НТ: «загрузка», «простой». Для трафика также определены дополнительные НТ: «рост», «падение».
Анализировались МНТ (n,p,m,l) от самого простого случая (МНТ(2,2,1,2) до моделей, включающих в себя как НВР, так и ВРНТ (МНТ(2, {2,4},{1,2},2).
Таким образом, комбинируя интервалы НТ входных и выходных переменных m=(1,{1,2},2), получали разные варианты моделей для сравнительного анализа. В результате при сравнении с экспертными оценками был сделан вывод, что МНТ описывает изменение параметров трафика успешно. На рисунке 1 представлен прогноз изменения параметров трафика на шаг вперед для двух МНТ.
Полученная функциональная зависимость не только хорошо описывает работу сервера, но и
дает лингвистическую интерпретацию зависимости.
Для моделирования объема трафика сервера экспертом были предложены и описаны следующие режимы работы сервера: ввод данных, их чтение, формирование отчетов с высокими значениями соответствующих групп параметров. На рисунке 2 представлены результаты моделирования объема трафика на основе МНТ.
Таким образом, МНТ является результативным индикатором развития моделируемого процесса в сложной технической системе, описанного качественно в лингвистических терминах. Базовыми операциями обработки НТ являются алгоритмические операции обработки НТ, а именно, операция формирования ВРНТ по исходному ВР и обратная операция генерации ряда – представителя НТ. ННС предложенной архитектуры является эффективным генератором правил распознавания НТ. Разработанная математическая имитационная модель терминала сервера как элемента вычислительной сети на основе ВРНТ позволяет прогнозировать загрузку процессора, исходящий и входящий трафики сервера.