Взаимодействие конкурирующих интеллектуальных агентов в распределенных мультиагентных системах

№1

16 Марта 2024

2024

Взаимодействие конкурирующих интеллектуальных агентов в распределенных мультиагентных системах

Приходько М.А. (spex19@mail.ru) - Московский государственный горный университет, кандидат физико-математических наук
Ключевые слова: равномерный рост, система обработки информации, мальтиагентная система, распределенная система, агент, контрагент, интеллектуальные агенты, конкурирующие агенты, экспоненциальный рост, обработка информации
Keywords: equal rise, information processing system, multi-agent system, information processing system, agent, counter-agent, intellectual agents, rival agents, exponential rise, information processing

При функционировании распределенных систем обработки разнородной информации возникают проблемы из-за непрогнозируемого изменения объема и характера обрабатываемой информации, появления фракций контрагентов – элементарных процессов обработки информации, происходящих ненадлежащим образом. Возникновение таких ситуаций может иметь целый ряд негативных последствий вплоть до некорректной обработки информации. Эффективно препятствовать этому может только активное управляющее воздействие, направленное на нормализацию работы распределенной системы [Федунец Н.И., Приходько М.А.].

Рассмотрим один из таких случаев – взаимодействие двух конкурирующих агентов в неделимой системе обработки информации (в одном узле распределенной системы), когда численность контрагентов увеличивается экспоненциально, а активное управляющее воздействие происходит с помощью конкурирующих агентов, численность которых увеличивается равномерно (линейно).

Пусть неделимая система обработки информации состоит из N компьютеров, а в ней взаимодействуют конкурирующие интеллектуальные агенты m=2: K (контрагент) и A (агент).

Численность контрагентов K увеличивается со скоростью V контрагентов в единицу времени. Увеличение численности происходит экспоненциально случайным образом, то есть новая копия контрагента может размещаться на любом компьютере системы обработки информации.

Управляющее воздействие заключается в размещении агентов A со скоростью размещения a агентов в единицу времени. Размещение агентов происходит равномерно случайно в той области системы обработки информации, которая еще не нормализована агентами, то есть вероятность размещения новой копии агента на компьютере с уже размещенным агентом равна 0. Размещение новой копии агента возможно на любом свободном от агентов компьютере.

Контрагент K не может быть размещен на компьютере с уже размещенным там агентом A. В свою очередь, агент A может быть размещен на компьютере с ранее размещенным контрагентом K. В этом случае деятельность контрагента K прекращается. Цель фракции агентов – нормализовать работу системы обработки информации, сведя число контрагентов к нулю. Если функцией n(t) обозначить число контрагентов в момент t, то условие нормализации может быть записано в виде n(tнормализации)=0.

В начальное время (t0=0) в системе обработки информации размещены n0 контрагентов. До момента t=T численность контрагентов бесконтрольно увеличивается. В момент T начинается активное управляющее воздействие, то есть размещение агентов. Первоначально размещается q(T)=a0 агентов, где q(t) – функция, описывающая число агентов в момент t.

Как было показано при исследовании случая экспоненциального роста числа контрагентов и агентов, число компьютеров с размещенными на них контрагентами до начала реализации активного управляющего воздействия определяется формулой

. (1)

После введения агентов A в момент t=T характер изменения численности контрагентов изменяется. В этом случае число контрагентов nt в момент t³T описывается уравнением

(2)

Данное выражение учитывает активный характер управляющего воздействия, заключающийся в размещении новых агентов A только на свободных от них компьютерах: q(t) – число агентов A в момент t³T.

В свою очередь, число агентов A подчиняется дифференциальному уравнению

q¢(t)=a, q(T)=a0, откуда q(t)=a0+a(t–T). (3)

Таким образом, получается следующее дифференциальное уравнение:

(4)

Решением уравнения (4) является функция

. (5)

Константа С2 находится из краевого условия :

(6)

Полученное в формуле (6) выражение для числа агентов в произвольный момент позволяет построить характерный график численности популяций агентов и контрагентов (рис. 1).

Из формулы (3) следует, что время полного восстановления работоспособности системы обработки информации агентами A определяется условием a(t)=N, откуда

, (7)

где – относительная скорость увеличения численности агентов.

Это вполне согласуется с полученным в (6) решением, для которого (7) является одним из корней: n (tнормализации)=0.

Определение времени стабилизации tстабилизации, когда численность контрагентов начинает убывать, несколько усложняется по сравнению с равномерным случайным увеличением численности контрагентов и агентов.

Характер изменения численности популяций агентов и контрагентов до момента стабилизации показан на рисунке 2.

Для нахождения времени стабилизации tстабилизации продифференцируем выражение (6), приравняем его к нулю и аналогично экспоненциальному случаю введем новую переменную:

Учитывая оценку (7) на максимальное значение t, можно сделать вывод, что y£1.

В новых переменных уравнение для нахождения времени нормализации примет вид:

(8)

где .

Уравнение (8) может быть решено численно. Для локализации корня достаточно заметить, что y£1, а знак выражения, стоящего в правой части, определяется знаком квадратичной функции, которая имеет два корня – y1<1 и y2>1:

Левая часть уравнения (8) строго положительна, поэтому приближенное решение необходимо искать на отрезке [0, y1], что позволяет оценить сверху значение времени стабилизации:

. (9)

На выбранном отрезке функции, соответствующие левой и правой частям уравнения (8), строго монотонны, что позволяет сделать вывод не только о существовании корня, но и о его единственности.

Подпись: Рис. 2. Характерный график численности популяции до момента стабилизации: t<tстабилизации Таким образом, даже в изначально «дискриминационном» случае экспоненциального роста числа контрагентов и равномерного роста числа агентов эффективное противодействие возможно. При этом время стабилизации оценивается выражением (9), позволяющим в общем случае выбрать параметры управляющего воздействия и a такими, чтобы реализовать заранее заданные варианты управления.

Полученные результаты подтверждают возможность управляющего воздействия в дискриминационном случае экспоненциального роста числа контрагентов и равномерного роста числа агентов, а также формулируют требования к параметрам такого управляющего воздействия. Найденные выражения для числа контрагентов в произвольный момент времени, параметров управляющего воздействия, а также оценки времени стабилизации положены в основу программной реализации системы управления функционированием распределенной мультиагентной системы обработки информации в условиях непрогнозируемого изменения объема и характера обрабатываемой информации.

Литература

Федунец Н.И., Приходько М.А. Алгоритмы формирования управляющих воздействий в распределенных мультиагентных системах // Программные продукты и системы. № 4. 2010. С. 81–84.

http://swsys.ru/index.php?id=2808&lang=.&page=article

Perhaps, you might be interested in the following articles of similar topics: