Повышение эффективности работы интеллектуальных, диагностических, экспертных, информационно-измерительных систем основано на разработке и внедрении прогрессивных методов принятия решений. Эта задача особенно актуальна, когда требуется принимать решение на основе трудноформализуемой информации большой размерности в сжатые сроки, а также при недостаточном опыте специалистов. Всесторонняя компьютеризация обеспечила развитие нейроподобных методов принятия решений [1], которые, в свою очередь, позволили более полно использовать интеллектуальные возможности компьютеров.
Моделирование принятия решений
Одним из способов принятия объективного решения является использование каскадно-навыковой нейроподобной сети. Архитектура такой сети представляет собой объединение нейронов в виде развивающегося каскада. При добавлении нового нейрона в структуру он подключается ко всем входным узлам и ко всем существующим дополнительным нейронам. На выходы сети напрямую подаются сигналы всех дополнительных нейронов и все входные сигналы. Топология сети такова, что ее структура формируется в процессе обучения при добавлении нейронных элементов, поэтому нет необходимости настраивать слои сети в зависимости от количества входных и выходных сигналов. Основной идеей алгоритма является направленное возбуждение нейронов сети в зависимости от вектора выходного сигнала. Данный подход позволяет сократить время обучения, а также наращивать каскадную архитектуру только в требуемом направлении, динамически формируя обучающую выборку по максимальной ошибке отклика системы.
Если представить ситуации в виде векторов, координатами которых являются учитываемые факторы, концы этих векторов будут образовывать множество точек, разбросанных в пространстве, – пространство решений. Каждому множеству значений учитываемых факторов соответствует определенная точка в пространстве решений, то есть каждой ситуации, представленной множеством информационных сигналов-возбуждений, соответствует значение управляющего сигнала. Множеству ситуаций {В} соответствуют управляющие сигналы – множество {Y}. Задача параметрической идентификации заключается в установлении соответствия между подмножествами {Х} множеств {В} и множествами {Y}. В общем случае эта зависимость является навыковой разбросной, когда точки решений разбросаны в пространстве. В частном случае точки решений могут находиться на одной линии, представляя линейную или нелинейную зависимость. Существующие методы идентификации ограничиваются определением обобщенной, усредненной зависимости, представляющей линию между точками решений. Линия проходит как можно ближе к точкам решений, что обеспечивается применением метода наименьших квадратов.
В отличие от такой постановки задачи полу- чение разбросной зависимости позволяет при предъявлении любой ситуации из множества {В} получать соответствующее этой ситуации неусредненное и необобщенное значение управляющего сигнала. Пространство решений представляет собой сферы, радиусы которых равны допуску на точность распознавания – сферическая разделимость пространства решений. Допуск на точность распознавания составляет 0<0,5 при нормированном отклике. При предъявлении ситуации, не принадлежащей множеству {В}, система формирует значение управляющего сигнала, близкое к значению управляющего сигнала ситуации, ближайшей из тех, которым обучили.
Навыковая система подобно живым организмам формирует навыки, на основании которых и принимаются решения. Навыки формируются автоматически, путем рекуррентно-итерационного обучения, пропорционально узнающей ошиб- ке [2]. Сформированные в результате обучения весовые коэффициенты аналогичны проводимостям синапсов корковых нейронов живых организмов. Процесс обучения сводится не к запоминанию образов ситуаций, а к формированию такой проводимости синаптической навыковой памяти технического мозга, проходя через которую, формируются значения откликов. В результате обучения устанавливается разбросная зависимость между ситуациями и решениями.
Навыковые системы позволяют учитывать индивидуальные особенности образов и ситуаций, не обобщая их, а устанавливая разбросную зависимость. Обучение производится по узнающей ошибке обратной связи между множеством входных сигналов и множеством значений решений (сигналов управления) путем расчета весовых коэффициентов. Расчет осуществляется автоматически, итерационно, с предъявлением всего множества рассматриваемых ситуаций до достижения соответствия между множествами входных и выходных сигналов, удовлетворяющего заданной точности. Величина поправки весового коэффициента wj определяется в зависимости от общей ошибки и значения соответствующего фактора. Исходные факторы (возбуждения рецепторов) каждой ситуации образуют множество Х={Х1, …, Хn}. Расчет весовых коэффициентов сводится к нахождению матрицы – столбца |W| системы линейных уравнений Х´W=Y. Таким образом, задача идентификации заключается в определении зависимости между выходными сигналами (откликами) Yi, , и множеством входных сигналов Хij (факторами) в различных ситуациях, то есть от двухмерного массива входных сигналов: yi=j(xi,j, …, xm,n).
После обучения опорным ситуациям, то есть ситуациям, включенным в обучающую выборку, выходной сигнал (отклик) равен:
, , ,
где xij – факторы ситуаций; wj – весовые коэффициенты; m – количество ситуаций; n – количество факторов, характеризующих ситуацию.
Навыковая система диагностики
На основе изложенной методики принятия решений разработана навыковая система диагностики «Гепатиты 1.0».
Острый вирусный гепатит – одно из наиболее распространенных и опасных инфекционных заболеваний. Эффективным средством диагностики гепатита является иммуноферментный анализ, или серологическая диагностика, но учитывается и ряд других факторов (клинические показатели, эпид- анамнез и т.д.). Таким образом, объем исходной информации для постановки диагноза становится избыточным, поэтому правильно поставить диагноз может только врач с большим опытом. Информационная система диагностики гепатита по результатам иммуноферментного анализа может помочь врачу-инфекционисту в постановке диагноза.
Разработка навыковой системы диагностики «Гепатиты 1.0» осуществлялась в два этапа:
1) подбор математического аппарата, и реализация его в виде программного приложения;
2) разработка механизма передачи данных от спектрофотометра к системе классификации диагноза гепатита.
Количество входных факторов системы равно 54, из них 23 серологических маркера и 18 классифицируемых диагнозов. Исследования эффективности системы показали, что точность классификации диагноза гепатита составляет около 98 %. К достоинству системы относится возможность оценки влияния входных факторов на выходные сигналы по значениям групп весовых коэффициентов. Например, весовые коэффициенты для острого вирусного гепатита А (ОВГА) (рис. 1) разделены на две группы, соответствующие значениям входного фактора «Нет» и «Да». Наиболее весомой является группа, которая соответствует значению «Да», группу «Нет» можно расценивать как вспомогательную. Из рисунка видно, что весовой коэффициент серологического маркера Anti-HAV имеет наибольшее значение, поэтому, если входной вектор будет содержать положительную пробу на данный серологический маркер, высока вероятность того, что система интерпретирует исходную информацию как вирусный гепатит А.
Выявлена зависимость точности диагноза от способа формирования обучающей выборки. Целесообразно формировать обучающую выборку с последовательным включением на каждом этапе примеров с наибольшим отклонением от заданной невязки, а не с произвольным неупорядоченным включением примеров. Процесс обучения осуществляется быстрее, улучшается прогнозирующая способность системы – определение диагноза для примеров, которым не обучали. Способность навыковых систем ставить подобные диагнозы говорит об их интеллектуальности.
Исследовалось влияние объема обучающей выборки на точность расчета кода диагноза для примеров из тестирующей выборки. Для ХВГС (фаза реактивации) при выборке, равной 10, среднее значение отклонений для примеров из тестирующей выборки от заданной невязки составило 0,065 и 0,021 при 24 примерах, для ХВГВ (фаза репликации) при 10 – 0,067 и 0,027 при 24; для ХВГС (латентная фаза) при 10 – 0,055 и 0,041 при выборке, равной 24. Следовательно, объем обучающей выборки существенно влияет на правильность принятия решения для примеров из тестирующей выборки. Чем больше обучающая выборка, тем меньше отклонение от заданной невязки. Желательно, чтобы обучающая выборка составляла не менее 25–30 примеров.
Кроме диагностики заболевания, не менее важна интеграция информационной системы диагностики гепатита в лечебно-диагностический процесс. Основными модулями информационно-измерительного комплекса (рис. 2) являются спектрофотометр и интеллектуально-информационный блок интерпретации диагноза с БД. Предполагается также поступление данных не только из химической лаборатории, но и от первого диагностического звена, что позволит более объективно интерпретировать полученные данные. Используя интерфейс интеллектуального блока, централизованные и обработанные данные, врач-инфекционист может в любой момент просмотреть БД, поставить окончательный диагноз и назначить курс лечения. Такая схема позволяет оперативно получать данные измерений иммуноферментного анализа, четко прослеживать историю болезни пациента. Первичное звено приемного отделения в сложных случаях или при недостаточной информации сможет оперативно воспользоваться интерпретацией данных без привлечения дополнительных источников для определения дальнейшей стратегии назначения анализов.
Для автоматизации процесса диагностики разработана программа паспортизации данных измерений иммуноферментного анализа в микропланшетном спектрофотометре с последующей передачей в систему диагностики. Интерфейс передачи данных между спектрофотометром и интеллектуальной системой разделен на три панели (рис. 3).
1. Панель управления импортом данных измерений позволяет работать с данными, поступающими с микропланшетного спектрофотометра.
2. Панель контроля значений входных данных позволяет связывать данные пациентов с номерами ячеек планшета.
3. Панель контроля целостности данных позволяет управлять данными пациентов в соответствии с их историей болезни.
В заключение можно сделать следующие выводы. Навыко-вычислительная система принятия решений в результате обучения на основе рекуррентно-итерационного алгоритма выявляет разбросную зависимость между исходными факторами и соответствующими им решениями.
Весовые коэффициенты – навыки – формируются в результате автоматического обучения, отражают опыт и интуицию специалистов и характеризуют значимость исходных факторов.
Навыковая система диагностики «Гепатиты 1.0» принимает решения с точностью 98 %, объективно определяет влияние каждого фактора на принимаемое решение, что позволяет выявлять доминирующие и второстепенные факторы и рационально назначать анализы, учитывать совокупное влияние всех факторов, а также повысить качество и оперативность диагностики.
Литература
1. Галушкин А.И. Теория нейронных сетей. Кн. 1: Учеб. пособие для вузов; [под общ. ред. А.И. Галушкина]. М.: ИПРЖР, 2000. 416 с. (Нейрокомпьютеры и их применение).
2. Кавыгин В.В., Морозова В.П. Алгоритм естественного обучения // Всеросс. науч.-технич. конф. к 40-летию каф. ТМ ЛГТУ: сб. матер. Липецк: ЛГТУ, 2002. С. 33–37.