Широко распространенные заболевания (такие как сахарный диабет, гипертоническая болезнь, коронарная болезнь, бронхиальная астма, шизофрения и др.) являются одновременным проявлением комплекса мутаций генов и факторов среды. Предрасположенность к ним может быть выявлена в процессе изучения генотипа пациента при анализе его антропометрических особенностей. Наибольшую практическую значимость в этом случае имеет дерматоглифическое исследование, задача которого состоит в выделении классификационных признаков заболевания на основе изучения отпечатков ладоней и пальцев. Индивидуальное многообразие структур папиллярного рельефа чрезвычайно велико. Однако, несмотря на это, отдельные элементы дерматоглифики поддаются группировке в относительно небольшое число классов, что упрощает их анализ.
Исследования показали, что основными признаками для диагностики являются тип узора дистальных фаланг пальцев, ориентация паль- цевого узора, общий гребневой счет, ладонный угол atd.
Таким образом, для принятия решения и диагностики предрасположенности пациента к заболеванию сахарным диабетом требуется выделить и распознать сложные изображения элементов дерматоглифики. Эта задача трудоемкая, к тому же решить ее могут только квалифицированные специалисты, способные уверенно распознавать эти элементы. Применение методов компьютерной обработки изображений позволяет существенно повысить скорость проведения диагностики на основе дерматоглифического исследования и способствовать его широкому внедрению.
В данной статье рассматривается возможный подход к решению задачи определения предрасположенности пациента к заболеванию сахарным диабетом на основе дерматоглифических признаков с помощью методов компьютерной обработки изображений.
Процесс дерматоглифического анализа включает три основные стадии обработки дактилокарты:
1) сканирование и обработка изображения;
2) анализ и распознавание типа изображения с индивидуальными особенностями (выявление дерматоглифических признаков);
3) постановка диагноза на основании выявленных дерматоглифических признаков.
В процессе сканирования дерматоглифических изображений возможно появление дефектов, которые можно разделить на два класса:
- дефекты, обусловленные нарушением методики регистрации при проведении исследования (залипание, непропечатка, нечеткость, низкий контраст);
- дефекты, обусловленные особенностями папиллярных гребней гребешковой кожи человека (белые линии, дисплазия папиллярных гребней); низкое качество дерматоглифических изображений, обусловленное этими дефектами, приводит к значительным ошибкам при определении классификационных признаков.
Для улучшения изображений используются методы обработки в пространственной области (пространственные методы) и методы обработки в частотной области (частотные методы). Пространственные методы основаны на прямом манипулировании элементами изображения. Процессы пространственной обработки описываются уравнением g(x, y)=T[f(x, y)], где f(x, y) – входное изображение; g(x, y) – обработанное изображение; T – оператор над f(x,y), определенный в некоторой окрестности точки (x, y).
Зашумленное изображение f(x, y) можно представить как сумму двух компонент: f(x, y)=g(x, y)+h(x, y), где h(x, y) – аддитивный шум. В этом случае g(x, y) выступает некоторым идеальным изображением. Главную роль при улучшении изображений и сегментации играет информация, извлекаемая из гистограмм яркости. Типичная гистограмма пальцевого узора приведена на рисунке 1.
Главными методами пространственной обработки являются методы градационных преобразований, методы гистограммной обработки, сглаживающие пространственные фильтры и пространственные фильтры, основанные на первой и второй производных.
Частотные методы базируются на двухмерном дискретном преобразовании Фурье: при u=0, 1, 2, …, M-1 и v=0, 1, 2, …, N-1. Преобразование Фурье обеспечивает значительную гибкость при разработке и реализации алгоритмов фильтрации при решении задач улучшения изображений. Визуальный анализ спектра существенно помогает при использовании инструментов анализа изображений в частотной области. На рисунке 2 приведен спектр Фурье для исходного изображения, приведенного на рисунке 1.
Кроме того, улучшения изображений можно добиться с помощью его морфологической обработки, используя операции замыкания и размыкания.
Следующим этапом обработки является бинаризация изображения, сущность которой заключается в разбиении полутоновых изображений на две области, одна из которых содержит все пиксели со значением ниже некоторого порога, а другая – выше этого порога. Для этого используется гистограмма яркости пикселей вида ξ(rs)=ns, где rs – s-й уровень яркости из интервала [1, S]; ns – число пикселей изображения, уровень яркости которых равен rs. Поскольку общее число пикселей изображения равно n, вероятность ps появления уровня интенсивности rs в данном изображении определяется выражением ps=ξ(rs)/n.
Оптимальная пороговая сегментация основана на приближении гистограммы изображения к некоторой кривой при помощи использования весовых сумм двух или более вероятностей интенсивностей с нормальным распределением.
Для дальнейшего анализа изображения с целью выделения классификационных признаков используется процедура утончения, которая сокращает двоичные объекты до отдельных линий, имеющих толщину в один пиксель. Процедура утончения основывается на методах морфологической обработки изображения с применением операций дилатации, эрозии, а также поисковых таблиц.
Для распознавания классификационных признаков необходимо, чтобы изображения имели одинаковые размер и ориентацию, а не произвольные, как обычно бывает на практике, поэтому их надо унифицировать. Для ориентации объектов вдоль их основных направлений используются нормированные собственные векторы матрицы Cz, образующие ортонормированный базис в n-мерном евклидовом пространстве.
Матрица Cz задается выражением , где zk – вектор-столбец, составленный из яркостей одноименных пикселей g родственных изображений. При K=MN: .
Преобразование главных компонент определяется формулой y=A(z–mz).
Строками матрицы A служат нормированные собственные векторы матрицы Ck. Это преобразование необходимо для приближения исходного вектора , когда используется лишь q собственных векторов. Ошибка приближенного восстановления вектора составляет величину , где λj – собственные числа матрицы Cz.
Для распознавания текстурных изображений формируются эталоны (маски), содержащие тип и подтип изображения дерматоглифического признака.
БД текстурных изображений, используемые для анализа и распознавания, содержат или полное представление эталона, или сжатое интегральное описание топологических свойств изображений. Соответственно, процедуры распознавания основаны на методе сравнения с эталоном либо на дискриминантных решающих правилах в выбранном пространстве признаков.
Эффективным методом решения данной задачи является согласованная фильтрация, основанная на корреляционном сопоставлении. Корреляционное сопоставление заключается в нахождении позиций на изображении f(x, y), которые лучше всего соответствуют заданному эталону w(x, y). Для этого используется корреляционная метрика – нормированный коэффициент корреляции: , где f0, w0 – средние значения интенсивности для исходного изображения и маски соответственно.
Если дано n эталонных изображений {wi}, i=1, …, n, каждое из которых соответствует i-му классу, то обнаружение фрагмента изображения f(x, y) основано на решении оптимизационной задачи вида .
Это есть задача поиска максимального значения нормированного коэффициента корреляции на множестве {wi}.
Альтернативный подход заключается в реализации корреляции в частотной области. В этом случае задача пространственной корреляции сводится к приведению преобразованных изображений, поскольку справедливо утверждение , где f(x, y) w(x, y) – пространственная корреляция.
Таким образом, пространственную корреляцию можно получить с помощью обратного преобразования Фурье, примененного к результатам умножения преобразования одной функции на сопряженное преобразование второй функции. Проведенные исследования показали, что в этом случае обнаружение фрагмента происходит намного быстрее.
Выявленные в процессе обработки изображения дескрипторы являются классификационными признаками, на которых строится определение предрасположенности пациента к заболеванию сахарным диабетом. Для классификации используется байесовский подход. В соответствии с теоремой Байеса равенство
справедливо для любого распределения случайной величины ζ.
Байесовская процедура классификации состоит в отнесении вектора наблюдений ζ к Ψ1, если P(Y1½z)³P(Y2½z), и к Ψ2, если P(Y1½z)
Методы обработки дерматоглифических изображений, получения дескрипторов и класси- фикации заболевания составляют основу информационной системы, предназначенной для автоматизации дерматоглифических исследований и выявления предрасположенности пациента к заболеванию сахарным диабетом. Структура информационной системы представлена на рисунке 3.
Данная система реализует описанные выше методы компьютерной обработки изображений и имеет модульную структуру. Модули предварительной обработки и распознавания изображений реализуют следующие функции:
- определение качества изображения и его корректировка;
- бинаризация изображения;
- ориентация изображения и его нормализация;
- морфологический анализ и выделение отдельных элементов изображения (ладонных линий);
- истончение (скелетизация) изображения для определения количественных показателей, таких как гребневый счет;
- согласованная фильтрация на основе Фурье-преобразования для выделения фрагментов изображения на основе масок.
Последовательность обработки изображений определяется сценарием дерматоглифического анализа и управляется программой-супервизором, составляющей ядро информационной системы. Модули обработки изображения, формирования дескрипторов и диагностики подключаются последовательно по мере выполнения алгоритма анализа. Кроме того, система содержит вспомогательные модули, обеспечивающие управление выполнением заданий, описание сценариев обработки, визуализацию данных, модуль, обрабатывающий некоторые возникающие ошибки. Этап обработки изображений заканчивается генерацией классификационных признаков, на их основе делается вывод о предрасположенности пациента к заболеванию сахарным диабетом. Значения классификационных признаков передаются в модуль-классификатор для дальнейшей обработки и формирования заключения. БД системы содержит сведения о пациентах и цифровые изображения отпечатков ладоней правой и левой руки, а также цифровые изображения эталонов (масок) для поиска необходимых фрагментов. Система реализована в среде MatLab с использованием пакетов расширения Image Processing Toolbox и Database Toolbox. Для классификации в данном случае использовался пакет статистического анализа Statistica. В дальнейшем для этой цели будет использоваться MatLab. Система предназначена для специалистов, врачей, проводящих дерматоглифические исследования, которые являются необходимой частью клинического осмотра в гене- тической клинике. В настоящее время система проходит апробацию на реальных данных.
Литература
1. Рогачева Е.А. Особенности дерматоглифики у больных сахарным диабетом 1-го типа // Успехи современного естествознания. 2009. № 6. С. 18–19.
2. Якушева М.Ю. [и др.]. Выявление генетической предрасположенности к возникновению сахарного диабета 2-го типа // Эфферентная терапия. 2007. Т. 13. № 4. С. 9–13.
3. Гонсалес Р., Вудс Р., Эддинс С. Цифровая обработка изображений в среде MatLab. М.: Техносфера, 2006. 616 с.
4. Визельтер Ю.В. [и др.]. Обработка и анализ цифровых изображений. М.: ДМК Пресс, 2007. 464 с.