ISSN 0236-235X (P)
ISSN 2311-2735 (E)

Journal influence

Higher Attestation Commission (VAK) - К1 quartile
Russian Science Citation Index (RSCI)

Bookmark

Next issue

4
Publication date:
09 September 2024

The article was published in issue no. № 2, 2001
Abstract:
Аннотация:
Authors: () - , () -
Ключевое слово:
Page views: 10444
Print version
Full issue in PDF (1.58Mb)

Font size:       Font:

Для многих приложений, связанных с распознаванием образов и системами технического зрения (автоматизированная механическая обработка, сборка, сварка, окраска и т.п.), необходимо наличие векторной модели объекта манипулирования. Основываясь именно на такой модели, а также на имеющейся базе технологических знаний, система управления может принимать решение.

Векторная модель должна адекватно отражать топологию объекта: все линии или узлы модели должны максимально согласовываться с гранями и вершинами физического объекта [1]. Однако бинарные растровые изображения, полученные посредством различного рода сканеров или камер, характеризуются присутствием дефектов и шумов (наростов и впадин, рис. 1), которые способны значительно уменьшить адекватность между математической моделью и физическим объектом.

Решить данную проблему можно, воспользовавшись средствами математической морфологии [2]. Для достижения эффекта сглаживания изображения и удаления отдельных дефектов часто используется комбинация базисных операций математической морфологии – эрозии и расширения [3].

Опишем кратко суть данного метода.

Пусть подмножество S – совокупность всех точек (пикселов) изображения, принадлежащих к интересующему нас объекту; B – структурирующий элемент.

Эрозия определяется в математической морфологии как:

,                        (1)

где  означает «эрозия S структурирующим элементом B»; E – дискретная плоскость; h – вектор, определяющий текущую позицию структурирующего элемента B на дискретной плоскости; Bh – результат переноса структурирующего элемента B на вектор h:

.                                               (2)

Пример структурирующего элемента, а также результат эрозии представлены на рисунке 2.

а                                          б                       в

Рис. 2. Исходное изображение (а); результат применения операции эрозии (б); структурирующий элемент (в)

Следующим шагом обработки является расширение. В математической морфологии расширение определяется как:

,                 (3)

где  означает «расширение S структурирующим элементом B».

Другими словами, результирующее изображение получается из исходного путем добавления структурирующего элемента, помещенного в каждую точку подмножества S исходного изображения.

Процедура использует структурирующий элемент, имеющий тот же размер, что и в процедуре эрозии. Результат процедуры расширения и структурирующий элемент приведены на рисунке 3.

     а                                   б                         в

Рис. 3. Исходное изображение (а); результат

применения операции расширения (б);  структурирующий элемент (в)

Размер структурирующего элемента выбирается в зависимости от характеристик конкретного изображения (размера дефектов, которые предполагается удалять) и ограничивается толщиной линий объекта. С одной стороны, использование структурирующего элемента слишком малого размера приведет к неполному удалению дефектов. С другой стороны, использование недопустимо большого структурирующего элемента может вызывать разрушение линий объекта и, следовательно, нарушение топологии. Кроме того, даже если разрушение не произошло, неоправданно большой размер структурирующего элемента приводит к увеличению времени обработки, что может оказаться нежелательным для ряда приложений, требующих обработки видеоданных в реальном времени, например, для систем технического зрения [4].

Авторами предложен новый алгоритм, позволяющий автоматически настраивать размер структурирующего элемента в зависимости от характеристик изображения. Описание данного алгоритма приводится ниже.

Вначале производится пробная эрозия с использованием структурирующего элемента размером 3 пиксела. С целью сокращения времени обработки для этой процедуры может быть выбран небольшой участок изображения.Затем анализируются результаты тестовой эрозии, чтобы выявить возможные участки разрушения линий объекта. В качестве критерия наличия разрыва в линиях автором предложено использовать сравнение максимальной ширины замкнутых областей удаленных пикселов с размером структурирующего элемента. Результатом анализа является ответ на вопрос "имеется ли на изображении хотя бы одна удаленная область, ширина которой превышает размер структурирующего элемента, уменьшенный на 1?". Если ответ на этот вопрос положительный, то следует переход к этапу коррекции величины структурирующего элемента.

а                                             б

Рис. 4. Исходное изображение (а); изображение после сглаживания с помощью адаптивного метода (б)

В случае отрицательного ответа, то есть когда разрывов на изображении не обнаружено, производится пробная эрозия исходного изображения с использованием структурирующего элемента размером 5 пикселов, затем 7 пикселов и т.д. до тех пор, пока анализ не покажет возникновение разрывов.

 а                                                      б

Рис. 5. Отсканированный текст (а) и результат обработки с помощью адаптивного метода сглаживания (б). Для букв «с» и второй «е» использован структурирующий элемент размером 3 пиксела, для остальных - 5 пикселов.

Параллельно с поиском разрывов производится контроль эффективности обработки. В качестве критерия эффективности используется относительная величина, характеризующая увеличение количества удаленных дефектов по сравнению с предыдущей пробной эрозией. Как только данная величина, рассчитанная для очередного шага пробной эрозии окажется меньше некоторого порогового значения, следует переход к процедуре коррекции величины структурирующего элемента.

В результате тестовой эрозии изображения или его части, последовательно увеличивая размер маски, мы неизбежно приходим к одному из двух результатов: 1) на изображении появятся разрывы; 2) эффективность обработки будет признана неудовлетворительной.

В любом из этих случаев размер структурирующего элемента, с которым проводилась последняя тестовая эрозия, не может быть использован для обработки, поэтому он должен быть скорректирован. Очевидно, что наилучшие результаты обработки, то есть когда разрывов не было и одновременно параметр эффективности был выше порогового значения, были достигнуты с использованием предыдущего размера структурирующего элемента. Именно он и выбирается в качестве оптимального для обработки данного изображения.

Следующим этапом является непосредственно обработка изображения с данным структурирующим элементом, включающая в себя эрозию и расширение (рис. 4).

Основной задачей, решаемой с использованием описанного метода, является подготовка бинарных растровых изображений к векторизации и последующей высокоуровневой обработке. Кроме того, программы, использующие предложенный алгоритм, могут быть использованы как утилиты или внешние подключаемые модули (plug-in) для обработки сканированных изображений, даже если не предполагается дальнейшая обработка, просто для улучшения качества изображений (например, в типографиях и издательствах). На рисунке 5 приведен пример использования метода для обработки текста. Поскольку символы имеют различную толщину элементов, требуется использовать индивидуальный размер структурирующего элемента для каждого символа. В результате обработки несколько улучшается качество распознавания текста OCR системами.

Авторы предполагают направить дальнейшие исследования на создание алгоритма, позволяющего настраивать параметры обработки не только для всего изображения, но и для его отдельных частей, что повысит эффективность метода для изображений с неоднородной толщиной линий объекта.

Список литературы

1. Olson C. F., “Decomposition of the Hough Transform: Curve Detection with Efficient Error Propagation”, Proc. of the European Conference on Computer Vision, 1996, pp. 263-272.

2. Serra J., Image Analysis and Mathematical Morphology, Vol. 2, Academic Press, 1988, 360 p.

3. Heijmans H. J. A. M., “Mathematical morphology: a Geometric Approach to Image Processing”, Nieuw Archief voor Wiskunde, Vierde Serie, Deel 10, No 3, 1992, pp. 237-276.

4. Batman S., Osman N., Prince J. and Goutsias J., “Automatic Myocardial Segmentation of Tagged MR Cardiac Images Using Morphology”, Proc. of 24th Conference on Information Sciences and Systems (CISS), 2000, pp. 34-41.


Permanent link:
http://swsys.ru/index.php?page=article&id=832&lang=en
Print version
Full issue in PDF (1.58Mb)
The article was published in issue no. № 2, 2001

Perhaps, you might be interested in the following articles of similar topics: