ISSN 0236-235X (P)
ISSN 2311-2735 (E)
3

13 Сентября 2024

Настройка и обучение многослойного персептрона для задачи выделения дорожного покрытия на космических снимках города

DOI:10.15827/0236-235X.130.343-348
Дата подачи статьи: 30.01.2020
УДК: 684.511

Тормозов В.С. (007465@pnu.edu.ru) - Тихоокеанский государственный университет (ст. преподаватель), Хабаровск, Россия, Василенко К.А. (k2857@mail.ru) - Колледж сервиса и дизайна при Владивостокском университете экономики и сервиса (ВГУЭС) (преподаватель), Владивосток, Россия, Золкин А.Л. (alzolkin@list.ru) - Поволжский государственный университет телекоммуникаций и информатики (доцент кафедры информатики и вычислительной техники ), Самара, Россия, кандидат технических наук
Ключевые слова: цифровая обработка изображений, искусственный интеллект, машинное обучение, распознавание образов, детектирование дорожного полотна, уличная дорожная сеть, искусственная нейронная сеть, спутниковые снимки
Keywords: digital image processing, artificial intelligence, machine learning, pattern recognition, roadway detection, street road network, artificial network, satellite imagery


     

Городская автодорожная инфраструктура является одной из самых важных для построения карт местности на основе спутниковых изображений. При приобретении и обновлении географической информации, как правило, необходимо привлечение ручного труда [1], который требует значительных временных и материальных затрат. Процедура детектирования дорожного полотна предоставляет средства для создания, поддержания и обновления транспортной сети и может быть использована для решения многих других практических задач, относящихся к регулированию транспортных потоков и грузоперевозок. Значительный объем обрабатываемых данных позволяет предположить, что облачное хранение улучшит технологическую базу процессов обновления данных геоинформационных систем (ГИС) [2]. Качественное детектирование дорожного покрытия на спутниковых снимках может оказать помощь при исследовании глобальных изменений дорожной сети, а также найти применение для решения ряда других исследовательских задач [1, 3]. Постоянный рост доступности спутниковых снимков высокого и сверхвысокого пространственного разрешения способствует расширению областей его применения в практических задачах [1, 3].

На сегодняшний день разработан целый спектр методов детектирования дорожного покрытия на космических снимках [4, 5]. Среди них выделяют автоматический и полуавтоматический методы. Подход, предполагающий частичную вовлеченность человека в его работу, относится к полуавтоматическим. Оператор может задавать пороговые значения, настроечные параметры, отмечать регионы для детектирования и выполнять ряд других операций. Автоматические методы работают без участия человека и, следовательно, быстрее и дешевле полуавтоматических.

Большинство работ, связанных с обнаружением дорожного покрытия на космических снимках, используют снимки среднего или низкого пространственного разрешения и, как правило, имеют погрешности, связанные с методами обработки данных дистанционного зондирования [4, 5].

Методы идентификации простых фигур на изображении обрабатывают каждый пиксель отдельно [6]. Детектирование основано на представлении дорожного полотна параметрическими уравнениями прямых линий. Параметры этого уравнения образуют фазовое пространство. На исходный спутниковый снимок накладывается детектор границ Canny. Затем для каждой точки определяется вес границы в этой точке. В случае превышения веса порогового значения аккумулятор рассматриваемого значения увеличивается на вычисленное значение уравнения прямой. После обработки всех пикселей изображения путем поиска локального максимума в пространстве значений аккумулятора определяются параметры наиболее подходящих прямых, которые маркируются на снимке как дороги. Этот метод работает не медленнее других алгоритмов, однако у него есть недостатки. Он накладывает дополнительные ограничения на обрабатываемые им спутниковые снимки: наличие инфракрасного канала, высокое качество съемки и т.д. Окклюзия дорожного полотна крупными объектами препятствует его детектированию.

Алгоритмы, базирующиеся на аппарате нечетких логик, обрабатывают каждый пиксель снимка отдельно. Такие методы состоят из двух алгоритмов: алгоритма определения вероятности принадлежности каждого пикселя дороги на основе его пространственного расположения относительно ранее обработанных пикселей и алгоритма, основанного на цветовых свойствах самого пикселя. Методы, основанные на аппарате нечетких логик, качественно детектируют дорожное полотно на космиче- ских снимках сельской местности или шоссе и в то же время в условиях города [3] ложно детектируют как дорожное полотно многие близлежащие объекты: здания, дорожные знаки, деревья и т.п. Рассматриваемые методы могут быть успешно использованы для обнаружения дорожного покрытия за пределами города, однако показывают недостаточную точность детектирования в городских условиях [7].

Методы, основанные на применении искусственных нейронных сетей (ИНС), обладают высокой адаптивностью, самоорганизацией и могут учитывать контекст обрабатываемого пикселя. Таким образом, помимо цветовых характеристик самого пикселя, в полной мере может быть учтено его расположение относительно других пикселей изображения. Это позволяет задействовать больше информационных каналов, работая с каждым в отдельности, к тому же учитывается контекст каналов пикселя – значения цветовых каналов соседних пикселей изображения. Метод основан на машинном обучении, то есть подстраивается под ранее известные входные данные.

В статье рассматривается использование ИНС – многослойного персептрона для задачи автоматического извлечения дорожного покрытия на спутниковых снимках сверхвысокого пространственного разрешения. Объектом данного исследования стала городская дорожная сеть. Необходимость исследования обусловлена тем, что создание, актуализация и обновление карт улично-дорожной сети часто осуществляются вручную [1, 4, 5]. Автоматизация данных процессов позволяет сократить затраты на решение этих задач.

Архитектура ИНС

С точки зрения архитектуры ИНС – структура обработки информации, состоящая из большого количества тесно взаимосвязанных элементов обработки информации, согласованно решающих определенную задачу. ИНС конфигурируются для применения в конкретной области, например, в области распознавания образов или классификации данных, с помощью процедуры обучения. Для ИНС процедура обучения заключается в корректировке синаптических связей между нейронами.

Простейший вычислительный элемент, из которого состоит ИНС, – нейрон. Нейрон принимает сигналы, обрабатывает их посредством передаточной и активационной функций и вы- дает сигнал либо ИНС как результат работы, либо следующему слою нейронов (рис. 1). Многослойный персептрон представляет собой многослойную структуру нейронов с полносвязным соединением двух соседних слоев. Структура многослойного персептрона характеризуется наличием нескольких типов нейронных слоев: входной, скрытый и выходной для получения, обработки и вывода сигналов соответственно.

Детектирование дорожного полотна на спутниковом снимке может быть интерпретировано как процесс классификации, при котором каждый пиксель маркируется либо как дорога, либо как фон. Множество научных исследований показали, что ИНС может классифицировать различные данные цифровых изображений [1, 4, 5]. При использовании ИНС для детектирования дорог входной слой состоит из нейронов, количество которых соответствует количеству входных параметров, а выходной – из одного нейрона, состояние которого отображает, принадлежит ли рассматриваемый пиксель дорожному полотну или нет. Как правило, одного скрытого слоя достаточно, однако оптимальное количество нейронов в скрытом слое трудно определить и устанавливается многими исследованиями эмпирически [5]. Увеличение числа нейронов влияет на способность ИНС выполнять обобщение, однако увеличивает время обучения и прохождения сигналов через нее [7].

В качестве ИНС для извлечения дорожного полотна в данном исследовании используется многослойный персептрон. В этой ИНС каждый нейрон в скрытом слое вычисляет сумму входных сигналов xi, взвешенных соответствующими значениями весовых коэффициентов wij, и выходной сигнал yj как функцию активации от вычисленной суммы:

 

где f(×) – функция активации (в данной работе нелинейная сигмоидальная);  – i-й сигнал от (t–1)-го слоя; wji – i-е весовое значение j-го нейрона;  – j-й сигнал t-го слоя. Функция активации может быть сигмоидальной, пороговой, радиально-базисной или гиперболическим тангенсом.

Генерация данных для обучения, обучение ИНС

Каждый пиксель входного изображения обрабатывается отдельно. Сам пиксель и все соседние с ним пиксели формируют 3 числовые матрицы интенсивности 3´3 в каждом цветовом канале по отдельности [8]. Выходом нейронной сети является один сигнал – либо 0, либо 1: относится ли текущий пиксель к дорожному покрытию или нет. Таким образом, на вход ИНС поступают 27 числовых значений от 0 до 255. Были рассмотрены 20 спутниковых снимков для большого охвата различных вариантов цветности дорожного полотна, его расположения, цветности фона и других характеристик космических снимков и дорожного полотна.

Цветовые каналы RGB принимают целые значения в диапазоне от 0 до 255 и требуют нормализации. После нормализации эти значения находятся в диапазоне вещественных чисел от 0 до 1. Нормализация происходит по следующей формуле: где si – входное значение i-го сигнала; N(si) – нормализованное значение i-го сигнала; Smin, Smax – минимальное и максимальное значения входного сигнала (0 и 255 соответственно).

Количество нейронов в сети влияет на ее нестабильность [9]. Нестабильность сети характеризует зависимость качества ее работы от первичных значений весовых коэффициентов до процедуры обучения [10]. Исследование проводилось для различных конфигураций ИНС и ее параметров. Количество нейронов на скрытых слоях персептрона влияет на возможность сети вовлекать в работу больший объем данных. Результаты исследования получились приблизительно равными для различных кон- фигураций.

Точность детектирования в зависимости от параметров ИНС

Detection accuracy depending on from the ANN parameters

Характеристика

Значение

Коэффициент скорости обучения, η

0,3

0,4

0,3

0,3

0,3

0,2

Коэффициент инерциальности, α

0,9

0,9

0,9

0,9

0,9

0,9

Число нейронов в скрытом слое

20

20

15

12

10

12

Точность детектирования, %

76,3

70,1

80,9

86,4

80,6

71,2

Исходя из таблицы, можно сделать вывод, что характеристики качественной работы ИНС достигают максимальных значений при 12 нейронах на скрытом слое, коэффициенте скорости обучения (η), равном 0,3.

В качестве метода обучения был выбран метод обратного распространения ошибки с заданными параметрами обучения: коэффициентом скорости обучения η и коэффициентом инерциальности α. В качестве функции активации использовалась сигмоидальная функция. Условиями завершения явились максимальное число итераций обучения 100 000 и максимальная ошибка обучения 0,0001. Наилучшая точность тестирования составила 86,4 % (рис. 2) при использовании следующих параметров ИНС: коэффициент скорости обучения – 0,3, коэффициент инерциальности – 0,9, количе- ство нейронов в скрытом слое – 12.

Результат извлечения дорожного покрытия для спутникового снимка города Хабаровска представлен на рисунке 3. Извлеченное дорожное полотно отмечено на рисунке синим цветом. Метод извлек почти все дорожное полотно улично-дорожной сети.

Заключение

Целью данной работы были разработка метода автоматического детектирования дорож- ного полотна на космических снимках и оценка эффективности его применения. Метод основан на использовании многослойного персеп- трона в качестве классификатора каждого пикселя исходного снимка.

В ходе оценки эффективности рассматриваемого метода максимальная точность обнаружения дорожного полотна на снимке достигла 86,4 %. Алгоритм был протестирован для двух спутниковых снимков. Он показал свою применимость для обнаружения дорожного полотна на космических снимках.

Литература

1.     Тормозов В.С. Метод детектирования и классификации транспортных средств на спутниковых снимках сверхвысокого разрешения // Промышленные АСУ и контроллеры. 2019. № 6. С. 18–24. DOI: 10.25791/asu.06.2019.678.

2.     Василенко К.А. Особенности облачных технологий хранения данных // Синергия наук. 2018. № 25. С. 745–748.

3.     Yang J., Wang R. Classified road detection from satellite images based on perceptual organization. Int. J. Remote Sensing, 2007, vol. 28, pp. 4653–4669.

4.     Тормозов В.С. Улучшение работы алгоритма детектирования и классификации транспортных средств на спутниковых снимках путем сокращения области поиска с использованием геоинформации о дорогах // Вестн. РосНОУ. 2019. № 2. С. 56–63. DOI: 10.25586/RNU.V9187.19.02.P.056.

5.     Montasinos P., Alquier L. Perceptual organization of thin networks with active contour functions applied to medial and aerial images. Proc. 13th Intern. Conf. on Pattern Recognition, 1996, vol. 1, pp. 647–651.

6.     Batista P.A., Prati R.C., Monard M.C. A Study of the behavior of several methods for balancing machine learning training data. ACM SIGKDD Explorations Newsletter, 2004, vol. 6, iss. 1, pp. 20–29. DOI: 10.1145/1007730.1007735.

7.     Пугачев И.Н., Маркелов Г.Я., Тормозов В.С. Методика подсчета транспортных средств с использованием космических снимков сверхвысокого пространственного разрешения // Вестн. ТОГУ. 2017. Т. 45. № 2. С. 13–20.

8.     Шошина К.В. Система мониторинга и исследования лесных дорог // Вестн. САФУ. 2013. № 4. C. 50–54.

9.     Лабутина И.А. Дешифрирование аэрокосмических снимков. М., 2004. 184 с.

10. Bacher U., Mayer H. Automatic road extraction from multispectral high resolution satellite images. P&RS, 2005, vol. 36, pt. 3, pp. 29–34.

References

  1. Tormozov V.S. Method of detecting and classifying vehicles on ultra-high resolution satellite images. Promyshlennye ASU i Kontrollery, 2019, no. 6, pp. 18–24. DOI: 10.25791/asu.06.2019.678.f (in Russ.).
  2. Vasilenko K.A. Features of cloud storage technologies. Synergy J., 2018, no. 25, pp. 745–748 (in Russ.).
  3. Yang J., Wang R. Classified road detection from satellite images based on perceptual organization. Int. J. Remote Sensing, 2007, vol. 28, pp. 4653–4669.
  4. Tormozov V.S. Improving the operation of the detection and classification of vehicles on satellite images by reducing the search area using geo-information about roads. Vestn. RosNOU, 2019, no. 2, pp. 56–63. DOI: 10.25586/RNU.V9187.19.02.P.056 (in Russ.).
  5. Montasinos P., Alquier L. Perceptual organization of thin networks with active contour functions applied to medial and aerial images. Proc. 13th Intern. Conf. on Pattern Recognition, 1996, vol. 1, pp. 647–651.
  6. Batista P.A., Prati R.C., Monard M.C. A study of the behavior of several methods for balancing machine learning training data. ACM SIGKDD Explorations Newsletter, 2004, vol. 6, iss. 1, pp. 20–29. DOI: 10.1145/1007730.1007735.
  7. Pugachev I.N., Markelov G.Ya., Tormozov V.S. Methods for counting vehicles using ultra-high spatial resolution satellite imagery. Bull. PNU, 2017, vol. 45, no. 2, pp. 13–20 (in Russ.).
  8. Shoshina K.V. A system for monitoring and forest road research. Bull. NArFU, 2013, no. 4, pp. 50–54 (in Russ.).
  9. Labutina I.A. Decoding Aerospace Images. Moscow, 2004, 184 p. (in Russ.).
  10. Bacher U., Mayer H. Automatic road extraction from multispectral high-resolution satellite images. P&RS, 2005, vol. 36, pt. 3, pp. 29–34.


http://swsys.ru/index.php?id=4715&lang=%E2%8C%A9%3Den&like=1&page=article


Perhaps, you might be interested in the following articles of similar topics: