Journal influence
Higher Attestation Commission (VAK) - К1 quartile
Russian Science Citation Index (RSCI)
Bookmark
Next issue
№2
Publication date:
16 June 2024
Experimental analysis of the accuracy and performance of varieties of YOLO architectures for computer vision problems
Date of submission article: 13.05.2020
UDC: 004.032.2
The article was published in issue no. № 4, 2020 [ pp. 635-640 ]Abstract:Unmanned vehicles are increasingly being introduced into everyday life. To achieve full autonomy when traveling, unmanned vehicles use computer vision systems, which are responsible for analyzing the status of traffic lights, signs, and other objects that can appear on the road. Today, the standard in this area is YOLOv1 architecture, however, it is already obsolete. In this regard, a computer vision sys-tem for an unmanned vehicle based on modern technologies is being developed. There is the problem of choosing a computer vision architecture that will be responsible for analyz-ing traffic. First of all, it must be fast and accurate, because road traffic changes very quickly, and the accuracy of determination directly affects the degree of involvement of passenger-drivers in the pro-cess in order to avoid emergency situations. In addition, the architecture should occupy as little compu-ting power as possible, and not waste a large number of energy resources. To investigate these issues, it was decided to carry out an experiment that would reveal the advantages and disadvantages of various YOLO architectures. Also, the data provided by different researchers is very different due to using dif-ferent equipment while training and testing of networks. This makes it impossible for data to be com-pared objectively. The paper analyzes various types of YOLOv3 architecture and its versions for low-power compu-ting systems YOLOv3-tiny, describes their advantages and disadvantages for computer vision systems. The experiments are carried out on single hardware for all analyzed architectures. Experimental re-search on the accuracy and performance of various YOLO architectures is being done. The VOC2012 dataset is used for training and testing. As a result of the research, the strengths and weaknesses of the architectures under consideration are determined and options for the further development of the tech-nology are analyzed, taking into account the growth in the power of computing systems and the emer-gence of new technological solutions.
Аннотация:В повседневную жизнь все активнее внедряются беспилотные автомобили. Для достижения полноценной автономности при поездке они используют системы компьютерного зрения, отвечающие за анализ состояния светофоров, знаков и других объектов, которые могут появляться на дороге. На сегодняшний день стандартом в этой области является архитектура YOLOv1, однако она уже устарела. В связи с этим идет разработка системы компьютерного зрения для беспилотного автомобиля на базе современных технологий. Существует проблема выбора архитектуры компьютерного зрения, которая будет отвечать за анализ дорожного трафика. В первую очередь, она должна быть быстрой и точной, так как дорожный трафик меняется очень интенсивно, а точность определения напрямую влияет на степень задействованности пассажира-водителя в процессе, чтобы избежать аварийных ситуаций. Помимо этого, архитектура должна занимать как можно меньше вычислительных мощностей и не потреблять большое количество энергоресурсов. Для исследования данных проблем было принято решение о проведении эксперимента, который позволил бы выявить слабые и сильные стороны раз-личных YOLO-архитектур. К тому же данные, предоставляемые исследователями, сильно разнятся из-за использования разного оборудования, на котором осуществляются обучение и тестирование сетей, что не дает возможности использовать их для объективной оценки. В статье анализируются различные разновидности архитектуры YOLOv3 и ее версии для маломощных вычислительных систем YOLOv3-tiny, описываются их преимущества и недостатки при использовании в системах компьютерного зрения. Эксперименты выполняются на едином оборудовании для всех анализируемых вариантов архитектур. Проводится экспериментальное исследование точности и производительности различных вариантов архитектур YOLO. Для обучения и тестирования используется датасет VOC2012. В результате исследования определяются сильные и слабые стороны рассматриваемых архитектур и анализируются варианты дальнейшего развития технологии с учетом роста мощностей вычислительных систем и появления новых технологических решений.
Authors: P.A. Bokov (deathhodd@gmail.com) - Volgograd State Technical University (Student), Volgograd, Russia, P.D. Kravchenya (kpd_@mail.ru ) - Volgograd State Technical University (Senior Lecturer), Volgograd, Russia | |
Keywords: computer vision, software development, unmanned vehicles, neural network, yolov3 |
|
Page views: 8784 |
PDF version article |
Экспериментальный анализ точности и производительности разновидностей архитектур YOLO для задач компьютерного зрения
DOI: 10.15827/0236-235X.132.635-640
Date of submission article: 13.05.2020
UDC: 004.032.2
The article was published in issue no. № 4, 2020. [ pp. 635-640 ]
Unmanned vehicles are increasingly being introduced into everyday life. To achieve full autonomy when traveling, unmanned vehicles use computer vision systems, which are responsible for analyzing the status of traffic lights, signs, and other objects that can appear on the road. Today, the standard in this area is YOLOv1 architecture, however, it is already obsolete. In this regard, a computer vision sys-tem for an unmanned vehicle based on modern technologies is being developed.
There is the problem of choosing a computer vision architecture that will be responsible for analyz-ing traffic. First of all, it must be fast and accurate, because road traffic changes very quickly, and the accuracy of determination directly affects the degree of involvement of passenger-drivers in the pro-cess in order to avoid emergency situations. In addition, the architecture should occupy as little compu-ting power as possible, and not waste a large number of energy resources. To investigate these issues, it was decided to carry out an experiment that would reveal the advantages and disadvantages of various YOLO architectures. Also, the data provided by different researchers is very different due to using dif-ferent equipment while training and testing of networks. This makes it impossible for data to be com-pared objectively.
The paper analyzes various types of YOLOv3 architecture and its versions for low-power compu-ting systems YOLOv3-tiny, describes their advantages and disadvantages for computer vision systems. The experiments are carried out on single hardware for all analyzed architectures. Experimental re-search on the accuracy and performance of various YOLO architectures is being done. The VOC2012 dataset is used for training and testing. As a result of the research, the strengths and weaknesses of the architectures under consideration are determined and options for the further development of the tech-nology are analyzed, taking into account the growth in the power of computing systems and the emer-gence of new technological solutions.
P.A. Bokov (deathhodd@gmail.com) - Volgograd State Technical University (Student), Volgograd, Russia, P.D. Kravchenya (kpd_@mail.ru ) - Volgograd State Technical University (Senior Lecturer), Volgograd, Russia
Ссылка скопирована!
Permanent link: http://swsys.ru/index.php?page=article&id=4760&lang=&lang=en&like=1 |
Print version |
The article was published in issue no. № 4, 2020 [ pp. 635-640 ] |
The article was published in issue no. № 4, 2020. [ pp. 635-640 ]
Perhaps, you might be interested in the following articles of similar topics:Perhaps, you might be interested in the following articles of similar topics:
- Нейросетевая инструментальная среда для создания персонализированных интерфейсов прикладных программ
- Диагностирование электромеханических систем на основе нейросетевых технологий
- Исследование влияния алгоритмов инициализации весовых коэффициентов сети Вольтерри на решение задачи прогнозирования
- Поиск регулярных решеток на текстуре фасадов зданий
- Методы и алгоритмы определения положения и ориентации беспилотного летательного аппарата с применением бортовых видеокамер
Back to the list of articles