Авторитетность издания
ВАК - К1
RSCI, ядро РИНЦ
Добавить в закладки
Следующий номер на сайте
№3
Ожидается:
16 Сентября 2025
Экспериментальный анализ точности и производительности разновидностей архитектур YOLO для задач компьютерного зрения
Experimental analysis of the accuracy and performance of varieties of YOLO architectures for computer vision problems
Дата подачи статьи: 13.05.2020
УДК: 004.032.2
Статья опубликована в выпуске журнала № 4 за 2020 год. [ на стр. 635-640 ]Аннотация:В повседневную жизнь все активнее внедряются беспилотные автомобили. Для достижения полноценной автономности при поездке они используют системы компьютерного зрения, отвечающие за анализ состояния светофоров, знаков и других объектов, которые могут появляться на дороге. На сегодняшний день стандартом в этой области является архитектура YOLOv1, однако она уже устарела. В связи с этим идет разработка системы компьютерного зрения для беспилотного автомобиля на базе современных технологий. Существует проблема выбора архитектуры компьютерного зрения, которая будет отвечать за анализ дорожного трафика. В первую очередь, она должна быть быстрой и точной, так как дорожный трафик меняется очень интенсивно, а точность определения напрямую влияет на степень задействованности пассажира-водителя в процессе, чтобы избежать аварийных ситуаций. Помимо этого, архитектура должна занимать как можно меньше вычислительных мощностей и не потреблять большое количество энергоресурсов. Для исследования данных проблем было принято решение о проведении эксперимента, который позволил бы выявить слабые и сильные стороны раз-личных YOLO-архитектур. К тому же данные, предоставляемые исследователями, сильно разнятся из-за использования разного оборудования, на котором осуществляются обучение и тестирование сетей, что не дает возможности использовать их для объективной оценки. В статье анализируются различные разновидности архитектуры YOLOv3 и ее версии для маломощных вычислительных систем YOLOv3-tiny, описываются их преимущества и недостатки при использовании в системах компьютерного зрения. Эксперименты выполняются на едином оборудовании для всех анализируемых вариантов архитектур. Проводится экспериментальное исследование точности и производительности различных вариантов архитектур YOLO. Для обучения и тестирования используется датасет VOC2012. В результате исследования определяются сильные и слабые стороны рассматриваемых архитектур и анализируются варианты дальнейшего развития технологии с учетом роста мощностей вычислительных систем и появления новых технологических решений.
Abstract:Unmanned vehicles are increasingly being introduced into everyday life. To achieve full autonomy when traveling, unmanned vehicles use computer vision systems, which are responsible for analyzing the status of traffic lights, signs, and other objects that can appear on the road. Today, the standard in this area is YOLOv1 architecture, however, it is already obsolete. In this regard, a computer vision sys-tem for an unmanned vehicle based on modern technologies is being developed. There is the problem of choosing a computer vision architecture that will be responsible for analyz-ing traffic. First of all, it must be fast and accurate, because road traffic changes very quickly, and the accuracy of determination directly affects the degree of involvement of passenger-drivers in the pro-cess in order to avoid emergency situations. In addition, the architecture should occupy as little compu-ting power as possible, and not waste a large number of energy resources. To investigate these issues, it was decided to carry out an experiment that would reveal the advantages and disadvantages of various YOLO architectures. Also, the data provided by different researchers is very different due to using dif-ferent equipment while training and testing of networks. This makes it impossible for data to be com-pared objectively. The paper analyzes various types of YOLOv3 architecture and its versions for low-power compu-ting systems YOLOv3-tiny, describes their advantages and disadvantages for computer vision systems. The experiments are carried out on single hardware for all analyzed architectures. Experimental re-search on the accuracy and performance of various YOLO architectures is being done. The VOC2012 dataset is used for training and testing. As a result of the research, the strengths and weaknesses of the architectures under consideration are determined and options for the further development of the tech-nology are analyzed, taking into account the growth in the power of computing systems and the emer-gence of new technological solutions.
Авторы: Боков П.А. (deathhodd@gmail.com) - Волгоградский государственный технический университет (студент), Волгоград, Россия, Кравченя П.Д. (kpd_@mail.ru ) - Волгоградский государственный технический университет (старший преподаватель), Волгоград, Россия | |
Ключевые слова: компьютерное зрение, разработка программного обеспечения, беспилотные автомобили, нейронная сеть, yolov3 |
|
Keywords: computer vision, software development, unmanned vehicles, neural network, yolov3 |
|
Количество просмотров: 8939 |
Статья в формате PDF |
Экспериментальный анализ точности и производительности разновидностей архитектур YOLO для задач компьютерного зрения
DOI: 10.15827/0236-235X.132.635-640
Дата подачи статьи: 13.05.2020
УДК: 004.032.2
Статья опубликована в выпуске журнала № 4 за 2020 год. [ на стр. 635-640 ]
В повседневную жизнь все активнее внедряются беспилотные автомобили. Для достижения полноценной автономности при поездке они используют системы компьютерного зрения, отвечающие за анализ состояния светофоров, знаков и других объектов, которые могут появляться на дороге. На сегодняшний день стандартом в этой области является архитектура YOLOv1, однако она уже устарела.
В связи с этим идет разработка системы компьютерного зрения для беспилотного автомобиля на базе современных технологий.
Существует проблема выбора архитектуры компьютерного зрения, которая будет отвечать за анализ дорожного трафика. В первую очередь, она должна быть быстрой и точной, так как дорожный трафик меняется очень интенсивно, а точность определения напрямую влияет на степень задействованности пассажира-водителя в процессе, чтобы избежать аварийных ситуаций. Помимо этого, архитектура должна занимать как можно меньше вычислительных мощностей и не потреблять большое количество энергоресурсов. Для исследования данных проблем было принято решение о проведении эксперимента, который позволил бы выявить слабые и сильные стороны раз-личных YOLO-архитектур. К тому же данные, предоставляемые исследователями, сильно разнятся из-за использования разного оборудования, на котором осуществляются обучение и тестирование сетей, что не дает возможности использовать их для объективной оценки.
В статье анализируются различные разновидности архитектуры YOLOv3 и ее версии для маломощных вычислительных систем YOLOv3-tiny, описываются их преимущества и недостатки при использовании в системах компьютерного зрения. Эксперименты выполняются на едином оборудовании для всех анализируемых вариантов архитектур. Проводится экспериментальное исследование точности и производительности различных вариантов архитектур YOLO. Для обучения и тестирования используется датасет VOC2012. В результате исследования определяются сильные и слабые стороны рассматриваемых архитектур и анализируются варианты дальнейшего развития технологии с учетом роста мощностей вычислительных систем и появления новых технологических решений.
Боков П.А. (deathhodd@gmail.com) - Волгоградский государственный технический университет (студент), Волгоград, Россия, Кравченя П.Д. (kpd_@mail.ru ) - Волгоградский государственный технический университет (старший преподаватель), Волгоград, Россия
Ключевые слова: компьютерное зрение, разработка программного обеспечения, беспилотные автомобили, нейронная сеть, yolov3
Ссылка скопирована!
Постоянный адрес статьи: http://swsys.ru/index.php?page=article&id=4760&lang= |
Версия для печати |
Статья опубликована в выпуске журнала № 4 за 2020 год. [ на стр. 635-640 ] |
Статья опубликована в выпуске журнала № 4 за 2020 год. [ на стр. 635-640 ]
Возможно, Вас заинтересуют следующие статьи схожих тематик:Возможно, Вас заинтересуют следующие статьи схожих тематик:
- Нейросетевая инструментальная среда для создания персонализированных интерфейсов прикладных программ
- Диагностирование электромеханических систем на основе нейросетевых технологий
- Агрегация и анализ сведений логистических компаний для построения сложного маршрута перевозки груза
- Исследование влияния алгоритмов инициализации весовых коэффициентов сети Вольтерри на решение задачи прогнозирования
- Нейросетевой поведенческий анализ действий пользователя в целях обнаружения вторжений уровня узла
Назад, к списку статей