Авторитетность издания
ВАК - К1
RSCI, ядро РИНЦ
Добавить в закладки
Следующий номер на сайте
№3
Ожидается:
16 Сентября 2025
Адаптация модели нейронной сети LSTM для решения комплексной задачи распознавания образов
The adaptation of the LSTM neural network model to solve the pattern recognition complex problem
Дата подачи статьи: 30.07.2020
УДК: 004.021
Статья опубликована в выпуске журнала № 1 за 2021 год. [ на стр. 151-156 ]Аннотация:В статье рассматривается адаптация модели искусственных нейронных сетей прямого распространения с блоками долгой краткосрочной памяти (LSTM) для комплексной задачи распознавания образов. Для искусственных нейронных сетей контекст может быть извлечен из вектора поступающих на вход сигналов и из значений весовых коэффициентов обученной сети. Однако при учете контекста значительного объема растут количество нейронных связей и сложность процедур обучения и работы сети. Контекст может временно храниться в специальном буфере памяти, откуда в дальнейшем извлекаться и использоваться в качестве сигнала при работе искусственных нейронных сетей (LSTM). Преимущество сетей такого типа в том, что они используют блоки памяти, ассоциированные с каждым нейроном скрытого слоя, что позволяет сохранять данные, относящиеся к контексту, при формировании шаблонов распознавания. Предлагается метод линейного переключения блоков LSTM в зависимости от значения проходящего сигнала. Проведен вычислительный эксперимент, направленный на исследование эффективности предложенного метода и ранее разработанной нейронной сети прямого распространения аналогичной структуры. Выполнено машинное обучение для каждого вида искусственных нейронных сетей на одной и той же последовательности обучающих примеров. Проведено сравнение результатов экспериментов для искусственной нейронной сети прямого распространения, рекуррентной нейронной сети аналогичной архитектуры с таким же количеством нейронов на каждом слое и сетью нейромодулирующего взаимодействия с одной задержкой по обратной связи. Критерием оптимизации в данном случае является погрешность работы нейронной сети на обучающей выборке, состоящей из примеров, не представленных в тестирующей выборке. Эффективность решения классификационной задачи оценивается по двум критериям: погрешность обучения на обучающей выборке и погрешность тестирования на тестирующей выборке.
Abstract:The paper examines the adaptation of the model of artificial neural networks of direct distribution with blocks of long short-term memory (LSTM) for the complex problem of pattern recognition. For artifi-cial neural networks (ANN), the context can be extracted from the input signal vector and from the weight values of the trained network. However, considering the context of a significant volume, the number of neural connections and the complexity of training procedures and network operation in-crease. Instead of receiving context from input values, the context can also be temporarily stored in a special memory buffer, from where it can later be extracted and used as a signal in the ANN's opera-tion. This type of memory is called LSTM. The advantage of networks of this type is that they use memory blocks associated with each neuron of the latent layer, which allows context-related data to be stored when forming recognition patterns. There is the method of linear switching of LSTM units depending on the value of the transmitted signal in the paper. A computational experiment was conducted aimed at investigating the effectiveness of the proposed method and the previously developed neural network of direct distribution of a similar structure. Machine learning was performed for each type of ANN on the same sequence of training ex-amples. The test results were compared for: an ANN of direct propagation, a recurring neural network (RNS) of a similar architecture: with the same number of neurons on each layer, and a network of neu-romodulating interaction with one feedback delay. The optimization criterion, in this case, is the error of the neural network on the training sample, consisting of examples not presented in the test. The effi-ciency of solving the classification problem is evaluated according to two criteria: learning error on the training sample and testing error on the testing sample.
Авторы: Тормозов В.С. (007465@pnu.edu.ru) - Тихоокеанский государственный университет (ст. преподаватель), Хабаровск, Россия | |
Ключевые слова: искусственная нейронная сеть, искусственный интеллект, машинное обучение, распознавание образов, блок долгой краткосрочной памяти |
|
Keywords: artificial network, artificial intelligence, machine learning, pattern recognition, long short-term memory unit |
|
Количество просмотров: 9509 |
Статья в формате PDF Выпуск в формате PDF (7.81Мб) |
Адаптация модели нейронной сети LSTM для решения комплексной задачи распознавания образов
DOI: 10.15827/0236-235X.133.151-156
Дата подачи статьи: 30.07.2020
УДК: 004.021
Статья опубликована в выпуске журнала № 1 за 2021 год. [ на стр. 151-156 ]
В статье рассматривается адаптация модели искусственных нейронных сетей прямого распространения с блоками долгой краткосрочной памяти (LSTM) для комплексной задачи распознавания образов. Для искусственных нейронных сетей контекст может быть извлечен из вектора поступающих на вход сигналов и из значений весовых коэффициентов обученной сети. Однако при учете контекста значительного объема растут количество нейронных связей и сложность процедур обучения и работы сети. Контекст может временно храниться в специальном буфере памяти, откуда в дальнейшем извлекаться и использоваться в качестве сигнала при работе искусственных нейронных сетей (LSTM). Преимущество сетей такого типа в том, что они используют блоки памяти, ассоциированные с каждым нейроном скрытого слоя, что позволяет сохранять данные, относящиеся к контексту, при формировании шаблонов распознавания.
Предлагается метод линейного переключения блоков LSTM в зависимости от значения проходящего сигнала. Проведен вычислительный эксперимент, направленный на исследование эффективности предложенного метода и ранее разработанной нейронной сети прямого распространения аналогичной структуры. Выполнено машинное обучение для каждого вида искусственных нейронных сетей на одной и той же последовательности обучающих примеров. Проведено сравнение результатов экспериментов для искусственной нейронной сети прямого распространения, рекуррентной нейронной сети аналогичной архитектуры с таким же количеством нейронов на каждом слое и сетью нейромодулирующего взаимодействия с одной задержкой по обратной связи. Критерием оптимизации в данном случае является погрешность работы нейронной сети на обучающей выборке, состоящей из примеров, не представленных в тестирующей выборке. Эффективность решения классификационной задачи оценивается по двум критериям: погрешность обучения на обучающей выборке и погрешность тестирования на тестирующей выборке.
Тормозов В.С. (007465@pnu.edu.ru) - Тихоокеанский государственный университет (ст. преподаватель), Хабаровск, Россия
Ссылка скопирована!
Постоянный адрес статьи: http://swsys.ru/index.php?page=article&id=4791&lang=&lang=&like=1 |
Версия для печати Выпуск в формате PDF (7.81Мб) |
Статья опубликована в выпуске журнала № 1 за 2021 год. [ на стр. 151-156 ] |
Статья опубликована в выпуске журнала № 1 за 2021 год. [ на стр. 151-156 ]
Возможно, Вас заинтересуют следующие статьи схожих тематик:Возможно, Вас заинтересуют следующие статьи схожих тематик:
- Настройка и обучение многослойного персептрона для задачи выделения дорожного покрытия на космических снимках города
- Автоматизированное детектирование и классификация объектов в транспортном потоке на спутниковых снимках города
- Конструктивный метод обучения искусственных нейронных сетей со взвешенными коэффициентами
- Моделирование поведения интеллектуальных агентов на основе методов машинного обучения в моделях конкуренции
- О реализации средств машинного обучения в интеллектуальных системах реального времени
Назад, к списку статей