Журнал "Программные продукты и системы" - научные статьи в области информационных технологий

Подать статью

Авторитетность издания

ВАК - К1

RSCI, ядро РИНЦ

Добавить в закладки

Следующий номер на сайте

№1

Ожидается:

16 Марта 2024

Выпуски

2024

все выпуски

все статьи

Подписаться на RSS

В Национальном исследовательском университете «Московский энергетический институт» совместно с Белорусским государственным университетом информатики и радиоэлектроники (БГУИР) проводился анализ методов обучения с подкреплением (RL-обучения) в плане их использования в интеллектуальных системах реального времени на примере интеллектуальных систем поддержки принятия решений реального времени.

18.07.2018

Для реализации Стратегии научно-технологического развития Российской Федерации в плане перехода к передовым цифровым, интеллектуальным производственным технологиям, роботизированным системам, новым материалам и способам конструирования, создания систем обработки больших объемов данных, машинного обучения и искусственного интеллекта, а также аналогичной стратегии Республики Беларусь, актуальной является задача разработки эффективных методов машинного обучения в составе современных интеллектуальных систем (ИС), особенно ИС реального времени (РВ), функционирующих при достаточно жестких временных ограничениях и неопределенности (зашумленности) поступающей информации, а также включения средств машинного обучения в инструментальные средства разработки ИС и ИС РВ.

Применительно к ИС и особенно к ИС РВ активно используются методы обучения с подкреплением (reinforcement learning, RL), основанные на использовании довольно большого количества информации для обучения в произвольной окружающей среде. К основным достоинствам RL-обучения в плане использования в ИС РВ относятся:

- использование простой обратной связи на основе скалярных платежей;

- поддержка режима оперативного реагирования при необходимости быстрой адаптации агента к изменениям внешней среды;

- интерактивность и возможность изменения (пополнения) анализируемых данных;

- действенность в недетерминированных средах;

- эффективность в сочетании с темпоральными моделями для задач нахождения последовательных решений;

- открытость к модификации и сравнительная простота включения в ИС различного назначения (планирования, управления, обучения и т.д.).

Подробное описание дается в статье «О реализации средств машинного обучения в интеллектуальных системах реального времени», авторы: Еремеев А.П., Кожухов А.А. (Национальный исследовательский университет «Московский энергетический институт», Москва), Голенков В.В., Гулякина Н.А. (Белорусский государственный университет информатики и радиоэлектроники (БГУИР), Минск).