Авторитетность издания
Добавить в закладки
Следующий номер на сайте
В Национальном исследовательском университете «Московский энергетический институт» совместно с Белорусским государственным университетом информатики и радиоэлектроники (БГУИР) проводился анализ методов обучения с подкреплением (RL-обучения) в плане их использования в интеллектуальных системах реального времени на примере интеллектуальных систем поддержки принятия решений реального времени.
18.07.2018Для реализации Стратегии научно-технологического развития Российской Федерации в плане перехода к передовым цифровым, интеллектуальным производственным технологиям, роботизированным системам, новым материалам и способам конструирования, создания систем обработки больших объемов данных, машинного обучения и искусственного интеллекта, а также аналогичной стратегии Республики Беларусь, актуальной является задача разработки эффективных методов машинного обучения в составе современных интеллектуальных систем (ИС), особенно ИС реального времени (РВ), функционирующих при достаточно жестких временных ограничениях и неопределенности (зашумленности) поступающей информации, а также включения средств машинного обучения в инструментальные средства разработки ИС и ИС РВ.
Применительно к ИС и особенно к ИС РВ активно используются методы обучения с подкреплением (reinforcement learning, RL), основанные на использовании довольно большого количества информации для обучения в произвольной окружающей среде. К основным достоинствам RL-обучения в плане использования в ИС РВ относятся:
- использование простой обратной связи на основе скалярных платежей;
- поддержка режима оперативного реагирования при необходимости быстрой адаптации агента к изменениям внешней среды;
- интерактивность и возможность изменения (пополнения) анализируемых данных;
- действенность в недетерминированных средах;
- эффективность в сочетании с темпоральными моделями для задач нахождения последовательных решений;
- открытость к модификации и сравнительная простота включения в ИС различного назначения (планирования, управления, обучения и т.д.).
Подробное описание дается в статье «О реализации средств машинного обучения в интеллектуальных системах реального времени», авторы: Еремеев А.П., Кожухов А.А. (Национальный исследовательский университет «Московский энергетический институт», Москва), Голенков В.В., Гулякина Н.А. (Белорусский государственный университет информатики и радиоэлектроники (БГУИР), Минск).