Современное оборудование снабжено необходимым количеством датчиков и приборов контроля, позволяющих отслеживать большое число параметров его работы. При прогнозировании отказов необходимо выбрать наиболее информативные из них. Для решения этой задачи могут быть использованы методы машинного обучения (МО). В последнее время прогнозирование отказов оборудования на основе методов МО становится все более актуальным в таких областях, как машиностроительное производство, транспортные системы, промышленность, поскольку они значительно эффективнее методов, основанных на статистическом прогнозировании и т.п. [1, 2]. Однако предложенные к построению прогнозных моделей подходы ориентированы на обучение на прецедентах, что в ряде случаев невозможно применить на практике, например, в ситуациях, когда поломки происходят довольно редко или нет достаточно обширной статистки. Так, на агрегате полимерных покрытий металла можно прогнозировать неисправности в работе приводных электродвигателей роликов у натяжных устройств, используя подход прогнозирования отказов оборудования в условиях малого количества поломок [3].
При данном подходе предлагается применить алгоритм МО Random Forest для построения моделей, прогнозирующих нормальную работу оборудования. Исторические данные используются для обучения модели, а данные о поломках – для коррекции модели. Подход состоит в следующем: осуществляются сбор необходимых данных, обучение модели на данных, соответствующих нормальному режиму работы, прогнозирование работы оборудования и анализ прогнозных и фактических данных с датчиков оборудования для выявления аномалий (потенциальных поломок). Основной принцип выявления отказов оборудования – обнаружение превышения разницы между фактическими и прогнозными значениями за ограниченный период времени (окно). Превышение заданного порога более чем в 95 % случаев свидетельствует об аномалии. Процент превышения порога вычисляется на этапе обучения модели.
Натяжные устройства агрегата полимерных покрытий металла
Агрегат полимерных покрытий металла используется для нанесения лакокрасочного материала на поверхность оцинкованной полосы. На рисунке 1 схематично показана одна из существующих линий по окраске оцинкованной полосы.
Последовательность операций, осуществляемых на линии окрашивания, следующая. Исходные рулоны подают на разматыватели (см. рис. 1), на гильотинных ножницах обрезают концы полос и участки полосы с дефектами. Для соединения полос используется сшивная машина. Натяжение полосы на участках «ножницы»–«сшивная машина»–«входной петлевой накопитель» производится с помощью натяжных роликов 3 и натяжной станции № 1. Далее полоса попадает в петлевой накопитель, а затем в направляющие ролики и правильную машину, перед и за которой установлены натяжные устройства 8. После правильной машины полоса поступает на участок химической подготовки ее поверхности перед нанесением краски. Она заключается в удалении защитной смазки и механических загрязнений с помощью щелочного раствора моющего средства, хроматировании, струйной промывке водой. Сушку полосы проводят горячим воздухом, нагретым до 230 °С в сушильном устройстве.
После прохождения натяжной станции № 2 полоса подвергается окраске в окрасочной каме- ре. Окрашивание полосы происходит в два этапа. Первый слой лакокрасочного материала нано- сят валковым способом с помощью двух окрасочных головок, а после этого его подвергают сушке при температуре 215–225 °С в печи полимеризации № 1.
Охлаждение полосы производят в ванне 17 деминерализованной водой с воздушным сушильным устройством. Далее полоса поступает в натяжную станцию № 3 и в нижнюю часть окрасочной камеры с тремя окрасочными головками. После этого производят сушку покрытия при температуре 230–240 °С в печи полимеризации № 2, охлаждение полосы в ванне охлаждения с деминерализованной водой и сушку в сушильном устройстве.
В выходной секции полоса проходит выходной накопитель, поступает на гильотинные ножницы, где производятся деление полос на заданную длину, вырезка шва, отбор проб. Далее полосу сматывают в рулон, взвешивают и упаковывают.
В линии применены накопители вертикального типа, в каждом из них полоса образует семь петель [4].
Прогнозирование аномалий на основе алгоритма МО Random Forest
Процедура МО требует достаточного количества данных, соответствующих нормальному режиму работы [5]. Сбор данных, соответствующих тем или иным отказам, требует наблюдения в течение длительного времени эксплуатации, и этих данных может быть критически мало, например, для нового оборудования. Поэтому обучение осуществляется на данных, соответствующих нормальному режиму функционирования объекта исследования (то есть в то время, когда не было поломок и других аномалий).
При реализации такого подхода предлагается использовать алгоритм МО Random Forest для построений моделей, прогнозирующих нормальную работу оборудования. Исторические данные используются для обучения модели, а данные о поломках – для ее коррекции. Подход состоит в следующем: осуществляются сбор необходимых исторических данных, обучение модели на нормальных данных, прогнозирование работы оборудования и анализ прогнозных и фактических данных с датчиков оборудования для выявления аномалий (потенциальных поломок).
Алгоритм МО Random Forest применяется при решении задач прогнозирования в различных отраслях [6]. Он основан на построении большого числа (ансамбля) деревьев решений, каждое из которых строится по выборке, получаемой из исходной обучающей выборки с помощью бутстрепа (выборки с возвращением). В отличие от классиче- ских алгоритмов построения деревьев решений у Random Forest при построении каждого дерева на стадиях расщепления вершин используется только фиксируемое число отбираемых признаков обучающей выборки и строится полное дерево (без усечения). Классификация осуществляется с помощью голосования классификаторов, определяемых отдельными деревьями, а оценка регрессии – усреднением оценок регрессии всех деревьев. Точность классификации зависит от разнообразия классификаторов ансамбля: чем больше классификаторов, тем выше вероятность корректной классификации.
Плюсы Random Forest: высокая точность классификации, защита от переподгонки; легкая параллелизация; обучающая выборка для построения случайного леса может содержать признаки, измеренные в разных шкалах; случайные леса могут использоваться для задач не только классификации и регрессии, но и выявления наиболее информативных признаков, кластеризации, определения прототипов классов и выделения аномальных наблюдений [7, 8].
ПО прогнозирования аномалий натяжных устройств агрегата полимерных покрытий в условиях малого количества отказов
Рассмотрим настройку и применение модели для прогнозирования аномалий в работе натяжных устройств агрегата полимерных покрытий. Настройка модели заключается в определении перечня всех параметров, которые можно собрать с узлов агрегата, в определении выборки с историческими данными для обучения и в обучении модели с последующей настройкой порогов срабатывания. Для натяжных устройств агрегата полимерных покрытий фиксируются данные по токам приводных электродвигателей для каждого из натяжных роликов, эти данные собираются в БД в процессе его эксплуатации (для 13 роликов по всем натяжным устройствам агрегата).
Для формирования входных параметров, обучения, оценки и корректировки модели входные данные разбиваются на три основных периода (рис. 2). Отрезок 1 с выборкой данных из БД используется для обучения модели. Данные на отрезке 2 используются для оценки модели, определяется средняя абсолютная ошибка (MAE – Mean Absolute Error). Для работы модели необходимо задать три пара- метра, которые определяются на отрезке 3: окно для мониторинга токов, коэффициент для порога срабатывания и допустимый процент превышения порога у всех значений в заданном окне.
Для формирования входных параметров и дальнейшего обучения алгоритма на отрезке 1 отбрасываются все интервалы времени, в которые данные были неполными, зафиксированы отказы в работе роликов или работа любого из роликов осуществлялась в аномальном режиме.
Для каждого ролика строится своя модель. На вход каждой модели подаются токи с остальных роликов, на выходе модель выдает прогнозируемое значение тока по выбранному ролику.
Полученные исторические данные, когда все ролики работали в нормальном режиме, используются для дальнейшего обучения каждой модели. Для всех натяжных устройств агрегата полимерных покрытий будут использоваться 13 моделей для прогнозирования тока для каждого электродвигателя ролика (рис. 3).
Таким образом, для каждой модели для обучения определяется список с данными, содержащими показания по току для каждого из роликов в один и тот же момент времени, в противном случае эти данные для обучения не допускаются. Полученная выборка разделяется на две части – обучающую (75 %) и тестовую (25 %). Обучив модель по алгоритму Random Forest, получаем 13 моделей, которые будут использоваться для прогнозирования.
Каждая из моделей представляет собой 100 бинарных деревьев решений. Пример бинарного дерева решений для подмодели I1 представлен на рисунке 4.
После построения всех моделей необходимо определить среднюю абсолютную ошибку:
, (1)
где N – количество точек из выборки за отрезок 2 (рис. 2); – прогнозное значение в момент времени t; I – фактическое значение тока в момент времени t.
Таким образом будет определено MAE для каждого из 13 роликов.
Чтобы определить возможность поломки оборудования в период времени, ограниченный окном слежения, необходимо установить порог – процент превышения разницы прогнозного и фактического сигналов для каждого ролика относительно полученного MAE для это ролика, умноженного на коэффициент (определяющий, во сколько раз допустимо превышение MAE). Практика показывает, что превышение порога должно иметь место в течение некоторого времени. При этом порог необходимо установить так, чтобы не допустить ложных срабатываний и минимизировать пропуск реальных поломок. Если имеются данные о поломках, порог устанавливается на основе этих данных и выбирается интервал времени (окно), в течение которого определяется превышение порога.
Таким образом, если будет зафиксировано превышение порога разности прогнозируемого и фактического тока для некоторых точек свыше максимально допустимого процента относительно всех точек окна, осуществляется информирование о том, что оборудование неисправно.
В целом 3-й этап настройки модели заключается в выборе окна мониторинга, максимально допустимого процента точек с превышением порога относительно окна и в подборе коэффициентов превышения MAE для каждого ролика, чтобы минимизировать как количество ложных срабатываний модели, так и пропуск зафиксированных поломок из отрезка 3 времени (рис. 2).
На рисунке 5 показан принцип мониторинга, на данном этапе в реальном времени проводится сравнение всех фактических сигналов с датчиков с их прогнозными значениями.
В данном случае на исторических данных показан пример, когда, смещая окно мониторинга по времени, ПО определяет, что большая часть разности прогнозных и фактических значений в этом окне превышает порог, и сигнализирует об аварии. На рисунке видно, что в дальнейшем по данным с БД был зафиксирован отказ.
На рисунке 6 показана реализованная модель в виде ПО для прогнозирования отказов 13 роликов у 6 натяжных устройств агрегата полимерных покрытий № 1.
Данное ПО прогнозирует ток для каждого ролика в автоматическом режиме путем сравнения фактического и прогнозного сигналов, в случае превышения разности в показаниях относительно порога фиксируется ошибка. При обнаружении ошибок за 1 000 секунд более чем в 95 % случаев выявляется отказ в работе агрегата. ПО информирует оператора, если какая-либо модель зафиксирует превышение допустимого порога и время, когда был превышен этот порог. Для обучения и настройки модели первый отрезок времени с данными составлял 2 дня, второй – 1 день и третий – 2 месяца. При тестировании ПО в течение двух месяцев не было допущено ложных срабатываний. Помимо прогнозирования отказов оборудования, дан- ную программу можно использовать для диагно- стики узлов агрегата [9].
Результаты
Таким образом, для слежения за работой роликов натяжных устройств агрегата полимерных покрытий было реализовано ПО для прогнозирования их отказов на основе алгоритма МО Random Forest, позволяющее эффективно в автоматическом режиме следить за работой агрегата и информировать диспетчера ремонтного подразделения в случае обнаружения аномалий в работе электродвигателей.
Генерируемая модель в ПО позволяет прогнозировать ток каждого приводного электродвигателя ролика у натяжных устройств. Обучение модели проводится на данных, считанных с датчиков оборудования в период его эксплуатации. Задача алгоритма МО – спрогнозировать нормальный сигнал для каждого тока электродвигателя, используя значения сигналов в текущий промежуток времени от остальных электродвигателей. Для выявления отказов модель анализирует разницу в показаниях фактического и прогнозного сигналов в каждый момент времени с выбранным интервалом. В аналогичных подходах модель выявляет сигнатуры в показаниях датчиков, которые были зафиксированы до и во время предыдущих отказов оборудования. На основе выявления совпадений этих сигнатур с фактическим сигналом и прогнозируется потенциальный отказ.
При подходе прогнозирования отказов оборудования в условиях малого количества поломок данные об отказах используются только для настройки модели, а именно для исключения ложных оповещений об отказе оборудования и минимизации пропусков реальных поломок. Кроме того, разработан подход, который позволяет быстро и эффективно внедрять разработанные модели про- гнозирования на предприятии. Для быстрого пере- обучения модели на языке R [10] и конвертации обученной модели в классы на языке C# (на котором разработано ПО) используется дополнительное ПО «Генератор программного кода моделей Random Forest». ПО, рассмотренное в данной статье, и ПО «Генератор программного кода моделей Random Forest» были зарегистрированы (свид. № 2016616932 от 22.06.2016) в Роспатенте.
Литература
1. Мальцев В. Прогнозная аналитика для эффективного использования оборудования. 2016. URL: http://filearchive. cnews.ru/files/reviews/2016_03_29/2_Maltsev.pdf (дата обращения: 10.05.2017).
2. Oliver M. Predictive maintenance & service (PdMS). Outline and value proposition. 2014. URL: https://blogs.saphana.com/ wp-content/uploads/2014/11/Predictive-Maintenance-Service-Outline-Value-Proposition.pdf (дата обращения: 10.05.2017).
3. Шаханов Н.И., Варфоломеев И.А., Ершов Е.В., Юди- на О.В. Прогнозирование отказов оборудования в условиях малого количества поломок // Вестн. Череповецкого гос. ун-та. 2016. № 6. С. 36–41.
4. Агрегаты для нанесения полимерных покрытий на прокат. URL: http://dlja-mashinostroitelja.info/2012/11/agregaty-dlja-nanesenija-polimernyh-pokrytij/ (дата обращения: 10.05.2017).
5. Alestra S., Brand C., Burnaev E., Erofeev P., Papanov A., Bordry C., Silveira-Freixo C. Rare event anticipation and degradation trending for aircraft predictive maintenance. Proc. WCCM 2014, ECCM 2014, ECFD 2014, 2014, vol. 11, pp. 6571–6582.
6. Иванова Е.И. Интеллектуальная информационная система для решения задач прогнозирования неисправностей вагонного оборудования на железнодорожном транспорте // Программные продукты и системы. 2015. № 4. С. 231–236.
7. Чистяков С.П. Случайные леса: обзор // Тр. Карельского науч. центра РАН. 2013. № 1. С. 117–136.
8. Пальмов С.В., Денискова А.О. Случайный лес: основные особенности // Наука сегодня: теоретические и практические аспекты. 2017. С. 51–52.
9. Виноградова Л.Н., Данилицкий С.В. Диагностика опор скольжения агрегатов металлургического производства методами неразрушающего контроля // Череповецкие научные чтения. 2013. Ч. 3. С. 39–41.
10. Кабаков Р.И. R в действии. Анализ и визуализация дан- ных на языке R. М.: ДМК Пресс, 2014. C. 33–36.