В настоящее время на рынках России, США и Западной Европы по-прежнему сохраняются относительно высокие цены на листовой прокат. Одним из главных направлений металлургической промышленности является производство предва- рительно окрашенного проката – продукции с высокой добавленной стоимостью. В связи с этим предприятия ищут новые пути для увеличения конкурентных преимуществ своей продукции. Например, «Северсталь» расширяет производство и готовит к запуску третью линию по покрытию металла, которая включает агрегат полимерных покрытий.
Процесс производства предварительно окрашенного проката оцинкованной полосы по технологии coil coating осуществляется на агрегате полимерных покрытий и состоит из следующих этапов: обработка поверхности полосы хроматирующим раствором, нанесение грунтовочного слоя, сушка грунтовочного слоя, нанесение эмали (отделочного слоя) окрасочными валами, сушка отделочного слоя, смотка полосы в рулоны.
Компания «Тримо-ВСК» отмечает, что 5–18 % продукции проката с полимерным покрытием, поставляемой отечественными заводами, имеет отклонения от требований заказчика и норм ГОСТ, тогда как у зарубежных компаний доля такой продукции составляет в среднем 0,28 % [1]. Также от- мечается, что партии поставляемой большинством российских компаний продукции одного цвета от- личаются оттенками [1]. Поэтому так актуальна для российских металлургических предприятий задача повышения качества данной продукции.
Нанесение покрытий осуществляется с помощью грунтовочного и отделочного коутеров, которые состоят из наносящего валка, заборного валка и ванны с краской. Цвет лакокрасочного материала (ЛКМ) определяется согласно каталогу цветовых гамм RAL в соответствии со стандартными образцами. Измерение цветовых координат полимерного покрытия образца выполняется с помощью спектрофотометра во время лабораторных испытаний готовой продукции.
Геометрический смысл цветового отклонения заключается в том, что оно описывает разницу между двумя цветовыми воздействиями, определяемую как евклидово расстояние между точками, описывающими эти цвета в пространстве CIELab (рис. 1) с системой координат L*, a*, b*. Данное пространство разработано Международной комиссией по свету с целью упрощения обмена ин- формацией о цвете. Оно образуется в результате представления основных цветов (белого, черного, синего, желтого, зеленого, красного) в системе координат.
Значение координаты L характеризует цветовое различие в светлую (белую) и темную (черную) стороны относительно стандарта. Положительное значение координаты a говорит о том, что цвет образца более красный, чем стандарт, отрицательное – цвет образца более зеленый. Координата b показывает отклонение по желтой и синей составляющим цвета.
Полное цветовое различие рассчитывается по формуле , где DL=L–L0, L – координата образца, L0 – координата стандарта; Da=a–a0, a – координата образца, a0 – координата стандарта; Db=b–b0, b – координата образца, b0 – координата стандарта.
Построение модели прогнозирования
Применение моделирования сложного технологического процесса позволяет решать различные задачи по повышению качества продукции в металлургии [2]. Результаты прогнозирования можно использовать для подбора оптимальных значений технологических параметров для повышения качества продукции [3]. Для управления технологическими параметрами с целью уменьшения значения цветового отклонения отделочного покрытия гото- вой продукции с помощью методов машинного обучения была построена прогнозная модель, со- стоящая из трех подмоделей, каждая из которых осуществляет прогнозирование одной из цветовых координат (рис. 2). По полученным координатам по вышеприведенной формуле вычисляется полное цветовое отклонение.
Входные параметры собираются из нескольких источников: данные из сертификата о краске, характеристики входного рулона для покраски, технологические данные. Краска обладает следующими свойствами: вязкость, плотность жидкой краски, плотность сухой краски, сухой остаток по объему, сухой остаток по весу, толщина сухой пленки, толщина жидкого слоя эмали, укрывистость, субстрат, приведенная толщина металла, блеск, адгезия, Т-изгиб, прочность при растяжении по Эриксену, прочность при обратном ударе, стойкость к истиранию растворителем, твердость по карандашу, начальное цветовое отклонение ЛКМ (∆L’st, ∆a’st, ∆b’st, ∆E’st). Характеристики входного рулона для покраски: марка стали, толщина листа, температура перед входом в агрегат, толщина цинкового покрытия, теплоемкость металла.
Технологические данные собираются в процессе производства с датчиков основных узлов агрегата полимерных покрытий: разматыватель, накопитель полосы на входе, печь грунтовочного покрытия, печь отделочного покрытия, секция очистки, химический коутер, грунтовочный коутер, отделочный коутер, выходной накопитель, моталка. Технологический процесс характеризуется следующими основными параметрами: на- тяжение полосы, скорость полосы на каждом технологическом участке, проводимость чистящего раствора, температура чистящего раствора, температура сушильного воздуха, пиковая температура металла в печи грунтовочного покрытия, пиковая температура металла в печи отделочного покрытия, температура охлаждающей воды после печи грунтовочного слоя, температура воды после печи отделочного слоя, зазор, усилие и скорость вращения на каждом ролике, температура и скорость вра- щения вентиляторов в каждой из семи печных зон, толщина покрытия ЛКМ. Все эти данные накапли- ваются по каждому метру производимой продукции.
При реализации каждой из подмоделей использовался алгоритм машинного обучения Random Forest, который применяется в решении задач прогнозирования в различных отраслях [4, 5]. Данный алгоритм использует ансамбль решающих деревьев и сочетает в себе два метода – беггинга (bagging) и случайных подпространств. Дерево принятия решений представляет собой бинарное дерево. На ребрах (ветках) дерева – атрибуты, от которых зависит целевая функция, в узлах – атрибуты, по которым различаются случаи, в терминальных вершинах (листьях) – значения целевой функции. Общий принцип построения дерева решений – выбор атрибута из входных атрибутов и разбиение значений по этому атрибуту. Дальнейшее разбиение производится аналогично для каждого. Важным этапом построения является выбор критерия атрибута таким образом, чтобы в результате разбиения получаемые подмножества принадлежали к одному классу [6]. При разработке модели прогнозирования для каждой составляющей цветового отклонения автоматически строятся 300 деревьев. Расчет интервала, в котором находится результат, производится путем голосования каждого дерева из ансамбля. Пример дерева решений для прогнозирования ∆a представлен на рисунке 3.
Использование описанной модели делает возможным прогнозирование полного цветового от- клонения полимерного покрытия со средней отно- сительной ошибкой модели 6,1 %. Это позволяет более гибко реагировать на требования клиента, повысить качество продукции, снизить себестоимость и сроки производства.
Внедрение модели прогнозирования цветового отклонения в систему управления технологическим процессом
Построенная модель прогнозирования решает задачу статистической обработки большого набора данных. Для реализации был выбран язык программирования R, который широко используется для статистического анализа, предсказания и визуализации данных [7]. По данным исследования, наиболее эффективной реализацией алгоритма Random Forest с точки зрения точности является его параллельная реализация parRF_t, включенная в пакет caret для языка R [8].
После разработки модели необходимо интегрировать ее в существующие ИТ-системы компании. Простота интеграции для крупных промышленных предприятий является важным фактором при использовании нового программного продукта. Технологические данные с агрегата записываются в БД. Исходя из этого можно сделать вывод о том, что максимально эффективным с точки зрения IT-архитектуры будет внедрение модели прогнозирования на уровне БД.
Для упрощения интеграции модели был разработан скрипт на языке R, который в автоматическом режиме транслирует модель, построенную с помощью алгоритма Random Forest с языка R в программный код на языке SQL.
Каждый узел полученных деревьев может быть преобразован в конструкцию вида if-then-else. Таким образом, итоговая модель представляет собой набор соответствующих вложенных операторов языка PL/SQL (рис. 4).
Генерация SQL-кода
Генерация if-then-else конструкций приводит к большому количеству строк кода (1 дерево – 1 200 строк кода). В данном случае БД долго исполняет запрос, поэтому эффективнее транслировать деревья в записи.
На первом этапе генерируется код для создания таблицы (табл. 1) в БД со следующими полями: номер дерева, имя параметра, значение условия перехода, ссылка на узел дерева при истинном результате выполнения условия, ссылка на узел дерева при ложном результате выполнения условия, тип узла, значение для терминального узла.
На втором этапе для каждого узла всех деревьев в ансамбле генерируется конструкция INSERT для вставки записи в созданную таблицу. Обход дерева производится рекурсивно в глубину, начиная с корня дерева. Каждый узел характеризуется следующими параметрами: имя, тип узла, для нетерминальных узлов – логическое условие перехода к дочерним узлам, ссылки на дочерние узлы, для тер- минальных узлов – результирующее значение. Поле тип узла (node_type) содержит определенное значение для каждого вида узла: 0 – корневой, 1 – внутренний, 2 – терминальный.
Таблица 1
Структура таблицы для хранения деревьев
Table 1
The structure of a storing tree table
|
Имя
|
Тип данных
|
Описание
|
|
Id
|
int
|
ID узла
|
|
tree_num
|
int
|
Номер дерева
|
|
param_name
|
nvarchar(10)
|
Наименование параметра
|
|
cond_value
|
float
|
Значение условия перехода
|
|
true_id
|
int
|
Ссылка, если ИСТИНА
|
|
false_id
|
int
|
Ссылка, если ЛОЖЬ
|
|
node_type
|
int
|
Тип узла
|
|
value
|
int
|
Значение
|
После завершения работы программы сгенерированный код исполняется в системе управления БД Oracle для создания в ней таблицы с записями (табл. 2), соответствующими модели прогнозирования.
Прогнозирование новой записи осуществляется с помощью вызова специальной процедуры, хранимой в БД, которая вычисляет значение для каждого дерева и усредняет его. Вычисление выполняется за 0,3 секунды. Этого достаточно для использования в производстве в режиме реального времени.
Заключение
Таким образом, собрана вся информация, накапливаемая в процессе производства и доступная в сертификатах о краске. Используя эти параметры, авторы разработали модель, которая позволяет прогнозировать полное цветовое отклонение полимерного покрытия со средней относительной ошибкой модели 6,1 %. В основе модели прогнозирования лежит алгоритм Random Forest, а именно – его параллельная реализация в пакете parRF_t языка R. Кроме того, разработан подход, который позволяет быстро и эффективно внедрять разработанные модели прогнозирования на предприятии.
ПО «Генератор программного кода моделей Random Forest» было зарегистрировано в Роспатенте, свидетельство № 2016616932 от 22.06.2016.
Литература
1. Игнатенко Т. Оцинкованный и окрашенный прокат: нерадужные перспективы // Металлоснабжение и сбыт. 2015. № 4. С. 36–45.
2. Виноградова Л.Н., Шумилова Е.С. Алгоритмическое обеспечение системы прогнозирования параметров макроструктуры и качества агломерата на основе нейронной сети и фрактальной аппроксимации // Инновационные тенденции развития российской науки: сб. матер. III Междунар. науч.-практич. конф. 2010. С. 282–284.
3. Варфоломеев И.А., Ершов Е.В., Богачев Д.В. Оптико-электронный контроль цветового отклонения полимерного по- крытия оцинкованной полосы // Дефектоскопия. 2015. № 5. С. 44–51.
4. Картиев С.Б., Курейчик В.М. Алгоритм классификации, основанный на принципах случайного леса, для решения задачи прогнозирования // Программные продукты и системы. 2016. № 2. С. 11–15.
5. Иванова Е.И. Интеллектуальная информационная система для решения задач прогнозирования неисправностей вагонного оборудования на железнодорожном транспорте // Программные продукты и системы. 2015. № 4. С. 231–236.
6. Чистяков С.П. Случайные леса: обзор // Тр. Карельского НЦ РАН. 2013. № 2. С. 117–136.
7. Кабаков Р.И. R в действии. Анализ и визуализация данных на языке R. М.: ДМК Пресс, 2014. C. 33–36.
8. Fernández-Delgado M., Cernadas E., Barro S., Amorim D. Do we need hundreds of classifiers to solve real world classification problems? Jour. of Machine Learning Research. 2014, no. 15, pp. 3133–3181.