Построение модели знаний о технологиях с помощью дискриминантных алгоритмов

Подать статью

Авторитетность издания

ВАК - К1

RSCI, ядро РИНЦ

Добавить в закладки

Следующий номер на сайте

№4

Ожидается:

09 Декабря 2024

Выпуски

2024

2023

№4 2023

все выпуски

все статьи

Подписаться на RSS

Построение модели знаний о технологиях с помощью дискриминантных алгоритмов

Making a knowledge model of technologies by means of discriminant algorithms

Статья опубликована в выпуске журнала № 3 за 2009 год.
Аннотация:Рассматриваются особенности представления в компьютерных обучающих системах технологических знаний, которые описывают процессы, направленные на производство материального или информационного продукта. Предложен подход, основанный на выделении классов.
Abstract:Features of representation in computer training systems of technological knowledge which describe the processes directed on manufacture of a material or information product are considered. The approach based on allocation of classes is offered.

Авторы: Пименов В.И. (v_pim@mail.ru) - Санкт-Петербургский университет технологии и дизайна, кандидат технических наук
Ключевые слова: база знаний, решающее правило, обучение распознаванию образов, технологический процесс
Keywords: knowledge base, decision rule, pattern recognition training, technological process
Количество просмотров: 11754	Версия для печати Выпуск в формате PDF (4.21Мб)

Специальная литература представляет технологический процесс (ТП) как текстовое описание (вербальную модель), снабженное иллюстрациями, формулами, таблицами. До конца не исследованные технологии, процессы, описывающие создание новых материалов, сопровождаются также наличием большого количества экспериментальных данных.

Этапность выполнения технологических операций, выделение классов готовой продукции, наличие диапазонов значений технологических параметров, обеспечивающих получение готового продукта требуемого качества, приводят к построению дискретных моделей знаний о технологических процессах. Многие исходные ингредиенты являются результатом выполнения других технологических процессов (переделов). Поэтому с точки зрения описания понятий и их свойств вопросы описания и формализации исходных ингредиентов и готового продукта должны решаться одинаково.

При реализации обучающей системы в гипермедиатехнологиях в основе ее логической схемы прежде всего лежит модель предметной области, которая чаще строится в виде многосвязного графа логических связей учебных элементов. Основная проблема при преобразовании первичного материала в систему гипермедиакомпонент – выделение информационных блоков и установление логических связей-гиперссылок между сотнями, а иногда и тысячами учебных элементов.

Модель знаний о ТП представляется как совокупность статической и динамической составляющих. Статическая модель отражает множество классов W: возможные наименования продукции, сортность, уровни потребительских и эксплуатационных показателей качества. Описание технологического процесса массивом «объект–атрибуты–значения» позволяет представить задачу проектирования динамической модели знаний как обучение распознаванию образов (ОРО), когда из БД извлекается система решающих правил, описывающих порядок изготовления продукции заданных классов. Ее графическое представление дает модель поля знаний, на котором распределяются информационные блоки и устанавливаются связи-гиперссылки. Значения атрибутов XA, характеризующих сырье, материалы, детали, изделия, и достаточное число прецедентов позволяют выделить информативное подмножество признаков XР для разделения ТП по выпуску продукции различных классов. Признаки-свойства, не вошедшие в рабочий словарь XР, определяют в исходных текстах базовые понятия, общие места или дополнительную мультимедийную информацию.

Алгоритмическое обеспечение процесса проектирования модели знаний обучающих систем технологической направленности следующее. Исходными данными являются описания XA производимых объектов с указанием их принадлежности соответствующему классу. Список признаков, входящих в априорный словарь, специалист формирует исходя из заданного алфавита классов объектов, в частном случае – при составлении онтологии знаний об описываемых ТП.

Получение априорной информации для обучения выполняется одним из способов:

1) выборкой из БД результатов наблюдения за выпуском готовой продукции;

2) заданием значений признаков (или диапазонов значений признаков) объектов обучающей выборки (ОВ);

3) заданием функций принадлежности нечетких классов.

Если отношение размерности исходного пространства признаков к объему ОВ невелико (NА/n(2)<0,03, …, 0,1, где n(2) – число объектов ОВ для пары классов) и априорный словарь недостаточен для разделения объектов различных классов, то возникает необходимость применения последовательного критерия отношения вероятностей, позволяющего накапливать информацию о значениях признаков объекта на этапе логического вывода. В режиме выделения класса с новыми потребительскими свойствами распознающая БЗ решает задачу двухальтернативного распознавания объектов интересующего класса Wи и остальных объектов, относящихся к фоновому классу Wф [1].

При ограниченном обучающем материале используются алгоритмы ОРО, обеспечивающие высокую экстраполирующую силу найденных правил. Критерием выбора класса решающего правила (РП), осуществляемого совместно с поиском рабочего словаря Xр, является гарантированная оценка риска [2] Pош=nmin(K, Xр ) + e(n, h, M, h), где n – эмпирический риск (частота ошибок распознавания на обучающей выборке); e – гарантированное уклонение среднего риска от эмпирического; емкость h=h(K, Xр) является мерой разнообразия класса РП K для фиксированной размерности признакового пространства. К простейшим классам РП, имеющим минимальную емкость, относятся логические, линейно-логические, линейные и кусочно-линейные. РП, образующие в пространстве признаков нелинейные разделяющие гиперповерхности, при оценке их емкости могут использовать кусочно-линейную аппроксимацию.

Характер зависимости величин Pош от объема выборки n, доверительной вероятности h, количества классов продукции M и емкости h позволяет в условиях ограниченных ОВ осуществить выбор класса РП K* и рабочего словаря Xр. Выбранный по критерию минимума Pош класс K* предпочтительнее с точки зрения обеспечения экстраполирующей силы системы РП.

Нарушение гипотезы компактности, когда объекты различных классов перемешаны в признаковом пространстве, приводит к тому, что дискриминантные правила отказываются от распознавания или в лучшем случае «цепляют» только кусочки настоящих логических закономерностей в данных [3]. Чтобы избежать подобной ситуации, следует перед обучением соответствующие трудные классы разбить на подклассы или, если выполняется поиск неочевидных, скрытых ре- гулярностей, предварительно выделить подгрупп- пы объектов ОВ методами таксономического анализа.

Поиск рабочего словаря и интервальное кодирование признаков (для логических РП) выполняются на основе вычисления критерия информативности. Его выбор связан с классом используемых РП. Для логических РП и для РП, построенных в пространстве непрерывных признаков, используются свои группы критериев.

Для уменьшения избыточности кода и величины объема пространства признаков V=, j=, можно устранить дублирующие пороги после дискретизации отдельных признаков на определенное число градаций tj, что позволяет добиться более глубокого минимума Pош.

Таким образом, при формировании распознающей БЗ при ограниченности исходных данных прежде всего решается комбинаторная задача выбора класса РП и системы описания объектов, а затем с учетом типа входящих в описание признаков непосредственно строится РП. Тем самым осуществляются разбиение единого процесса обучения и учет структуры взаимосвязи его основных этапов.

Для кодирования признаков можно использовать алгоритм позиционного порогового кодирования [4] или алгоритм минимального числа порогов (МЧП) [5]. В первом случае весь диапазон значений признака предварительно разбивается на интервалы равной длины, на каждом интервале для вычисления разделяющей силы определяется характеристическое множество классов, для которых частота появления объектов ОВ не равна нулю. Во втором случае процедура обеспечивает разделение всех полностью разделимых между собой классов, используя МЧП.

Программы формирования рабочего словаря выбирают минимальное или квазиминимальное число признаков Nр из исходного априорного словаря XA при информативности Iр, не ниже исходной IA. После МЧП-дискретизации задачу выбора рабочего словаря можно свести к схеме аддитивного алгоритма ветвей и границ [5]. Обобщение информации, содержащейся в классах объектов, способствует выявлению отличительных, характерных для каждого класса настроек параметров технологического процесса.

Алгоритмы обучения и распознавания используют, например, следующие методы:

- метод ближайшего соседа; кусочно-линейное РП формируется для небольшого числа классов (M£10);

- метод дискретных линейных решающих функций (ЛРФ) [4]; при обучении настраиваются коэффициенты дискретных функций и пороги позиционного кодирования признаков;

- метод бинарной решающей матрицы (БРМ), осуществляющей покрытие каждого класса объектов ОВ гиперпараллелепипедами с гранями, ортогональными координатным осям [5]. Матрица формируется по описаниям интервалов кодирования признаков через множества индексов классов, значения признаков которых принадлежат данному интервалу кодирования. Распознавание осуществляется посредством поэлементной конъюнкции ячеек матрицы, на которые указывают значения признаков распознаваемого объекта, и выделения единичной ячейки, соответствующей коду класса.

Параметрическая идентификация РП заключается в настройке коэффициентов алгоритма распознавания на конкретную обучающую выборку: по окончании обучения формируются массивы значений порогов для логических РП или коэффициенты линейных функций для линейных и кусочно-линейных РП.

Выбор среди множества альтернативных логических РП в условиях недостаточной ОВ осуществляется на основе рассмотрения сформированных систем описания. Лучшее качество имеет алгоритм, для которого минимальной является величина объема пространств признаков V, и, соответственно, Pош при nmin»0 и h=const.

Поэтому при оценке надежности РП следует учитывать влияние используемого способа кодирования признаков и вида их критерия информативности, которые должны быть согласованы со сложностью РП. Дискретные ЛРФ аппроксимируют линейные непрерывные решающие функции с мелким шагом дискретизации и по своей сложности занимают промежуточное положение между известными логическими и линейно-логически- ми РП.

Учет взаимосвязи основных этапов обучения на основе комплексного применения дискриминантных алгоритмов в условиях ограниченной априорной информации позволяет проектировать динамическую модель знаний с обеспечением высокой точности при принятии решения по новым данным.

РП, построенные как простой набор дискриминантных функций линейного и более сложного вида, даже в случае полного разделения классов не содержат знаний о диапазонах изменения значений параметров ТП и их взаимодействий для получения готового изделия заданного класса. Их анализ позволяет указать лишь состав наиболее важных технологических параметров и их весовые коэффициенты для попарной различимости технологических процессов. Логические правила в форме БРМ и нечеткой решающей матрицы легко поддаются семантической интерпретации и соответствующей реализации в БЗ.

Методы ОРО могут использоваться при создании обучающих систем, основой которых являются информационно-логическая и продукционно-фреймовая модели.

Методику проектирования логической схемы гипертекстовых обучающих систем позволяют сформировать результаты, полученные в процессе построения дискриминантного РП. Например, признаки, оставшиеся после выполнения процедур интервального кодирования и отбора рабочего словаря, характеризуют отличительные для каждого класса настройки параметров, и на фрагмент учебного материала, описывающий характерный прием для получения продукта требуемого класса, дается одна гиперссылка.

Интервалы признаков, представляющие 30–70 % классов, свидетельствуют о возможности выделения соответствующих классов продукции в отдельное подмножество. Информационный блок с гиперссылками-наименованиями выделенных подмножеств следует после титульной страницы.

Интервал признака, представляющий 100 % классов, является характеристикой всей предметной области и чаще всего определяет фрагмент вводной части учебно-методического материала.

Несколько процентов определяют повторяющиеся для некоторых классов процедуры, на которые дается несколько гиперссылок. Оставшееся дополнение множества признаков определяет общие (базовые) декларативные сведения, которые используются для выполнения обычных действий по созданию продукции различного типа.

Информационный блок каждого класса включает указатель на декларативный фрагмент и перечень указателей на процедуры создания и обработки продукции. Содержание перечня определяется теми интервалами признаков, которые представляют заданный класс.

В интеллектуальной обучающей системе БЗ обеспечивает функционирование в режимах обучения, тестирования или тренажера. Фреймовая модель содержит сведения о характеристиках исходных компонентов, параметрах оборудования и технологических потоков, показателях качества произведенной продукции и показателях работоспособности изделия после его эксплуатации. Продукционная модель позволяет выбирать рациональную технологическую цепочку и значения параметров в режиме консультанта или тренажера за счет применения набора правил.

Литература

1. Пименов В.И. Применение методов обучения распознаванию образов для проектирования динамической модели знаний о технологических процессах // Системы управления и информационные технологии. 2006. № 2 (24). С. 98–103.

2. Вапник В.Н., Червоненкис А.Я. Теория распознавания образов (статистические проблемы обучения). М.: Наука, 1974.

3. Дюк В.А. Осколки знаний // Экспресс-Электроника. 2002. № 6. С. 60–65.

4. Носов А.Л. Описание объектов распознавания в системах технического зрения роботов. Киров: КПИ, 1986. Деп. в ЦНИИТЭИ приборостроения 01.04.86, № 3202–пр.

5. Пименов В.И. Построение обучающей системы на базе модели онтологии // Качество. Инновации. Образование. 2006. № 4. С. 42–48.

Постоянный адрес статьи: http://swsys.ru/index.php?id=2314&like=1&page=article	Версия для печати Выпуск в формате PDF (4.21Мб)
Статья опубликована в выпуске журнала № 3 за 2009 год.

Возможно, Вас заинтересуют следующие статьи схожих тематик:

Назад, к списку статей

Программные продукты и системы

Авторитетность издания

Добавить в закладки

Следующий номер на сайте

Выпуски

Построение модели знаний о технологиях с помощью дискриминантных алгоритмов