На правах рекламы:
ISSN 0236-235X (P)
ISSN 2311-2735 (E)

Авторитетность издания

ВАК - К1
RSCI, ядро РИНЦ

Добавить в закладки

Следующий номер на сайте

4
Ожидается:
09 Декабря 2024

Мягкие знания и нечеткая системология гуманитарных областей

Статья опубликована в выпуске журнала № 3 за 2008 год.
Аннотация:
Abstract:
Авторы: Фомина И.К. (fominga@list.ru) - Государственный университет морского и речного флота им. адмирала С.О. Макарова (доцент), Санкт-Петербург, Россия, кандидат технических наук, Дюк В.А. () - , Флегонтов А.В. (flegontoff@yandex.ru) - Российский государственный педагогический университет им. А.И. Герцена (профессор), Санкт-Петербург, Россия, доктор технических наук
Ключевые слова: гуманитарные области, нечеткая системология, мягкие знания, трудноформализуемые области
Keywords: , , ,
Количество просмотров: 14092
Версия для печати
Выпуск в формате PDF (2.59Мб)

Размер шрифта:       Шрифт:

Принято говорить о том, что гуманитарные области относятся к областям с преобладанием мягких знаний, которые допускают множественные размытые решения. По-видимому, назрела необходимость в конструктивном анализе взглядов различных профессионалов, которые по-разному выделяют и формулируют особенности таких предметных областей. Сделаем попытку обобщить, систематизировать и конкретизировать представления о специфике указанных областей, сложившиеся у специалистов по искусственному интеллекту, по моделированию технологических процессов, по нелинейной динамике сложных систем и прикладной статистике.

 

Представления специалистов по искусственному интеллекту

Специалисты по искусственному интеллекту часто называют такие области трудноформализуемыми [1] и выделяют следующие особенности:

-     задача не может быть определена только в числовой форме (требуется символьное представление);

-     алгоритмическое решение задачи неизвестно (хотя, возможно, и существует) или нельзя использовать из-за ограниченных ресурсов (памяти компьютера, быстродействия);

-     цели задачи не могут быть выражены в терминах точно определенной целевой функции или не существует точной математической модели задачи.

Другие исследователи описывают более широкий круг так называемых НЕ-факторов, характерных для знаний о реальном мире, но плохо представленных в формальных системах. Сюда относят неполноту, неточность, недоопределенность, некорректность и др. Нариньяни считает, что введение термина НЕ-факторы означает попытку осознать как целое ту область исследований, которая охватывает новые срезы системы знаний:

·     совокупность форм знания, плохо поддающихся формализации традиционными методами (этих форм гораздо больше, чем хорошо формализуемых);

·     различные дефекты знания и возможные формы незнания, являющиеся неотъемлемой и основной частью любого знания.

НЕ-факторы, отмечает С.А. Нариньяни, – отнюдь не периферия науки о знаниях. «…Ввиду своей универсальности они пронизывают саму ткань структуры знаний, играя ключевую роль не только в искусственном интеллекте, но и в таких, казалось бы, далеких от него областях, как вычислительная математика».

Недоопределенность была основательно исследована, что привело к созданию технологии обработки знаний, ассоциируемой с ключевым понятием constraint [2]. Недоопределенное значение является приблизительной, но корректной оценкой некоторой реальной величины, более точной по своей природе, чем позволяет нам установить текущая информация.

Неточность является универсальным фактором, свойственным всем реальным параметрам. Для количественных атрибутов выделяют следующие пять базовых типов неточности: объективная, ситуационная, семантическая, методическая и неточность генерализации.

Объективная неточность связана с самим устройством нашего мира; сюда относятся: квантовая неточность, определяемая соотношением неопределенности Гейзенберга; тепловая – движение атомов и молекул в жидкости и газе, их колебание в твердом теле; релятивистская, связанная с относительностью системы координат.

Ситуационная неточность определяется уровнем точности текущего использования значения того или иного параметра.

Семантическая неточность встроена в само понятие, связанное с данным параметром; имеет место для любых реальных понятий.

Методическая неточность определяется неточностью измерения, связанной с рядом факторов:

·     физической природой приборов/инструментов, изготовленных с конечной точностью, встроенным в определение параметра сопоставлением с эталоном (неточность эталона);

·     отсутствием идеальной процедуры замера значения: почти все такие процедуры опираются на понятия равно, больше и т.п., программирующие неточное сравнение неточных величин;

·     невозможностью замера в идеальной точке по времени и пространству (наличие обобщения или усреднения).

Неточность генерализации имеет своим источником обобщение значения какого-либо параметра у объектов некоторого класса или выборки.

Представления специалистов по моделированию технологических процессов

Ряд авторов, анализируя различные виды неопределенности, делают акцент на технологических аспектах производственных процессов [3] и выделяют следующие виды неопределенности.

1. Неточность в задании переменных величин в моделях, начальных и граничных условий. Низкая точность оперативной информации, получаемой с объектов управления, возникающая ввиду большой погрешности датчиков замера технологических параметров (расхода, давления и т.д.), их невысокой надежности, отказов каналов связи, большого запаздывания при передаче информации по уровням управления, отсутствия возможности замеров параметров во всех точках технологического процесса, необходимых для моделей.

2. Неточность моделей объектов контроля и управления, вызванная неэквивалентностью решений системных многоуровневых иерархических моделей и используемых на практике отдельных локальных задач. Она может возникать из-за неверно проведенной декомпозиции общей задачи управления, излишней идеализации модели сложного процесса, разрыва существенных связей в технологическом комплексе, линеаризации, дискретизации, замены фактических характеристик оборудования паспортными, нарушения допущений, принятых при выводе уравнений (стационарности, изотермичности, однородности и т.д.).

3. Нечеткость в процессе принятия решений в многоуровневых иерархических системах, обусловленная тем, что наличие четких (точных) целей и координирующих решений на каждом уровне контроля и управления и для каждого локального устройства регулирования затрудняет процесс координации и предопределяет длительный итеративный характер согласования решений.

4. Человеческий фактор. Наличие человека (диспетчера) в контуре управления и ведение процесса координации в реальной системе на естественном языке приводит к необходимости учета трудностей представления его знаний в виде алгоритмов и согласованности полученного ЭВМ решения с его оценкой [4]:

·     ненадежность исходной информации, получаемой от диспетчера в режиме принятия решения, неточность оценок, недоопределенность понятий и терминов, неуверенность диспетчеров в своих заключениях;

·     нечеткость (неоднозначность) естественного языка (лингвистическая неопределенность) и языка представления правил в системах экспертного типа;

·     процедура принятия решения базируется на неполной информации, то есть нечетких посылках;

·     неопределенность проявляется при агрегации правил и моделей, исходящих от разных источников знаний или от диспетчеров различных уровней управления (эти правила и модели могут быть противоречивыми, избыточными и т.п.).

Представления специалистов по нелинейной динамике сложных систем

Специалисты в области синергетики считают, что в прикладной математике и математической физике происходит революция. Одно из наиболее глубоких следствий этого состоит в том, что наука эта стала намного ближе к изучению природы, особенно живой. Она вступила в новый мир нелинейных явлений, где постоянно возникают неожиданные связи между структурами и хаосом, между поведением в динамике, в саморазвитии систем и их статистическими, изначальными свойствами, между давно привычными понятиями и теми, что родились буквально вчера. Парадоксы этого мира, по утверждению С.П. Курдюмова, открывают дорогу к значительно более полному и глубокому постижению природы. К специалистам приходит понимание, что ответы на бесчисленные вопросы о возможном поведении по-настоящему сложных систем следует искать на пересечении свойств этих систем и окружающей их среды. Постепенно становится все более ясно, что системы, оказавшиеся теперь в фокусе интересов, имеют свои стремления, демонстрируют свои предпочтения при выборе из множества возможностей дальнейшего развития. Особенно ярко роль этих внутренних тенденций проявляется в мире живого, ибо подобного рода самоорганизация – один из важнейших принципов его устройства. Она связывается с представлениями о самоподдержании, регенерации, самодостраивании и т.д.

Вместе с тем междисциплинарный подход, называемый синергетикой, или, шире, нелинейной наукой, столкнулся с принципиальными трудностями [8]. Возникло противоречие между красивыми и ясными общими представлениями и трудностью их приложения к каким-либо конкретным системам. За простоту и общность идей синергетике сейчас приходится платить высокую цену. «От «теории всего», каковой некоторые гуманитарии представляют себе синергетику, не приходится ждать конкретных результатов и методов». В соответствии с этим подходом достаточно сложные объекты не укладываются в схему дуальных категорий (горячо–холодно, плохо–хорошо), а требуют привлечения триад (например, рацио–эмоцио–интуицио, простота–точность–область приложимости и т.п.). При этом одна категория выступает в качестве своеобразного оппонента двух других. Например, чем больше простота и шире область приложений, тем меньше точность и конкретность.

Выход из сложившейся ситуации при моделировании сложных явлений специалисты видят, в частности, в концепции «русел и джокеров» [5]. Поскольку строить хорошие предсказывающие компьютерные системы во всем многомерном фазовом пространстве «на общих синергетических основаниях» не удается, предлагается выделять области, где многомерное пространство можно заменить маломерным, а сложное простым (их называют руслами), и области, где следует ждать неожиданностей и полагаться на случай (их называют джокерами).

Исследование джокеров и русел было начато сравнительно недавно и уже приносит свои плоды. Например, выяснилось, что наличие простейшего детерминированного джокера на логистическом отображении приводит к замечательным качественным эффектам [6]. Динамические системы с джокерами оказались полезными при математическом моделировании ряда исторических процессов [7,8]. Концепция русел приводит к новым методам обработки временных рядов и отчасти проясняет успех нейронных сетей в решении некоторых задач прогноза. Г.Г. Малинецкий считает, что, возможно, русла и джокеры окажутся полезными кирпичиками при создании новой парадигмы: «…новая парадигма будет опираться на сочетание динамики и статистики. Математические модели, основанные на таком сочетании, предлагаемом теорией самоорганизованной критичности, позволили по-новому взглянуть на множество нелинейных процессов от биржевых крахов и схода снежных лавин до землетрясений и утечки конфиденциальной информации» [9].

В то же время синергетика испытывает принципиальные затруднения при моделировании структурной неоднородности и разных «межуровневых» явлений, характерных для предметных областей со сложной системной организацией. Популярный сегодня образ нелинейной динамики – фрактальные структуры, у которых с изменением масштаба описание строится по одному и тому же правилу (возможно, с небольшими вариациями). Однако реальность устроена иначе. Так, в физике при переходе с уровня на уровень (от атомных процессов к ядерным, от ядерных к элементарным частицам) меняются закономерности, модели, способы описания. То же происходит в биологии и медицине (уровень популяции, организма, ткани, клетки и т.д.).

Отмеченные затруднения привели к тому, что синергетики сегодня в определенной мере ждут своеобразного технического задания от исследователей, которые смотрят на нелинейную науку со стороны.

Представления специалистов по прикладной статистике

«Будущее анализа данных может привести к большому прогрессу, к преодолению реальных трудностей, к оказанию большой помощи всем областям науки и техники. Будет ли это так? Это зависит от нас, от нашего желания встать на каменистый путь реальных проблем вместо гладкой дороги нереальных предпосылок, произвольных критериев и абстрактных результатов, не имеющих реалистической направленности…» – эти слова, сказанные Дж. Тьюки еще в 1962 году, остаются актуальными и в наши дни.

По классификации статистических методов [10], в прикладной статистике выделяют четыре области: статистика (числовых) случайных величин; многомерный статистический анализ; статистика временных рядов и случайных процессов; статистика объектов нечисловой природы.

Исходный объект в математической статистике – это выборка. В вероятностной теории статистики выборка – это совокупность независимых одинаково распределенных случайных элементов. В классической математической статистике элементы выборки – числа. В многомерном статистическом анализе – векторы. В нечисловой статистике элементы выборки – это объекты нечисловой природы, которые нельзя складывать и умножать на числа. Другими словами, объекты нечисловой природы лежат в пространствах, не имеющих векторной структуры.

Современные специалисты в области прикладной статистики концентрируют свое внимание на исследовании объектов нечисловой природы. В частности, А.И. Орлов приводит следующие примеры:

·     значения качественных признаков, то есть результаты кодировки объектов с помощью заданного перечня категорий (градаций);

·     упорядочение (ранжировка) экспертами образцов продукции (при оценке ее технического уровня и конкурентоспособности) или заявок на выполнение научных работ (при проведении конкурсов на выделение грантов);

·     классификация, то есть разбиение объектов, сходных между собой, на группы (кластеры);

·     толерантность, то есть бинарные отношения, описывающие сходство объектов между собой, например, сходство тематики научных работ, оцениваемое экспертами с целью рационального формирования экспертных советов внутри определенной области науки;

·     результаты парных сравнений или контроля качества по альтернативному признаку (годен – брак), то есть последовательности из 0 и 1;

·     множества (обычные или нечеткие), например, зоны, пораженные коррозией, или перечни возможных причин аварии, составленные экспертами независимо друг от друга;

·     слова, предложения, тексты;

·     векторы, координаты которых – совокупность значений разнотипных признаков, например, результат составления статистического отчета о научно-технической деятельности или заполненная компьютеризированная история болезни, в которой часть признаков носит качественный характер, а часть – количественный;

·     ответы на вопросы экспертной, психологической или социологической анкеты, часть из которых носит количественный характер (возможно, интервальный), часть сводится к выбору одной из нескольких подсказок, а часть представляет собой тексты и т.д.

·     интервальные данные (см. выше) тоже можно рассматривать как пример объектов нечисловой природы, а именно как частный случай нечетких множеств.

Вместе с тем акцент в прикладном статистическом анализе только на объектах нечисловой природы является далеко не полным. Когда мы имеем дело с предметными областями со сложной системной организацией (например, в медицине, психологии, социологии), перед исследователем в первую очередь встает вопрос о том, какие признаки (атрибуты, показатели, переменные) следует включить в план статистического эксперимента. Доступных для измерения (фиксации) признаков может быть довольно много. Нередко в современных исследованиях их количество измеряется десятками, сотнями и даже тысячами, и заранее невозможно предугадать их потенциальную полезность. Таким образом, здесь мы имеем дело с еще одним мощным НЕ-фактором – высокой размерностью и неопределенностью исходного описания объектов.

Более того, часто при подготовке экспериментальных данных исследователь испытывает серьезные затруднения в формулировке целевых критериев статистического анализа (здесь мы не касаемся достаточно тривиальных постановок задач дескриптивной статистики). Например, известно много фактов значительного расхождения диагностических оценок различных специалистов в медицине и психологии, даже принадлежащих одной научной школе. Этот НЕ-фактор, по-видимому, целесообразно определить как нечеткость внешних критериев.

Также имеет смысл выделить в самостоятельный НЕ-фактор наличие в описаниях сложных объектов большого количества шумящих, не имеющих ценности переменных, способных затушевывать полезные закономерности в структурах экспериментальных данных. С другой стороны, имея в виду технологическую сторону многомерных математических статистических процедур, негативную роль может играть присутствие в описаниях объектов исследования большого числа дублирующих переменных.

Кроме отмеченной ранее разнотипности признаков, с которыми приходится иметь дело при описании объектов со сложной системной организацией, принципиальной особенностью является неоднородность классов объектов, которые формируются на основании тех или иных внешних критериев. Указанные объекты часто относятся к так называемым эквифинальным системам, для которых одинаковые внешние проявления обусловлены различными внутренними механизмами. Этот НЕ-фактор обозначим как неоднородность классов.

Получению данных, связанных с трудоемкими и растянутыми во времени экспериментами, часто сопутствуют осложнения в виде большого количества пропущенных значений (пропусков). Примеры подобных экспериментов особенно часто встречаются в медицинских исследованиях, которые, бывает, занимают месяцы и даже годы. Естественно, что за столь длительный период возникает целый ряд объективных и субъективных причин возникновения описываемой ситуации (человеческий фактор, отказ приборов и др.). Кроме того, продолжительность во времени процесса получения исходной информации может приводить к другой, не менее негативной ситуации – появлению резко отклоняющихся значений (выбросов) у того или иного измеряемого показателя (практически независимо от его природы).

Еще один НЕ-фактор удобно проиллюстрировать на примере современных молекулярно-генетических исследований. Здесь мы затронем пока только один аспект, характерный для задач функциональной геномики (или протеомики). Новейшие биологические микрочипы позволяют одновременно оценивать в биопробе экспрессию десятков тысяч генов. В то же время число объектов в эксперименте редко достигает порядка нескольких сотен. Это обусловлено главным образом дороговизной молекулярных чипов. Таким образом, число столбцов в выборках данных (число анализируемых переменных) способно в десятки и более раз превышать количество строк. Возникает необычная ситуация для традиционного многомерного анализа. С одной стороны, данных много, но, несмотря на это, указанную ситуацию следует интерпретировать как малую выборку.

Относительно самостоятельный раздел прикладной статистики посвящен анализу последовательностей чисел и символов. Здесь специалисты отмечают, что несколько основных моделей, используемых при таком анализе, оказались плохо совместимыми друг с другом по базовым посылкам. Например, для числовых рядов Фурье-анализ требует отсутствия непериодических составляющих, методы Бокса чувствительны к виду одномерных распределений и т.д. Алгоритмы поиска закономерностей в последовательностях символов основываются на переборах, которые можно реализовать в очень ограниченных вариантах, либо опираются на сильные эвристические допущения.

Вместе с тем существенные свойства процессов, происходящих в системах со сложной внутренней организацией, нередко выражаются в виде паттернов с изменяющимся периодом. Более того, такие паттерны могут представлять собой не непрерывную четкую последовательность чисел или символов, а иметь внутренние области-джокеры. Вид паттернов с джокерами и интервалы между ними в начале реального исследования неизвестны – это очередной НЕ-фактор.

Другой НЕ-фактор, относящийся к области распознавания последовательностей символов в ряде актуальных задач (например, распознавание генов в последовательности ДНК, поиск регуляторных сигналов, предсказание функций белков) с помощью статистических методов, связан с проблемой представления исходных данных в виде таблицы объект–признак. Частично эту проблему в настоящее время пытаются решать посредством специальных алгоритмов так называемого выравнивания последовательностей. Однако эти алгоритмы, являясь эвристическими, принципиально не способны учитывать то, что внутри образцов последовательностей могут быть вставки (причем неизвестной природы) в самых разных местах и всевозможных размеров. Назовем отмеченный НЕ-фактор «проблемы представления информации в виде таблиц объект–признак».

В гуманитарных областях, как в фокусе, сконцентрированы перечисленные выше НЕ-факторы. Их обобщение с точки зрения целевых, дескриптивных и структурных особенностей позволяет выделить следующие основные характеристики:

·     нечеткость целевых показателей и критериев;

·     неопределенность, неточность, разнотипность и неизвестная размерность описаний;

·     полиморфность эквифинальных состояний исследуемых систем;

·     наличие русел и джокеров разного, заранее неизвестного формата с неизвестной локализацией.

Описание приведенных характеристик дает основание определить гуманитарные области как предметные области с нечеткой системологией. Очевидно, поиск, описание и структурирование закономерностей в этой области требуют разработки особой методологии.

Список литературы

1. Нечеткие множества в моделях управления и искусственного интеллекта. / Под ред. Д.А. Поспелова. – М.: Наука, 1986.

2. Колобашкина М.В., Рыбина Г.В., Сергиевская О.Г. и др. Задачно-ориентированная методология приобретения знаний для компьютерного построения интегрированных экспертных систем. // КИИ-96. Пятая национ. конф. с междунар. участ.: Искусственный интеллект-96. Сб. науч. тр.: В 3 т. – М.: АИИ, 1996.

3. Алтунин А.Е., Семухин М.В. Модели и алгоритмы при-нятия решений в нечетких условиях: Монография. – Тюмень: Изд-во Тюменского гос. ун-та, 2000. – 352 с.

4. Mamdani E.H., Efstathion H.J. Higher-order logics for handling uncertainty in expert systems. «Int. J. Man-Mach. Stud.», 1985, № 3, p. 243–259.

5. Андрианов И.В., Маневич Л.И. Асимптология: идеи, методы, результаты. – М.: Аслан, 1994.

6. Bellachhok L, Malinetskii G. Tricks of Jokers on one-dimensional maps. Proc. 5 Int. Specialist Workshop Nonlinear Dynamics of Electronic Systems, Moscow, 1997, p. 40–45.

7. Малинецкий Г.Г. «Историческая механика» и нелинейная динамика. / Изв. вузов: Сер. Прикладная нелинейная динамика, 1997. – Т. 5. – № 4. – С. 76–88.

8. Малинецкий Г.Г. Нелинейная динамика и историческая механика. Общественные науки и современность. – 1997. – № 2. – С. 99–111.

9. Bak P., Tang C., Weisenfeld K. Self-organized criticality. Phys. Rev. A, 1988, v. 38, № 1, 364–374.

10. Орлов А.И. // Заводская лаборатория. – 1990. – Т. 56. – № 3. – С. 76–83; 1995. – Т. 61. – № 3. – С. 43–52.


Постоянный адрес статьи:
http://swsys.ru/index.php?id=1598&like=1&page=article
Версия для печати
Выпуск в формате PDF (2.59Мб)
Статья опубликована в выпуске журнала № 3 за 2008 год.
Статья находится в категориях: Многоагентные системы

Возможно, Вас заинтересуют следующие статьи схожих тематик: