Технология постановки и решения задач в рамках ГИС-INTEGRO

Send article

Journal influence

Higher Attestation Commission (VAK) - К1 quartile

Russian Science Citation Index (RSCI)

Bookmark

Next issue

№1

Publication date:

16 March 2024

Issues

2024

all issues

The article was published in issue no. № 4, 1997
Abstract:
Аннотация:

Authors: () - , () - , () -

Ключевое слово:
Page views: 16803	Print version

Геоинформационная система (ГИС) INTEGRO была разработана в лаборатории Геоинформатики ВНИИГеосистем в 1992 г. для конструирования прикладных природопользовательских ГИС-систем и для решения задач поиска и прогноза по комплексу геолого-геофизической, топографической, геоэкологической и другой информации. Эта система в полном или фрагментарном виде успешно функционирует во многих научно-исследовательских и производственных организациях России и стран СНГ. На ее основе была построена информационно-аналитическая система принятия управленческих решений для одного из министерств, создан набор электронных атласов для ЮНЕСКО, разработана компьютерная технология оценки урбанизированных территорий по геолого-геофизическим данным, исследовано глубинное строение Печенгского рудного района, проведен прогноз золоторудных полей в Приамурье, прогноз опустынивания республики Калмыкия и решено множество других разнородных и разноплановых проблем.

Задачи, возникающие в геологии, являются типичными для слабоформализованных областей знаний, к которым относятся геология, экология, социология, психология, медицина и т.п. Слабоформализованными эти науки называются потому, что связь между явлениями, которые они изучают, пока не может быть полностью осмыслена и переведена на строгий язык, аналогичный языку теоретической физики или неорганической химии. По этой причине здесь нельзя взять исходное состояние системы, решить соответствующую систему уравнений и на основании решения предсказать ее конечное состояние. Но задача предсказания в той или иной постановке тем не менее стоит и в этих науках, будь то утверждение о наличии или отсутствии полезных ископаемых на исследуемой территории или диагноз и прогноз течения болезни пациента клиники. Такая ситуация привела к созданию значительного числа методов и алгоритмов решения поставленной задачи (их создание началось еще в 60-е годы), но результаты отнюдь не всегда удовлетворяли геологов, социологов или медиков, поскольку к этим методам относились так же, как, например, к закону Кулона, в который нужно только подставить исходные данные и вычислить результат. Но, как отмечалось выше, между науками точными и слабоформализованными пролегает пропасть, за прыжок через которую надо платить. Опыт работы в геологии и наблюдения за коллегами, работающими в других слабоформализованных областях, доказали, что такой платой должна быть постановка задачи. При этом оказывается, что львиную долю времени занимают не написание тех или иных алгоритмов решения поставленной задачи и даже не подготовка исходных данных, а бесконечные разговоры со специалистом (геологом, психологом, медиком и др.), проясняющие, что же должно получиться в результате решения задачи, какой информацией располагает специалист, на какие знания об объекте можно рассчитывать и т.п. Таким образом, первым этапом каждой задачи, решаемой в слабоформализованной области знаний, должна быть ее формулировка. Хотя данное утверждение очевидно, однако на практике зачастую оказывается, что за формулировку пытаются выдать неосознанные до конца пожелания, а то и смутный дискомфорт от неприменения модной вычислительной техники. Поэтому необходимо определить, что же именно является формулировкой задачи.

Будем считать, что задача сформулирована, если имеется описание цели, модели объекта исследования, исходных данных, результата и требований к результату.

Цель – предвосхищение в мышлении результата деятельности. Нет смысла говорить о наличии задачи, если четко не сформулирована цель исследования. Содержательный пользователь (медик, эколог, геолог и пр.) обычно может сформулировать цель данного конкретного исследования, если поймет, чего же от него хотят. По собственной инициативе он зачастую формулирует свою "сверхзадачу", например, снижение онкологической заболеваемости. Также неприемлема формулировка научного плана, например, изучение маргинальных слоев общества. Такие общие формулировки обязательно должны быть разбиты на конкретные подцели.

Модель – образ (в том числе условный или мысленный) какого-либо объекта или системы объектов, используемый в определенных условиях в качестве их заместителя. В науке модель какой-либо системы – ее описание на языке некоторой научной теории. Модель является упрощенным образом оригинала, при этом моделирование может происходить даже на уровне самых общих не до конца фиксированных представлений. Описание модели исследований является наиболее сложным звеном в формулировании задачи. Кроме общей сложности этого предмета, связанной с недостаточной научной проработкой, множественностью гипотез и прочим, имеется колоссальный соблазн подменить объект исследований более проработанным. Например, вместо модели месторождения, позволяющей отличать его от пустого участка территории, дать модель образования горных пород. В точных науках обычно фигурирует знаковая модель, то есть описание объекта на языке подходящей математической теории. В слабоформализованных областях знания можно выделить несколько наиболее типичных моделей.

Критериальная модель, то есть модель, задаваемая группой критериев, наличие каждого из которых благоприятствует (реже препятствует) достижению на данном объекте максимума целевой функции. Под целевой функцией здесь, например, можно понимать ожидаемые запасы полезного ископаемого на исследуемой территории или вероятность выздоровления больного. Наличие такой модели знаменует либо достаточную теоретическую проработанность вопроса об объекте исследований, либо большую статистику (как в медицине), позволяющую сделать такие выводы.

Аналоговые модели, в которых постулируется принцип аналогий и представлено достаточное количество объектов, отвечающих различным значениям целевой функции. Здесь особенно важно иметь представителей не только для оптимальных, а для всех значений целевой функции. Например, должны быть известны не только месторождения, но и пустые участки территории. Кроме того, у постановщика должна быть уверенность в том, что эталонные объекты разных образов достаточно полно представляют все множество объектов. Совершенно недопустимо, взяв месторождения гвинейских бокситов и пустые площади Молдавии в качестве эталонов, пытаться определить на этом основании перспективность территорий в республике Коми.

Критериально-аналоговые модели соединяют в себе наличие критериев и использование принципа аналогий. В принципе от критериальной модели всегда можно перейти к критериально-аналоговой, организовав образы по значениям критериев. Однако далеко не всегда подобная операция имеет смысл, поскольку такие искусственно порожденные объекты могут не только не иметь аналогов в действительности, но и быть теоретически запрещенными, так как не любые наборы критериев оказываются совместными.

Исходная информация может быть представлена в самой различной форме: карты, графики, результаты тех или иных анализов, экспертные оценки и т.п. Таким образом, форма представления исходной информации не имеет существенного значения. Однако очень важна связь между данными и модельными представлениями: модель должна быть сформулирована в терминах данных.

Ожидаемый результат обычно является конкретизированной и уточненной переформулировкой цели исследований. Этот пункт программы обычно не вызывает затруднений у исследователя. Единственное, о чем здесь стоит подумать – это форма представления результата (число, график, карта и т.п.). Сложнее обстоит дело с критерием оценки результата. Мы все так привыкли к тому, что критерием оценки истины является практика, что обычно отвечаем, что критерием оценки результата является его подтверждение на практике (вариант – на соседней территории). Однако необходимо учитывать, что, во-первых, никто не позволит проверять на практике результаты наших умозрений, а во-вторых, сам результат непосредственно зависит от критерия оценки. Тут имеется в виду не школьная подгонка под ответ, а принципиально разные подходы к решению задачи, выбор которых зависит от критерия оценки. Так, например, прогнозная территория при поиске месторождений полезных ископаемых будет совершенно разной при следующих двух критериях оценки результата: площадь должна содержать хотя бы одно месторождение и быть минимальной; все месторождения должны быть включены в прогнозную площадь.

Ясно, что отсутствие критерия оценки результата, равно как и его неконструктивность, приводят к волюнтаристскому выбору метода решения задачи и к последующей неинтерпретируемости результата. Таким образом, требования к результату должны вытекать из модельных представлений и быть верифицируемыми, то есть каждый конкретный результат может быть проверен на соответствие требованиям.

За этапом формулировки задачи, производимым без участия вычислительной техники, следует этап формализации, который состоит в переводе на формальный язык элементов ее формулировки. Данный этап выполняется в тандеме формальным постановщиком задачи (математиком) и ее содержательным постановщиком (геологом, медиком, социологом и т.д.) и может использовать вычислительную технику и элементы программного обеспечения. На этом этапе большую роль играет специфика предметной области, поэтому далее мы будем говорить только о задачах природопользования, на решение которых нацелена ГИС-INTEGRO, хотя в других слабоформализованных областях можно провести аналогичные рассуждения и построить соответствующие системы.

В процессе формализации может уточняться и содержательная формулировка задачи. Необходимо иметь в виду, что вся задача формализуется в комплексе, поэтому порядок, в котором изложена формализация элементов формулировки, весьма условен. Однако первым ее пунктом безусловно должен быть выбор объекта привязки информации. Объект привязки информации обязан соответствовать по своим параметрам объекту исследования, отвечать цели исследования, а в случае аналоговой или критериально-аналоговой модели именно к нему должна относиться информация о значениях целевой функции. Отличительной чертой природопользовательских задач является многообразие типов используемых данных. При этом информация может приходить в виде растровых данных дистанционного зондирования, векторной картографической информации, числовых геофизических полей, снятых по равномерной сети или по профилям, текстовой информации об имеющихся месторождениях и т.д. Поэтому выбор объекта привязки должен быть прослежен по всем слоям информации, а система должна работать с различными видами информации, преобразовывая их друг в друга по мере надобности.

Задачи, которые конкретный пользователь ставит перед системой, могут быть ñîвершенно различны, от удовлетворения простых информационно-поисковых потребностей до принятия сложных прогнозных или аналитических решений и проведения мониторинга. Однако опыт показывает, что любая цель исследования в природопользовательских задачах, не сводящаяся к чисто информационным, может быть формализована как цепочка задач из следующего набора:

· выделение во всей совокупности объектов групп объектов, близких между собой в том или ином смысле;

· разделение всей совокупности объектов на группы по степени их похожести на эталонные объекты (т.е. объекты, на которых задано значение целевой функции);

· упорядочение (ранжирование) всех или наиболее интересных объектов с целью определения очередности их дальнейшего изучения (оценки);

· описание объекта набором новых интегральных характеристик, при этом может измениться и сам первоначальный объект привязки информации, например, вместо отдельного человека объектом социологического исследования может стать семья;

· выбор информативного набора характеристик возникает обычно при избыточном и, следовательно, необозримом первоначальном наборе.

Очень возможно, что какая-то из формальных задач этого списка соответствует цели сама по себе. Более того, видимо, имеется возможность переходить от содержательной формулировки цели к соответствующей формальной задаче с помощью компьютерных методов лингвистического анализа текста (формулировки). Однако всегда целесообразно разбить процесс решения на этапы, а это в свою очередь приводит к распадению реализации цели на цепочку формальных задач. Если же попытаться решить только последнюю задачу из этой цепочки, согласующуюся формально с выбранной целью, то результат обычно будет удручающим из-за невозможности вместить богатство модельных представлений в сухие условия одной формальной задачи.

Еще более заметна роль модельных представлений при формализации исходных данных. Особенно рельефно она проявляется, если исходная информация представлена в виде карт, как это принято в геологии. При этом даже представление самой карты в машинном виде неоднозначно и зависит от модельных представлений. Проиллюстрируем это на следующем примере. Легко понять, что цифровая (компьютерная) модель карты может содержать точечные, линейные и площадные факторы. Однако для одних задач река, например, может быть площадным фактором, а для других – линейным; аналогично город также оказывается площадным или точечным в зависимости от решаемой задачи и т.д. Но возникающая здесь неопределенность не идет ни в какое сравнение с неопределенностью, возникающей при расчете характеристик объекта привязки информации, являющемся стандартным методом формализации векторной информации. Тут могут быть рассчитаны длины, площади, расстояния, углы и многое другое. Пытаться рассчитать все возможные характеристики совершенно нереалистично. В свою очередь отсутствие необходимых характеристик негативно скажется на результате решения задачи. Необходимо иметь в виду, что обратная операция, то есть построение исходной карты по набору характеристик, невозможна принципиально вне зависимости от количества и номенклатуры этих характеристик. Отсюда следует, что, как правило, одну характеристику невозможно рассчитать через другие. Поэтому построение набора характеристик является весьма ответственной задачей, и, выбирая каждую, содержательный специалист должен себе четко представлять, что именно он ждет от каждой характеристики для решения задачи и каким образом это согласуется с его модельными представлениями. Казалось бы, что все это не относится к информации, изначально имеющей числовую форму, однако это не так. Дело в том, что замеренная или каким-либо иным способом полученная характеристика может не иметь прямого касательства к решаемой задаче и даже не относиться к объекту привязки. Поэтому всегда необходимо осмысливать, каким образом каждое свойство соотносится с модельными представлениями, и на основании этого определять способы вычисления характеристик, предназначенных для решения задачи, на основе исходной информации.

Многообразие используемой информации, ее пространственного представления, объема и способов хранения, а главное, серьезное отличие атрибутивной информации не позволяет объединить в одном сервере данных (например реляционной СУБД) хранение и управление всей информацией. Поэтому возникает потребность в некоторой промежуточной компоненте, управляющей разного рода пространственнопривязанной информацией. Эта компонента (являющаяся по сути прикладным программным интерфейсом) была условно названа машиной картографических данных (МКД).

Наличие этой компоненты позволяет абстрагироваться от конкретного формата данных, тем самым облегчая задачу как презентационных (вьюеров), так и решающих (аналитических, прогнозно-поисковых и др.) приложений, работающих с пространственными данными.

Кроме того, МКД может предоставлять некоторые дополнительные возможности по связыванию атрибутивной и пространственной информации и по организации данных в некоторые сцены для их визуализации.

Информационно-справочный блок предназначен для совместной работы с картографическими и фактографическими базами данных, осуществляет связь между ними, позволяет пользователю работать с интересующими его объектами как с картографическими факторами, так и с элементами базы данных. Кроме того, информационно-справочный блок обеспечивает подключение внешних расчетных задач для выполнения специализированных функций. В нем предусмотрено также и использование изображений. Центральной частью информационно-справочного блока является генератор проектов.

Генератор проектов позволяет создавать конкретные информационно-справочные системы на основании уже введенных и отредактированных карт, поскольку один проект может строиться на целом наборе картографических и фактографических баз данных. Поэтому необходимо организовывать иерархию баз картографических данных и тем самым эффективно использовать разномасштабную картографическую информацию. Иерархичность организации, с другой стороны, обеспечивает высокую скорость доступа к информации и оптимизацию использования ресурсов. С помощью генератора проектов можно построить необходимое пользователю множество сцен на одной карте, набирая для различных сцен разные картографические слои и организуя иерархию картографических объектов, адекватную фактографическим базам данных и представлениям пользователя о важности и соподчиненности содержащейся в них информации. Это помогает оперативно организовывать подклассы картографических объектов, чем повышает наглядность отображаемой информации и комфортность работы с системой. Той же цели служит условная визуализация слоев и объектов, сущность которой состоит в том, что некоторая информация первоначально не выдается на экран, чтобы не загромождать его, однако при входе в достаточно крупную лупу (ее величина задается пользователем) она становится видимой. Тот же модуль позволяет интегрировать любые пользовательские программы. Тем самым информационно-справочный блок превращается в ГИС функционирования пользовательских программ. При этом программа может запускаться от объекта или класса объектов, использовать связанную с этим объектом или классом информацию, а результаты работы через машину данных могут попасть обратно в картографическую или фактографическую базу данных. Генератор проекта работает в интерактивном режиме и доступен пользователю, не специализирующемуся в программировании. Сгенерированный с его помощью проект представляет собой готовую информационно-справочную систему и может без дальнейших настроек выполнять необходимые презентационные функции.

Для решения более сложных задач, таких как прогноз месторождений полезных ископаемых, экологическое районирование или обнаружение геологических тел по слабым геофизическим аномалиям, предусмотрен расчетно-аналитический блок. Он представляет собой набор многообразных алгоритмов обработки результатов дистанционного зондирования, геолого-геофизических, геоэкологических, геохимических и других данных, объединенных в программный комплекс средствами интеллектуального интерфейса, в основу которого положена база формальных знаний о способах постановки и решения задач. База знаний включает в себя приведенную выше классификацию основных формальных задач, представления об этапах и функциях анализа данных, их сведении в единый граф обработки, а также правила модификации формулировок задач, коррекции данных и движения по графу обработки. Это позволяет, во-первых, организовать доступ к необходимым пользователю функциям на каждом из этапов обработки данных и, во-вторых, обеспечить анализ текущего состояния задачи с выработкой рекомендаций по коррекции данных, уточнению постановок задач, выбору методов решения и т.д.

Формализация требований к результату обычно приводит к расчету тех или иных характеристик. При этом иногда такие свойства характеризуют не сами объекты привязки информации, а таксономически более крупные объекты.

Далее необходимо решить поставленную на этапе формализации формальную задачу на основе формализованных данных. Для помощи при формализации и для решения должна функционировать система, способная комплексно обрабатывать разнородную информацию и справляющаяся с различными задачами. Чтобы достигнуть этого система должна состоять из небольшого ядра, позволяющего всем остальным модулям, а также пользователю видеть разнородную информацию из неограниченно расширяемого набора внешних модулей, реализующих ту или иную функцию. Это даст возможность оперативно конструировать для каждого конкретного заказчика необходимый ему компактный вариант системы. Таким образом, можно сформулировать несколько общих принципов построения системы.

1. В качестве входной информации могут использоваться растровые и векторные изображения карт, материалы дистанционного зондирования Земли, результаты геофизических геоэкологических и других съемок и фактографические данные разнообразных типов, привязанные к пространственным объектам.

2. Должна обеспечиваться совместная обработка различных исходных материалов как по представлению пространственных данных, так и по атрибутивным данным вне зависимости от применяемой технологии ввода. Система должна быть совместима по форматам данных с ведущими системами САПР и ГИС.

3. Программные средства должны эффективно интегрировать пространственные и фактографические данные в одной геоинформационной оболочке, обеспечивая прямые и обратные связи между системами управления пространственными и непространственными данными.

4. Должна поддерживаться возможность совмещения и интеграции данных, полученных различными способами, их преобразование в распространенные картографические проекции как отечественные, так и международные при условии открытости системы и легкости пополнения новыми проекциями.

5. Должен существовать интерфейс между цифровыми моделями карт и базами фактографических (цифровых) данных, позволяющий рассчитывать по картам широкий спектр прогнозно-поисковых и аналитических характеристик, необходимых для решения прикладных задач природопользования.

6. Способы решения содержательных задач, предлагаемые системой, должны быть встроены в ГИС-оболочку, а результаты решения должны интегрироваться с исходными данными и использоваться наравне с ними в дальнейшей работе.

7. Процесс решения содержательных задач должен базироваться на интерактивной технологии, сочетающей экспертные знания, заложенные в систему, со знаниями и представлениями о задаче конкретного пользователя.

8. Прикладная часть системы должна быть функционально полной, обеспечивающей адекватное решение поставленных пользователем задач, но не должна содержать множества однотипных функций и не перекладывать на плечи пользователя выбор одной из них.

9. Должна реализовываться возможность легкой наращиваемости системы новыми пользовательскими функциями по обработке пространственной и фактографической информации.

Вышеизложенные принципы положены в основу системы INTEGRO, включающей в себя ГИС-конструктор, позволяющий создавать сколь угодно сложные иерархические проекты и интегрировать любые расчетные модули, в том числе и реализующие стандартные ГИС-функции, блок преобразования информации из одной формы в другую (из растровой в векторную, из векторной в сеточную и т.п.) и блок интегрированного анализа разнородных данных, позволяющий рекомендовать пользователю оптимальный для его задачи способ решения. Такая идеология построения системы сказывается на ее архитектуре, структуре и организации пользовательского интерфейса. Тем самым создается качественно новый продукт, являющийся геоинформационной системой, но в то же самое время имеющий черты экспертной системы.

Структурно предпочтительна трехчастная схема построения системы: СУБД (сервер данных), прикладные модули (блок редактирования данных, информационно-справочный и расчетно-аналитический блоки) и модуль представления информации (âüþep). Это позволяет четко разделить функции эффективного хранения и обеспечения целостности данных, преобразования и выполнения запросов и расчетов над данными, а также интерактивного интерфейса с пользователем.

Основным типом данных, используемым в этом блоке, является сеточный. Поэтому существует специальный модуль, обеспечивающий адекватный для конкретной задачи переход от векторного представления к сеточному.

Поскольку границы между перечисленными выше формальными задачами размыты, система не рассматривает первоначальный выбор формальной постановки как догму и может изменить его на какой-либо другой, если для решения поставленной задачи не хватает данных или они недостаточного качества. Пользователь так же может определить некоторые дополнительные параметры, которые окажут впоследствии влияние на решение задачи.

Уточнение данных и выбор конкретной постановки задачи проводится в блоке анализа данных. Здесь производится одномерный и многомерный анализ данных, их трансформация в соответствии с решаемой задачей. Блок представляет собой реализацию комплекса широко известных статистических методов, выстроенных в такой последовательности, чтобы пользователю было легче увидеть свои данные и определить, что нужно исключить, что изменить и т.д. Весь блок основан на системе вьюеров, которые визуализируют таблицу объекты-свойства (ТОС) или любое из свойств на площади. Это позволяет быстро находить нужные места в ТОС и при необходимости оперативно изменять их. Но корректировка информации не исчерпывает задачи блока. На основании вырабатываемых в нем рекомендаций могут измениться список обрабатываемых свойств, масштаб и шкала их измерения и т.д.

Блок решения задач обычно завершает работу над задачей. Алгоритмическим обеспечением этого блока является широкий спектр традиционных и оригинальных алгоритмов таксономии, упорядочения и распознавания образов. Выбор алгоритма решения задачи определяется постановкой задачи, результатами анализа данных, а также расположением исходных данных в признаковом пространстве. Однако система только предлагает человеку свой выбор, а решать, какой именно метод применять и в какой постановке решать задачу при желании может пользователь.

Все результаты, получаемые при решении задачи, могут быть внесены через машину данных как отдельные слои или сетки в информационную базу и использованы для дальнейших исследований. Тем самым обеспечивается переход к этапу интерпретации результатов решения задачи, который приводит в случае необходимости к уточнению формулировки или формализации задачи, а также к переходу к решению следующей подзадачи, формализующей нашу цель, или к постановке и решению следующей задачи.

Список литературы

1. Добрынин В.Н., Черемисина Е.Н. Математические методы и средства вычислительной техники в геологоразведке. - М., Недра, 1988.

2. Митракова О.В., Финкельштейн М.Я., Черемиси- на Е.Н. и др. Технология использования АС "АЛИСА" для решения геолого-прогнозных задач. - М., ВИЭМС, 1988.

3. Черемисина Е.Н., Марченко В.В. Информационная технология интегрированного анализа пространственных геоданных для экологии и природопользования // Геоинформатика - № 1. - 1993.

4. Черемисина Е.Н., Финкельштейн М.Я., Митрако- ва О.В. и др. ГИС-технологии в изучении недр. - М. - 1996.

Permanent link: http://swsys.ru/index.php?id=1051&lang=en&page=article	Print version
The article was published in issue no. № 4, 1997

Perhaps, you might be interested in the following articles of similar topics:

Back to the list of articles

Software & Systems

Journal influence

Bookmark

Next issue

Issues