Авторитетность издания
Добавить в закладки
Следующий номер на сайте
Синтез онтологий для систем поддержки принятия решений на базе больших языковых моделей
Аннотация:Предметом исследования является автоматизированное формирование онтологий для систем управления и поддержки принятия решений с использованием технологий больших языковых моделей. В условиях экспоненциального роста объемов данных и усложнения информационных систем традиционные методы разработки онтологий становятся менее эффективными из-за их трудоемкости и значительных временных затрат. В работе предложена методика, позволяющая автоматизировать процессы извлечения, анализа и структурирования знаний о предметной области. Это особенно актуально для задач с большим объемом разноструктурированной информации. Особое внимание уделено интеграции языковых моделей с онтологическими структурами для формирования концептов, их атрибутов и взаимосвязей на основе текстовых данных. Методологическая основа исследования включает алгоритмы обработки естественного языка, архитектуры трансформеров и метаассоциативные графы, что позволяет не только извлекать знания из текстов, но и формализовать их в удобной для последующей обработки форме. Применение трансформеров обеспечивает высокую точность анализа текстов и выявления ключевых понятий, а метаассоциативные графы позволяют визуализировать и эффективно интегрировать разнородные данные. Важной особенностью предложенного подхода является способность динамически обновлять онтологии по мере поступления новых данных, что повышает актуальность и точность формируемых моделей. Основные результаты исследования включают разработку методики автоматизированного формирования онтологий и ее тестирование на примере задач планирования государственных закупок. Доказана эффективность применения языковых моделей для анализа открытых источников и автоматизированного формирования онтологий, позволяющих оптимизировать процедуры закупок и повышать эффективность распределения ресурсов. Практическая значимость работы заключается в создании инструмента, способного поддерживать принятие управленческих решений, автоматизировать процессы структурирования данных и минимизировать влияние человеческого фактора. Использование методики способствует снижению временных затрат, повышению точности анализа и формированию более гибких и адаптивных систем управления знаниями.
Abstract:The paper focuses on automated forming of ontologies for management and decision support systems using large language model technologies. With exponential growth of data volumes and increasing complexity of information systems, traditional ontology development methods are becoming less effective due to their labor-intensive and time-consuming nature. The au-thors propose a methodology that allows automating the processes of extracting, analyzing and structuring knowledge about the subject area. This is especially relevant for tasks with a large amount of multistructured information. The authors pay special attention to the integration of language models with ontological structures to form concepts, their attributes and relationships based on textual data. The methodological basis of the research includes natural language processing algorithms, transformer architectures and meta-associative graphs. This allows not only extracting knowledge from texts, but also formalizing it in a form convenient for further processing. Transformers ensure high accuracy in analyzing texts and identifying key concepts. Meta-associative graphs allow visualizing and efficiently integrating heterogeneous data. An important feature of the proposed approach is the ability to update ontologies dynamically as new data becomes available. This increases the relevance and accuracy of the generated models. The main research results include a developed methodology for automated ontology generation and it is testing on the example of public procurement planning tasks. The authors prove the effectiveness of using language models for open-source analysis and automated ontology formation that allow optimizing procurement procedures and increasing the efficiency of resource allocation. The practical significance of the research is creating a tool capable to support management decision making, automating data structuring processes and minimizing a human factor effect. Using the methodology contributes to reducing time costs, improving the analysis accuracy and forming more flexible and adaptive knowledge management systems.
Авторы: Борисов В.В. (BYG@yandex.ru) - Смоленский филиал Московского энергетического института (технического университета) (профессор), Смоленск, Россия, доктор технических наук, Мисник А.Е. (anton@misnik.by) - Белорусско-Российский университет (доцент), Могилев, Беларусь, кандидат технических наук, Шеробурко Е.Н. (sheren@tut.by) - Белорусско-Российский университет (старший преподаватель), Могилев, Беларусь, Хабаров А.Р. (al_xabarov@mail.ru) - Тверской государственный технический университет (доцент), Тверь, Россия, кандидат технических наук | |
Ключевые слова: автоматизация онтологий, системы поддержки принятия решений, большие языковые модели, трансформеры, метаассоциативные графы, структурирование данных, анализ текстов |
|
Keywords: ontology automation, decision support systems, large language models, transformers, meta-associative graphs, data structuring, text mining |
|
Благодарности: Работа выполнена в рамках государственного задания, проект № FSWF-2023-0012 | |
Количество просмотров: 548 |
Статья в формате PDF |
Синтез онтологий для систем поддержки принятия решений на базе больших языковых моделей
DOI: 10.15827/0236-235X.150.197-209
Дата подачи статьи: 10.12.2024
Дата после доработки: 25.12.2024
Дата принятия к публикации: 16.01.2025
УДК: 004.89
Группа специальностей ВАК: 2.3.1.
Статья опубликована в выпуске журнала № 2 за 2025 год. [ на стр. 197-209 ]
Введение. Современные сложные системы характеризуются высоким уровнем интеграции и взаимодействия различных компонентов, что приводит к экспоненциальному росту объема и разнообразия обрабатываемой информации. В таких условиях традиционные методы управления и принятия решений становятся менее эффективными. Автоматизация формирования онтологий для управления этими системами приобретает все большую актуальность, поскольку онтологии позволяют структурировать знания о предметной области и обеспечивать их интероперабельность. Одновременно с этим наблюдается возрастающее значение интеллектуальных техноло- гий, в частности, больших языковых моделей, в обработке разноструктурированной информации. Большие языковые модели, основанные на архитектуре трансформеров и механизмах самовнимания, демонстрируют высокую эффективность в понимании и генерации естественного языка. Их применение открывает новые возможности для автоматизированного формирования онтологий, что может значительно повысить эффективность управления сложными системами. Цель исследования заключается в изучении возможности автоматизированного построения онтологий предметной области с использованием больших языковых моделей. Для ее достижения необходимо провести анализ существующих подходов к построению онтологий и выявить их ограничения, разработать онтологический подход, интегрирующий технологии больших языковых моделей, а также протестировать разработанную методику на практическом примере и оценить ее эффективность. Актуальность работы обусловлена потребностью в улучшении эффективности принятия управленческих решений в системах с высокой степенью сложности. В условиях постоянно увеличивающегося объема данных и сложности их структуры автоматизация процессов фор- мирования онтологий становится критически важной для обеспечения оперативности и точности решений. Научная новизна исследования состоит в интеграции технологий больших языковых моделей с онтологическим подходом. Это позволяет автоматизировать процесс формирования онтологий, уменьшить трудозатраты и повысить качество получаемых знаний о предметной области. Практическая значимость работы заключается в создании инструментов для автоматизации формирования документации и поддержки управленческих решений. Применение разрабо- танной методики может существенно повысить эффективность работы специалистов в различных отраслях, требующих обработки боль- ших объемов разноструктурированной информации. Принципы построения, виды онтологий и их особенности Вопросам формирования онтологий и их использования в информационных технологиях уделяется пристальное внимание. Так, в работах [1–3] изучались вопросы онтологического инжиниринга взаимосвязанных процессов в сложных киберфизических системах, а также проводились исследования структурных преобразований в метаассоциативных графах. В [4] прорабатывались подходы к поддержке принятия решений при управлении программными проектами на основе нечеткой онтологии. Онтологиям, построенным на основе метаграфов, посвящены труды [5, 6]. Онтология – это формальная спецификация концептуализации в некотором контексте пред- метной области. Создаваемые онтологии и базы знаний являются множеством объектов и связей между ними [7]. Основой построения онтологий служат прин- ципы формализации, ограничения базовых терминов, полноты и непротиворечивости, универсальности и гибкости. Особенность онтологий заключается в их способности связывать формальную семантику, понятную компьютерам, с семантикой реального мира, что позволяет использовать онтологии как инструмент для интеграции разноструктурированной информации [8]. Графовые модели представляют собой универсальный инструмент для структурирования и визуализации сложных взаимосвязей между объектами или элементами системы. Их применение дает возможность наглядно представлять структуру данных и взаимодействия между сущностями, что особенно важно при построении онтологий. В отличие от традиционных методов представления знаний графовые модели обеспечивают гибкость и динамичность, позволяя адаптировать структуру данных к изменяющимся условиям и требованиям. Благодаря графовому подходу можно формировать как простые связи между объектами, так и слож- ные, многоуровневые и рекурсивные зависимости, что делает такие модели незаменимыми для задач, требующих комплексного анализа и обработки информации [3]. Преимуществом графовых моделей яв- ляется их способность объединять в единую систему знания, полученные из различных источников, сохраняя их внутренние связи и контекст. Кроме того, графовые модели предоставляют широкие возможности для автоматизации анализа данных, включая выявление ключевых взаимосвязей, анализ взаимовлияния компонентов и прогнозирование поведения системы. Перечисленные особенности обусловливают ценность графовых моделей для построения онтологий, требующих систематизации больших объемов информации, формализации знаний и их последующего использования в интеллектуальных системах.
Преимущество метаассоциативных графов заключается в их способности отражать динамические изменения. В отличие от статических моделей графовая структура позволяет гибко адаптироваться к изменениям во времени и учитывать новые данные или связи. Метаассоциативные графы демонстрируют высокую адаптивность, что особенно важно для систем, функционирующих в условиях неопределенности или быстро меняющихся условий. Гибкость структуры графа позволяет добавлять новые элементы и связи без необходимости полного пересмотра модели, что делает метаассоциативные графы эффективным инструментом для построения систем, которые требуют регулярного обновления и уточнения [4]. При разработке онтологий возникает ряд сложностей, обусловленных как субъективными, так и объективными факторами. Во-первых, одной из ключевых проблем является то, что онтологии, создаваемые различными разработчиками, часто отражают их инди- видуальные подходы и представления о предметной области, что приводит к специфичному и уникальному описанию концепций. Такое разнообразие в подходах, особенно при разработке онтологий для одной и той же области, нередко становится причиной их несовместимости [1]. С расширением систем, использующих онтологические структуры, необходимость объединения таких разрозненных онтологий становится неизбежной. Этот процесс, как правило, требует значительных усилий, поскольку предполагает ручную доработку, направленную на устранение семантических и структурных противоречий. Факторами, усугубляющими данную проблему, являются различия в языках разработки, специфичность предполагаемого использования онтологий и разное восприятие предметной области их создателями. Во-вторых, в процессе создания онтологии возникает задача обеспечения ее соответствия реальным знаниям о предметной области и корректному использованию терминов. Этот аспект требует высокой точности формализации понятий, что нередко усложняет процесс разработки. Одновременно необходимо добиться достаточной специфичности и концептуальной полноты, чтобы онтология могла охватить все значимые аспекты области применения, минимизируя риски утраты важных деталей или недостаточного описания. Данные сложности делают процесс формирования онтологий чрезвычайно трудоемким и требующим значительных временных и интеллектуальных ресурсов. В этом контексте целесообразным становится применение технологий интеллектуального анализа данных и методов извлечения знаний, которые способны автоматизировать ключевые этапы разработки и повысить ее эффективность. Большие языковые модели Большие языковые модели широко применяются для обработки естественного языка в совершенно разных отраслях и сферах деятельности. Вопросы их функционирования и прикладного использования являются объектом пристального внимания отечественных ученых. Так, в [9] рассматривается использование больших языковых моделей для сегментации клиентской базы в маркетинге. В работе [10] изучаются вопросы оптимизации традиционных методов определения сходства наименований проектов и закупок с применением больших языковых моделей. Предметом исследования являются анализ и совершенствование методов определения релевантности наименований проектов к информационному содержанию закупок с использованием больших языковых моделей. Метод создания графов знаний для медицинских систем поддержки принятия решений с акцентом на адаптацию таких решений под разнообразные клинические рекомендации описан в [11]. Вместе с тем возможности использования больших языковых моделей в ряде областей деятельности организаций остаются не исследованными в должной мере. Например, сфера бюджетных закупок в силу своей специфики является достаточно узкой и в то же время динамичной в связи с изменениями в законодательстве и меняющимися потребностями ор- ганизаций. Это позволяет говорить не только о необходимости формирования онтологий для обеспечения ее функционирования, но и о постоянной ее адаптации к требованиям внешней среды. Использование больших языковых моделей в данной сфере позволит оперативно формировать документацию, опираясь на струк- турированную информацию, являющуюся основой онтологии в данной предметной области. Новизна исследования заключается в разработке комбинированного подхода к формированию онтологий, предполагающего применение больших языковых моделей на базе трансформеров для формирования онтологии предметной области. Из данных, находящихся в открытом доступе, путем обработки естественного языка формируется онтология, которая в дальнейшем может быть использована для решения прикладных задач. Современные достижения в области обработки естественного языка связаны с развитием больших языковых моделей, основу которых составляет архитектура трансформеров. Архитектура больших языковых моделей на базе трансформеров впервые была представле- на в 2017 году группой специалистов Google [12]. В российской науке возможности их использования для оценки актуальных угроз безопасности информации исследовались в работе [13], а в [14] рассмотрены вопросы экономной реализации внимания в кодере трансформера при распознавании речи. Основным преимуществом трансформеров является их способность параллельно обрабатывать данные, что значительно повышает скорость обучения и обработки информации по сравнению с рекуррентными нейронными сетя- ми, традиционно применявшимися для работы с текстом. Механизм самовнимания позволяет трансформерам учитывать взаимосвязи между словами в любом участке текста. Благодаря этому механизму трансформеры устраняют такие ограничения, как потеря контекста на длин- ных последовательностях или затруднения, связанные с затуханием градиента при обучении.
Следующий важный компонент – позиционное кодирование. Алгоритм внимания, используемый в трансформерах, проводит анализ взаимосвязей между элементами последовательности, применяя одинаковые матрицы для всех входных данных, что позволяет учитывать контекст при обработке текста. Позиционное кодирование реализуется с помощью векторов, которые имеют ту же размерность, что и элементы последовательности. Для их описания используются периодические функции: синус применяется к четным компонентам вектора, а косинус – к нечетным. В случае применения данной методики к моделированию поведения систем такой вектор способен адекватно описывать характеристики поведения каждого элемента:
где pos – позиция элемента последовательности; i – позиция элемента в векторе одного элемента последовательности; d – размерность вектора одного элемента последовательности. Такой подход позволяет не только фиксировать положение каждого элемента последовательности, но и определять расстояние между ними, что существенно повышает точность обработки данных. В архитектуре трансформера позиционное кодирование реализуется отдель- но от основной структуры и заключается в добавлении вектора позиции к вектору входной последовательности до его передачи на обработку первому слою энкодера. Операция сложения векторов, а не их конкатенации позволяет корректно учитывать позиции не только отдельных элементов последовательности, но и каждого компонента их векторного представления. Теоретически это открывает возможность анализа связей между как самими элементами последовательности, так и их внутренними составляющими, что обеспечивает более глубокую обработку данных. С точки зрения интерпретации данных нейро- сеть обучается на данных, уже дополненных позиционным кодированием, и обрабатывает их как единое целое. Это позволяет избегать разделения анализа значений элементов и их позиций, делая обработку более интегрированной. Энкодер выполняет анализ входного текста, создавая серию скрытых состояний, сохраняющих контекст и смысловые связи в данных. Эта часть архитектуры трансформера состоит из нескольких слоев, каждый из которых включает механизм самовнимания и нейронную сеть с прямой передачей. Благодаря механизму самовнимания модель способна оценивать важность различных атрибутов во входной последовательности, вычисляя баллы внимания. Это позволяет учитывать зависимости и отношения между различными лексемами с учетом контекста (рис. 3). На рисунке матрица Q – характеристика, для которой рассчитывается значение внимания, матрица K – характеристика (атрибут), которая оценивается через внимание, матрица V проверяет, насколько оценка внимания для каждой пары слов соотносится с векторной оценкой правильной характеристики (атрибута), предъявляемой сети во время обучения. В свою очередь, Q = X1WQ и KT = WTKXT2, где X1 и X2 – элементы последовательности; WQ и WTK – матрицы весовых коэффициентов запросов и ключей соответственно. Таким образом, QKT = X1WQWTKXT2, QKT = X1(WQWTK)XT2. Матрицы Q и K умножаются друг на друга, масштабируются, проходят через маскирование (декодер), результаты нормализуются и умножаются на матрицу V. Веса матриц Q, K и V рассчитываются во время обучения сети. Матрицы работают с позиционными представлениями внутри атрибутов или характеристик из входной последовательности. Далее к каждому токену независимо применяется нейронная сеть с прямой передачей. Эта сеть включает в себя полностью связанные слои с нелинейными функциями активации, что позволяет модели улавливать сложные взаимодействия между лексемами. Слои декодера обеспечивают авторегрессивную генерацию, когда модель может генерировать последовательные выходы, обращая внимание на ранее сгенерированные лексемы.
В архитектуре многоголового внимания параллельно используются несколько потоков самовнимания с различными весовыми коэффициентами, что имитирует разносторонний разбор ситуации. Результаты работы потоков самовнимания конкатенируются в единый вектор. А итоговый результат алгоритма определяется умножением вектора на матрицу W0, параметры которой подбираются в процессе обучения нейронной сети. Вся эта архитектура подменяет блок самовнимания в энкодере и декодере архитектуры трансформера. Нормализация слоев применяется после каждого подкомпонента или слоя в архитектуре трансформера. Она помогает стабилизировать процесс обучения и улучшает способность модели обобщать различные входные данные. Выходные слои модели трансформера могут варьироваться в зависимости от конкретной задачи. Методы интеграции языковых моделей с онтологическими структурами Интеграция больших языковых моделей с онтологическими структурами представляет собой перспективное направление, которое позволяет объединить возможности языковых моделей по анализу текстов с формализацией знаний, характерной для онтологий. Данная интеграция основана на способности больших языковых моделей извлекать смыслы из неструктурированных текстов и преобразовывать их в структурированные формы, пригодные для последующего использования в онтологических системах. Одним из методов такой интеграции является использование моделей для автоматического извлечения концептов и их атрибутов из текстовых источников [15]. Большие языковые модели способны анализировать тексты, выделяя ключевые понятия, отношения между ними и их характеристики. Предобработанные данные могут быть преобразованы в формализован- ные структуры, которые затем интегрируются в онтологию. Данный подход существенно упрощает процесс наполнения онтологии, поскольку позволяет автоматически генерировать значительный объем базовой информации, минимизируя участие человека. Кроме того, языковые модели используются для автоматического сопоставления концептов, извлеченных из различных источников, с уже существующими элементами онтологии, при этом устраняется дублирование данных и обеспечивается согласованность структуры. Механизмы самовнимания, применяемые в трансформерах, играют важную роль в этом процессе, так как они позволяют учитывать контекст каждого элемента и находить наиболее релевантные соответствия между концептами. Для повышения актуальности онтологий используется метод, известный как обогащение знаний. Большие языковые модели анализируют новые текстовые данные, извлекают из них полезную информацию и обновляют существующую онтологию, добавляя новые элементы или уточняя характеристики уже имеющихся. Это обеспечивает динамическое развитие онтологий, что особенно важно для систем, функционирующих в условиях изменяющейся информации. Значимым направлением интеграции является использование больших языковых моделей для генерации текстов на основе данных, хранящихся в онтологии, позволяющее не только структурировать информацию, но и предостав- лять ее в удобной для пользователя форме [16]. Постановка задачи: автоматизация формирования онтологий для поддержки принятия решений Целью автоматизации является создание интеллектуальных систем, способных анализировать разноструктурированные данные, извле- кать из них ключевые понятия и взаимосвязи, а затем на их основе формировать структурированные представления в виде онтологий. Такие системы должны не только обеспечивать обработку входных данных, но и быть адаптивными, чтобы учитывать изменения в предметной области или в данных. Для достижения поставленной цели формирование онтологий должно включать несколь- ко этапов, каждый из которых решает определенные задачи. 1. Анализ и извлечение данных из источников. На этом этапе производится сбор данных из различных источников, таких как текстовые документы, БД и открытые информационные системы. Анализ данных предполагает их предварительную обработку, включая очистку от шума, стандартизацию и структурирование. Интеллектуальные алгоритмы должны уметь выделять ключевые концепции и их характеристики, а также устанавливать связи между ними [17]. 2. Формализация знаний и их интеграция. После анализа данные преобразуются в формализованные представления, которые могут быть использованы для построения онтологии. Это включает создание классов, атрибутов, отношений, а также аксиом, определяющих правила взаимосвязей. Интеграция знаний требует согласования данных из разных источников, устранения дублирования и обеспечения логической непротиворечивости. 3. Обогащение и обновление онтологий. Автоматизированные системы должны быть способны не только создавать новые онтологии, но и обновлять существующие, добавляя новые концепции и связи. Это особенно важно для динамично развивающихся областей, где знания быстро устаревают. Автоматическое обогащение онтологий предполагает извлечение информации из новых источников и ее интеграцию в существующую структуру. 4. Обеспечение поддержки принятия реше- ний. Финальный этап включает применение созданных онтологий в системах поддержки принятия решений. Онтологии позволяют структурировать данные таким образом, чтобы на их основе можно было формировать рекомендации, прогнозы или сценарии для конкретных задач [18]. Это особенно важно в условиях высокой неопределенности или необходимости анализа больших объемов информации. Цель настоящего исследования заключается в анализе возможностей автоматизации процесса формирования онтологий, которые могут быть использованы для поддержки принятия сложных управленческих решений в рамках задач синтеза поведения системы. В процессе синтеза поведения элементов системы производятся определение их технических характеристик, уточнение требований к функциональности, а также иных параметров, влияющих на общее функционирование. В ходе исследования была создана типизированная онтология, отражающая ключевые аспекты поведения системы. Такой онтологический подход позволяет систематизировать и интегрировать значительные объемы разноструктурированной информации, которая используется для анализа и проектирования поведения сложных систем. Наполнение онтологии данными с применением методов интеллектуального анализа предоставляет возможность формирования эффективного инструмента для систематизации знаний и генерации необходимой документации [19]. Процесс построения онтологии включает этапы извлечения характеристик элементов поведения системы, что демонстрируется на иллюстрациях. На первом этапе определяется предметная область и создается база знаний, основанная на доступной информации из открытых источников. На последующих этапах извлеченные данные подвергаются онтологическому анализу, включающему структурирование разноструктурированной информации. Для выполнения анализа применяется языковая модель, способная обрабатывать извлеченные данные, формируя из них предварительно обработанные наборы, которые затем становятся основой для последующей систематизации. Такой подход позволяет значительно упростить процесс структурирования данных, что делает возможным разработку онтологий, соответствующих требованиям современных систем управления и анализа.
Полученные предобработанные данные кластеризуются, в результате чего формируются наборы кластеров и кластеризованных данных. Характеристики, сгруппированные по кластерам, служат основой для получения значений характеристик для каждого элемента поведения системы и, в свою очередь, формируют объектную структуру предметной области. Оригинальность предложенного подхода заключается в комбинировании использования больших языковых моделей для формирования онтологий, что позволяет структурировать информацию для формирования онтологий, дает возможность многократного применения сформированной БД, ее обновления и адаптации в рамках меняющихся условий. С помощью метаассоциативных графов можно интегрировать разноструктурированные данные, что позволяет объединять в общую систему данные и знания, полученные из различных источников, сохраняя их внутренние связи и контекст. Перечисленные особенности метода предоставляют широкие возможности для автоматизации анализа данных, включая выявление ключевых взаимосвязей, анализ взаимовлияния компонентов и прогнозирование поведения системы. Реализация автоматизированного построения онтологии на примере задачи формирования плана-графика закупок В процессе составления плана-графика закупок решается задача определения рационального перечня товаров, работ и услуг, подлежащих приобретению в процессе тендерных закупок. При этом количество выделенных финансовых ресурсов для их приобретения является ограниченным. Задача планирования на данном этапе – рациональное распределение финансовых ресурсов для своевременного приобретения товаров, работ, услуг, обеспечивающих эффективное функционирование организации.
На предварительном этапе для формирования плана-графика закупок (перечня закупок) могут применяться большие языковые модели. При этом возможно использование сведений,содержащихся в планах-графиках закупок аналогичных организаций, размещенных на официальном сайте Единой информационной системы в сфере закупок. Это связано с тем, что ассортимент товаров, работ, услуг, закупаемых организацией, во многом обусловлен спецификой ее деятельности, размерами и другими факторами. Соответственно, больницы чаще и больше закупают медикаменты и медицинское оборудование, а школы – мебель и обучающие материалы. Раз- мер организации и регион, в котором она находится, также могут оказывать существенное влияние на потребность в объектах закупки. Кроме того, большие языковые модели можно использовать для определения необходимых технических, потребительских и иных характеристик объекта закупки, включаемых в план-график (например, объем оперативной памяти, мощность процессора, размер монитора и т.п. для ПК). Целью данного исследования является изучение возможности автоматизации построения онтологий предметной области, пригодных для поддержки принятия решений в процессе составления технического задания на закупку товаров, работ, услуг. При составлении технического задания определяются технические характеристики объекта закупки, уточняются требования заказчика к функционированию системы и т.д. На этапе извлечения данных система анализирует технические задания состоявшихся процедур закупок аналогичных товаров. Задача формирования технического задания заключается в следующем: из извещений о проведении закупок, по которым обязательства исполнены надлежащим образом, формируется набор сведений для повышения эффективности работы специалиста, обеспечения безопасности данных, повышения уровня точности формулировок требований к предмету закупки. В открытом доступе на официальном сайте Единой информационной системы в сфере госзакупок www.zakupki.gov.ru представлена вся информация о закупках, проводимых на территории Российской Федерации [12]. Если товар (работа, услуга) включен в Каталог товаров, работ, услуг для осуществления государственных и муниципальных нужд (КТРУ), для него формируется карточка, содержащая код по ОКПД2, единицы измерения по ОКЕИ, условия применения, информацию о типовых контрактах, типовых условиях контрактов, общероссийские и международные классифика- торы, информацию о технических регламентах и стандартах, а также описание товара, работы, услуги, которое включает наименование характеристики, вид характеристики (не изменяемая заказчиком (выбор одного), не изменяемая заказчиком (множественный выбор), значение характеристики, единица измерения характеристики). При этом характеристики подразделяются на обязательные (описание должно присутствовать в техническом задании) и необязательные (описание может присутствовать в тех- ническом задании). В разделе «Вложения» содержатся печатная версия карточки, а также карточка в форме электронного документа. Описание предмета закупки формируется в виде стандартной таблицы, содержащей соответствующие характеристики, и является частью технического задания. В случае наличия товара в каталоге заказчик может сформировать техническое задание, используя вышеуказанную карточку, выбирая из предложенных вариантов те характеристики, которые в наибольшей степени соответствуют его потребностям. В случае отсутствия товара в КТРУ пользователь самостоятельно описывает предмет закуп- ки, указывая стандартные технические характеристики, потребительские свойства товара, работы, услуги и т.д. Работники заказчика зачастую сталкиваются со сложностями в формировании извещения о проведении закупки и, в частности, технического задания. Так, специ- алисту по закупкам приходится приобретать совершенно разнообразные товары, работы, услуги – от продуктов питания до запасных частей и систем обеспечения безопасности. При этом возможно использование различного рода технических нормативно-правовых актов, технической документации, извещений о проведении состоявшихся закупок. Грамотное составление технического задания требует значительных трудозатрат и не всегда является возможным в условиях ограниченности времени и отсутствия специалистов в области объекта закупки. Использование технологий интеллектуального анализа данных может решить эту проблему. Из извещений о проведении закупок, по которым обязательства исполнены надлежащим образом, формируется набор сведений для повышения эффективности работы специалиста, обеспечения безопасности данных, повышения уровня точности формулировок требований к предмету закупки (http://www.swsys.ru/uploa- ded/image/2025-2/12.jpg). Онтологический подход к синтезу извещения о проведении процедур закупок на основе интеллектуального анализа текста предполага- ет анализ нормативно-правовых актов, а также БД закупок. В ходе синтеза технического задания определяются технические характеристики объекта закупки, уточняются требования заказчика к функционированию системы и т.д. В рамках исследования разработан онтологический подход к поддержке принятия решений при синтезе технического задания на закупку. Данный подход включает ряд этапов. 1. Специалист по закупкам осуществляет выбор предмета закупки. 2. Проводится интеллектуальный анализ текстов, определяются характеристики товара, работы, услуги и их допустимые значения, формируется техническое задание. 3. Интеллектуальные технологии анализа данных из существующих извещений на закупку необходимого товара (работы, услуги) на основе анализа определяют, какое описание может быть использовано в конкретном случае. При этом исключается использование разделов технического задания, противоречащих требованиям законодательства. 4. Проект технического задания формируется из образцов технического задания, в наи- большей степени соответствующих требованиям к предмету закупки. 5. В случае необходимости специалист по закупкам корректирует полученный вариант технического задания либо корректирует запрос, и цикл повторяется. В настоящее время разрабатывается ПО на основе предложенных подходов, обеспечивающее автоматизированное формирование онтологий предметной области на основе метаассоциативных графов. Выводы Результаты исследования подтверждают эффективность предложенной методики автоматизированного построения онтологий, которая демонстрирует повышение точности и производительности процессов систематизации знаний. Применение больших языковых моделей позволяет не только ускорить обработку разноструктурированных данных, но и обеспечить высокую степень их формализации. Разработанный подход оказался особенно полезным при работе с большими объемами данных, что делает его применимым в различных областях, требующих обработки значительных массивов информации. Онтологический подход, интегрирующий технологии обработки естественного языка, открывает новые возможности для построения интеллектуальных систем поддержки принятия решений. Применение разработанного подхода рекомендуется в прикладных задачах, связанных с обработкой данных, их структурированием и интеграцией. В частности, методика может быть полезна в областях государственного управления, здравоохранения, логистики и проектного управления. Она способна улучшить процессы анализа данных, автоматизировать составление документации и обеспечить поддержку принятия решений на основе онтологий, что особенно актуально в условиях динамически меняющихся требований. Для расширения области применения предложенной методики целесообразно сосредоточить усилия на ее адаптации к другим предметным областям. Это может включать разработку специализированных алгоритмов для обработки данных с учетом отраслевых особенностей. Дальнейшие исследования также могут быть направлены на улучшение интеграции методов анализа данных и онтологических систем, включая разработку новых моделей и подходов, способных учитывать более сложные взаимосвязи между данными. Особый интерес представляет возможность использования предложенного подхода в задачах прогнозирования и анализа сценариев, что зна- чительно расширит его практическую ценность. Список литературы 1. Borisov V.V., Misnik A.E. Ontological engineering of interrelated processes in complex cyber-physical systems. In: LNNS. Proc. IITI, 2022, vol. 566, pp. 413–423. doi: 10.1007/978-3-031-19620-1_39. 2. Borisov V.V., Zakharchenkov K.V., Kutuzov V.V., Misnik A.E., Prokopenko S.A. Modeling educational processes based on neuro-fuzzy temporal Petri nets. J. of. Applied Informatics, 2021, vol. 16, no. 4, pp. 35–47. doi: 10.37791/2687-0649-2021-1 6-4-35-47. 3. Borisov V.V., Misnik A.E. Ontological engineering in complex systems based on meta-associative graphs. Pattern Recognition and Image Analysis, 2023, vol. 33, pp. 234–241. doi: 10.1134/S1054661823030045. 4. Антонов В.В., Бармина О.В., Никулина Н.О. Поддержка принятия решений при управлении программными проектами на основе нечеткой онтологии // Онтология проектирования. 2020. Т. 10. № 1. С. 121–140. doi: 10.18287/2223-9537-2020-10-1-121-140. 5. Gapanyuk Yu.E. Metagraph approach to the information-analytical systems development. Proc. 6th Int. Conf. Actual Problems of System and Software Eng., 2019, vol. 2514, pp. 428–439. 6. Rasheed B., Popov A.Yu. Network graph datastore using DISC processor. Proc. EIConRus, pp. 1582–1587. doi: 10.1109/EIConRus.2019.8656749. 7. Бухаров М.Н. Информационная система для онтологического моделирования предметных областей // Информатика. 2022. Т. 19. № 2. С. 85–99. doi: 10.37661/1816-0301-2022-19-2-85-99. 8. Sadirmekova Z.B., Tussupov J., Murzakhmetov A., Zhidekulova G. et al. Ontology engineering of automatic text processing methods. IJECE, 2023, vol. 13, no. 6, pp. 6620–6628. doi: 10.11591/ijece.v13i6.pp6620-6628. 9. Мищенко Е.В. Повышение точности маркетинга: использование больших языковых моделей для продвинутой сегментации клиентской базы // Экономика и предпринимательство. 2024. № 7. С. 817–821. doi: 10.34925/EIP.2024.168.7.160. 10. Голиков А.А., Акимов Д.А., Данилова Ю.Ю. Оптимизация традиционных методов определения сходства наименований проектов и закупок с использованием больших языковых моделей // Litera. 2024. № 4. С. 109–121. doi: 10.25136/2409-8698.2024.4.70455. 11. Грибова В.В., Переволоцкий В.С. Разработка графов знаний на основе больших языковых моделей для поддержки принятия решений в медицине // Программная инженерия. 2024. Т. 15. № 6. С. 308–321. doi: 10.17587/prin.15.308-321. 12. Vaswani A., Shazeer N., Parmar N., Uszkoreit J., Jones L., Gomez A.N., Kaiser L., Polosukhin I. Attention is all you need. NIPS, 2017, pp. 5998–6008. 13. Васильев В.И., Вульфин А.М., Кучкарова Н.В. Оценка актуальных угроз безопасности информации с помощью технологии трансформеров // Вопросы кибербезопасности. 2022. № 2. С. 27–38. doi: 10.21681/2311-3456-2022-2-27-38. 14. Чучупал В.Я. Экономная реализация внимания в кодере Трансформера при распознавании речи // Речевые технологии. 2022. № 1. С. 119–127. doi: 10.58633/2305-8129_2 022_1_119. 15. Борисов В.В., Черновалова М.В., Курилин С.П. Мониторинг и адаптация базы проектных прецедентов при управлении инновационными проектами на основе нечеткого онтологического подхода // Онтология проектирования. 2020. Т. 10. № 4. С. 516–526. doi: 10.18287/2223-9537-2020-10-4-516-526. 16. Черновалова М.В. Нечеткие прецедентные модели для управления проектами с использованием мультионтологического подхода // Прикладная информатика. 2021. Т. 16. № 2. С. 4–16. doi: 10.37791/2687-0649-2021-16-2-4-16. 17. Chougule A., Jha V., Mukhopadhyay D. Decision support for nutrition management of grapes using ontology based on decision trees. IJIDS, 2019, vol. 11, no. 3, pp. 234–255. doi: 10.1504/IJIDS.2019.101993. 18. Lytvyn V., Vysotska V., Dosyn D., Lozynska O., Oborska O. Methods of building intelligent decision support systems based on adaptive ontology. Proc. IEEE Int. Conf. DSMP, 2018, pp. 145–150. doi: 10.1109/DSMP.2018.8478500. 19. Borisov V.V., Misnik A.E., Sheroburko A.M., Zakharchenkov K.V. Ontological approach to the document synthesis based on data mining. Proc. 7th Int. Conf. Inforino, 2024, pp. 1–5. doi: 10.1109/Inforino60363.2024.10551891. References 1. Borisov, V.V., Misnik, A.E. (2022) ‘Ontological engineering of interrelated processes in complex cyber-physical systems’, in LNNS. Proc. IITI, 566, pp. 413–423. doi: 10.1007/978-3-031-19620-1_39. 2. Borisov, V.V., Zakharchenkov, K.V., Kutuzov, V.V., Misnik, A.E., Prokopenko, S.A. (2021) ‘Modeling educational processes based on neuro-fuzzy temporal Petri nets’, J. of. Applied Informatics, 16(4), pp. 35–47. doi: 10.37791/2687-0649-2021-16-4-35-47. 3. Borisov, V.V., Misnik, A.E. (2023) ‘Ontological engineering in complex systems based on meta-associative graphs’, Pattern Recognition and Image Analysis, 33, pp. 234–241. doi: 10.1134/S1054661823030045. 4. Antonov, V.V., Barmina, O.V., Nikulina, N.O. (2020) ‘Decision-making support in software project management based on fuzzy ontology’, Ontology of Designing, 10(1), pp. 121–140 (in Russ.). doi: 10.18287/2223-9537-2020-10-1-121-140. 5. Gapanyuk, Yu.E. (2019) ‘Metagraph approach to the information-analytical systems development’, Proc. 6th Int. Conf. Actual Problems of System and Software Eng., 2514, pp. 428–439. 6. Rasheed, B., Popov, A.Yu. (2019) ‘Network graph datastore using DISC processor’, Proc. EIConRus, pp. 1582–1587. doi: 10.1109/EIConRus.2019.8656749. 7. Bukharov, M.N. (2022) ‘Information system for ontological modelling the subject areas’, Informatics, 19(2), pp. 85–99 (in Russ.). doi: 10.37661/1816-0301-2022-19-2-85-99. 8. Sadirmekova, Z.B., Tussupov, J., Murzakhmetov, A., Zhidekulova, G. et al. (2023) ‘Ontology engineering of automatic text processing methods’, IJECE, 13(6), pp. 6620–6628. doi: 10.11591/ijece.v13i6.pp6620-6628. 9. Mishchenko, E.V. (2024) ‘Enhancing marketing precision: Leveraging large language models for advanced customer database segmentation’, Economics and Entrepreneurship, (7), pp. 817–821 (in Russ.). doi: 10.34925/EIP.2024. 10. Golikov, A.A., Akimov, D.A., Danilova, Yu.Yu. (2024) ‘Optimization of traditional methods for determining the similarity of project names and purchases using large language models’, Litera, (4), pp. 109–121 (in Russ.). doi: 10.25136/2409-8698.2024.4.70455. 11. Gribova, V.V., Perevolotsky, V.S. (2024) ‘Knowledge graph formation using LLM for disease treatment in decision support systems’, Software Engineering, 15(6), pp. 308–321 (in Russ.). doi: 10.17587/prin.15.308-321. 12. Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, A.N., Kaiser, L., Polosukhin, I. (2017) ‘Attention is all you need’, NIPS, pp. 5998–6008. 13. Vasiliev, V.I., Vulfin, A.M., Kuchkarova, N.V. (2022) ‘Assessment of current threats to information security using transformer technology’, Cybersecurity Issues, (2), pp. 27–38 (in Russ.). doi: 10.21681/2311-3456-2022-2-27-38. 14. Chuchupal, V.Ya. (2022) ‘Economical implementation of attention in the transformer encoder for speech recognition’ Speech Technologies, (1), pp. 119–127 (in Russ.). doi: 10.58633/2305-8129_2 022_1_119. 15. Borisov, V.V., Chernovalova, M.V., Kurilin, S.P. (2020) ‘Monitoring and adaptation of the base of design precedents in the management of innovative projects based on a fuzzy ontological approach’, Ontology of Designing, 10(4), pp. 516–526 (in Russ.). doi: 10.18287/2223-9537-2020-10-4-516-526. 16. Chernovalova, M.V. (2021) ‘Fuzzy case models for project management using a multi-ontology approach’, J. of. Applied Informatics, 16(2), pp. 4–16 (in Russ.). doi: 10.37791/2687-0649-2021-16-2-4-16. 17. Chougule, A., Jha, V., Mukhopadhyay, D. (2019) ‘Decision support for nutrition management of grapes using ontology based on decision trees’, IJIDS, 11(3), pp. 234–255. doi: 10.1504/IJIDS.2019.101993. 18. Lytvyn, V., Vysotska, V., Dosyn, D., Lozynska, O., Oborska, O. (2018) ‘Methods of building intelligent decision support systems based on adaptive ontology’, Proc. IEEE Int. Conf. DSMP, pp. 145–150. doi: 10.1109/DSMP.2018.8478500. 19. Borisov, V.V., Misnik, A.E., Sheroburko, A.M., Zakharchenkov, K.V. (2024) ‘Ontological approach to the document synthesis based on data mining’, Proc. 7th Int. Conf. Inforino, pp. 1–5. doi: 10.1109/Inforino60363.2024.10551891. |
Постоянный адрес статьи: http://swsys.ru/index.php?page=article&id=5152 |
Версия для печати |
Статья опубликована в выпуске журнала № 2 за 2025 год. [ на стр. 197-209 ] |
Статья опубликована в выпуске журнала № 2 за 2025 год. [ на стр. 197-209 ]
Возможно, Вас заинтересуют следующие статьи схожих тематик:Возможно, Вас заинтересуют следующие статьи схожих тематик:
- Автоматизированная разметка изображений с беспилотного летательного аппарата при помощи предобученных моделей искусственного интеллекта
- Программный комплекс для поддержки моделирования медико-эколого-экономических систем
- Метод анализа текстов при тарифной классификации товаров в таможенном деле
- Фреймворк для автоматизации прогнозирования остаточного ресурса оборудования при построении проактивных систем поддержки принятия решений
- Этапы разработки интегрированной информационно-аналитической системы обработки экономической информации в организациях
Назад, к списку статей