Авторитетность издания
Добавить в закладки
Следующий номер на сайте
Система назначения персонифицированного лечения по аналогии на основе гибридного способа извлечения прецедентов
Аннотация:В работе описывается система назначения персонифицированного лечения на основе прецедентов. Ее уникальной особенностью является извлечение прецедентов на основе гибридного метода, сочетающего извлечение прецедента на основе знаний с классическим способом K-ближайших соседей. Новизна предлагаемого подхода заключается в обеспечении максимальной гибкости и корректности в оценке сходимости прецедентов. В работе описаны информационные и программные компоненты системы. Используемая база знаний, как и все информационные ресурсы, строится по своим онтологиям, четко задающим их структуру и семантику. Это позволяет оперативно вносить изменения без привлечения программистов и переработки всей системы. Система реализована на основе мультиагентного подхода. На первом этапе с помощью базы знаний производятся предварительный расчет и приведение всех признаков к единой метрике, на втором – непосредственный расчет сходимости методом K-ближайших соседей. Сходимость историй болезни определяется совокупно по каждому признаку. На практике система позволяет максимально гибко и точно оценивать похожесть историй болезни, содержащих разнородные по типу признаки. Предлагаемое решение особенно эффективно в условиях дефицита медицинских знаний и данных, когда системы иного типа, в частности, основанные на знаниях, не могут предложить корректное решение.
Abstract:The paper describes a system for prescribing personalized treatment based on precedents. A unique feature of the system is the extraction of precedents based on a hybrid method combining the extraction of a precedent based on knowledge with a classical method of K-nearest neighbors. The novelty of the proposed approach is in ensuring maximum flexibility and correctness in assessing the convergence of precedents. The paper describes the information and software components of the system. The knowledge base used, as well as all information resources, is built according to its ontologies, which clearly define its structure and semantics. This allows making changes to them quickly without involving programmers and processing the entire system. The system is based on a multi-agent approach. The first stage involves a preliminary calculation and bringing all features to a single metric using the knowledge base. The second stage includes actual calculating the convergence by the K–nearest neighbors method. The convergence of case histories is determined collectively for each attribute. Thus, in practice, the system allows the most flexible and accurate assessment of the similarity of medical histories containing heterogeneous signs. The proposed solution is particularly effective under conditions where there is a shortage of medical knowledge and data, when other types of systems often cannot offer a correct solution, in particular those based on knowledge.
Авторы: Грибова В.В. (gribova@iacp.dvo.ru) - Институт автоматики и процессов управления ДВО РАН (зам. директора), г. Владивосток, Россия, доктор технических наук, Ковалев Р.И. (koval-995@mail.ru) - Институт автоматики и процессов управления Дальневосточного отделения РАН, Дальневосточный федеральный университет (научный сотрудник), Владивосток, Россия, Аспирант , Окунь Д.Б. (okdm@iacp.dvo.ru) - Институт автоматики и процессов управления Дальневосточного отделения РАН (научный сотрудник), Владивосток, Россия, кандидат математических наук | |
Ключевые слова: система поддержки принятия решений, прецедент, интеллектуальная система, рассуждения по аналогии |
|
Keywords: decision support system, precedent, intellectual system, case based reasoning |
|
Количество просмотров: 3256 |
Статья в формате PDF |
Назначение адекватного лечения по поставленному диагнозу, варианту течения, жалобам пациента, результатам его лабораторных и инструментальных исследований, индивидуальным особенностям является для врача сложной задачей. Именно ошибки в назначении лечения особенно часто встречаются и имеют наибольшие негативные последствия. Системы поддержки принятия врачебных решений разрабатываются для помощи врачам в постановке диагноза и назначении персонифицированного лечения. В литературе приводятся различные классификации методов и подходов к созданию таких систем [1]. Для улучшения клинической практики в некоторых случаях используются гибридные подходы к их реализации [2]. В условиях дефицита медицинских знаний о лечении какого-либо заболевания (например, в начале пандемии COVID-19, при появлении его новых штаммов) или атипичного проявления заболевания и реакции на лечение наиболее целесообразны методы создания систем поддержки принятия решений на основе прецедентов [2]. Эти методы позволяют решать новую, неизвестную задачу, используя накопленный опыт решения подобных задач. Актуальность создания таких методов обусловлена тем, что они позволяют работать с малыми наборами данных, в то время как использование других методов может привести к неточным и даже ошибочным выводам. Наиболее известными методами извлечения прецедентов [3] являются методы ближайшего соседа, извлечения прецедентов на основе деревьев решений и извлечения прецедентов на основе знаний. Метод ближайшего соседа наиболее простой и универсальный. С его помощью разработаны такие системы поиска похожих случаев при лечении, как CBR-DENT [4], DePicT [5], «Спутник Врача», разработанная в ИСП РАН [6], а также система по планированию лучевой терапии [7]. К недостаткам метода относятся сложность выбора метрики для определения степени сходства, неэффективность при работе с неполными данными, зависимость от вычислительных ресурсов, а также от размера базы прецедентов (БП) [3]. Метод извлечения прецедентов на основе деревьев решений обычно используется для больших БП, так как основная часть работы по извлечению прецедентов выполняется заранее на этапе построения дерева решений, что значи- тельно сокращает время поиска решения. Данный подход в сочетании с методом ближайшего соседа использует система ReCall от ISoft [8]. Существенным недостатком систем на основе деревьев решений является то, что деревья дают полезные результаты только в случае независимых признаков. Имеет место и проблема значимости [9]: дерево дробит данные на большое количество частных случаев. Чем их больше, тем меньше обучающих прецедентов попадает в каждый такой частный случай. Метод извлечения прецедентов на основе знаний позволяет учесть знания экспертов и может успешно применяться совместно с другими методами извлечения прецедентов, особенно когда БП имеют большие размеры и предметная область является открытой и динамичной. Одна из главных проблем прецедентного подхода – выбор соответствующей метрики для индексации и сравнения прецедентов. В каждом конкретном случае этот выбор производится по-разному в зависимости от целей лица, принимающего решения, а также самих данных. Серьезным вопросом является интерпретация дискретных и качественных значений. Анализ существующих систем на основе прецедентов позволил сделать вывод, что либо рассмотренные программные решения ориентированы на узкую задачу, либо описание прецедентов и получаемое решение выполнены в математических терминах, непонятных предметным специалистам. Каждый метод в отдельности имеет существенные недостатки и не позволяет в полной мере использовать такие системы в медицине. Авторы данного исследования считают наиболее перспективным применение гибридных способов, сочетающих различные методы поиска прецедентов. Целью исследования является разработка оболочки системы поддержки принятия решений по назначению лечения на основе прецедентов, применимой для поиска лечения различных заболеваний (независимо от раздела медицины, класса заболевания, его формы) с возможностью ее интеграции в различные интеллектуальные системы. Постановка задачи Данная работа ориентирована на поиск прецедентов при назначении лечения. На вход системе подается история болезни пациента с поставленным диагнозом. Требуется найти похожие истории из БП, ранжировать их по степени сходства, а также обеспечить пользователю демонстрацию сходных элементов из текущей истории болезни и ранжированного списка. История болезни представляет собой формальное описание в медицинских терминах всей информации о больном, включающей его индивидуальные характеристики, анамнез жизни, блоки жалоб, объективные, лабораторные и инструментальные исследования, а также поставленный диагноз. Истории болезни из БП также включают блок с описанием назначенного лечения, возможно, дневник, отображающий динамику лечения и его результат. История болезни формируется на основе специальной онтологии, которая позволяет четко задать структуру и семантические связи внутри истории болезни [10]. Значения признаков (жалоб, лабораторных и инструментальных исследований и др.) выбираются из базы знаний медицинских терминов и признаков. Она также формируется на основе онтологии, содержит описания признаков и наблюдений для формирования истории болезни, в ней определены типы их шкал и возможные значения. База знаний медицинских терминов и признаков постоянно пополняется новыми описаниями (данная работа проводится различными медицинскими коллективами, которые формируют терминологические справочники для «своих» разделов медицины). Учитывая этот факт, принципиальным требованием к системе является ее устойчивость: появление новых знаний в базе знаний не должно приводить к модификации разработанной системы [11]. Для реализации всех поставленных задач предлагается гибридный подход к извлечению прецедента. Степени сходимости признаков будут определяться на основе базы знаний медицинских терминов и признаков в сочетании с классическим методом K-ближайших соседей. Разработанное решение Для достижения поставленной цели были разработаны информационные (онтологии и порожденные на их основе БД) и программные (средства редактирования знаний и данных, а также решатель задач ) компоненты [12, 13]. Онтология базы знаний медицинских терминов, признаков и наблюдений описывает структуру используемых на практике медицинских терминов и наблюдений, а также структуру вспомогательной терминологии, необходимую для целостности описания медицинских знаний. В структуре онтологии использована синонимия. Структура описания признаков включает не только описание их имен, характеристик и возможных значений (качественных, количественных и интервальных), но и значения референсных диапазонов с учетом пола, возраста и состояний (например, беременность), а также различных факторов, таких как эпидемиологические (контакт с больным, контакт с животным, характер работы), аллергические, факторы риска (нездоровый образ жизни, вредность производства, сезонность). По данной онтологии формируется база знаний медицинских терминов и признаков (рис. 1). Все признаки или наблюдения подразделяются на простые, такие как «Пол», «Возраст», и составные, имеющие некоторый набор характеристик, например, признак «Боль в суставе» обладает характеристиками «локали- зация», «интенсивность», «периодичность», «характер». Возможные значения признаков (характеристик) разделяются на числовые и качественные. Все качественные значения имеют порядковую шкалу или же шкалу наименований [14]. Порядковая шкала предполагает ранжирование (упорядочение) значений признака в зависимо- сти от масштабирования. Значения в порядковой шкале обычно располагаются по возрастанию или убыванию, например, характеристика «интенсивность» признака «Головная боль» имеет следующие значения в порядковой шкале: очень слабая, слабая, умеренная, сильная, резкая, резчайшая. Шкала наименований содержит набор возможных значений признака, максимально отличающихся друг от друга. Онтология фармакологического справочника описывает элементы, позволяющие формально представить лекарственное средство в виде международного непатентованного наименования или фиксированной комбинации в его полном фармакологическом описании. Онтология истории болезни задает структуру описания здоровья человека на всем его жизненном пути. Данная структура позволяет описать сам прецедент, включающий все случаи оказания медицинской помощи, профилактических мероприятий, оперативно предоставить доступ к информации о проведенных исследованиях, случаях амбулаторно-поликлинического, стационарного и санаторно-курортного лечения пациента, вызовах скорой помощи, содержит раздел о противопоказаниях к применению тех или иных видов лечения для конкретного пациента и перечень непереносимых препаратов. Программные компоненты разрабатываемой системы включают в себя решатель задач и средства редактирования данных. Средства редактирования знаний и данных представлены рядом редакторов. Редактор знаний и данных, автоматически генерируемый по онтологии (генератор редакторов входит в состав платформы), обеспечивает порождение целевых ресурсов в соответствии с заданными правилами и контролирует выполнение онтологических соглашений. К тому же автоматически проверяется полнота сформированных данных. Решатель задач включает два компонента и разработан с использованием мультиагентного подхода. Первый компонент реализован на облачной платформе IACPaaS [15], здесь реализованы интерфейсная подсистема и первичная подготовка данных. Вторая часть выполнена как внешний агент, где происходит непосредственно расчет сходимости. Решатель представляет собой онтолого-ориентированный алгоритм, который для поиска похожих клинических случаев производит обход БП и попарно сопоставляет информацию из истории болезни пациента, а также приводит все наблюдения (признаки) к единой метрике. Первый компонент отвечает за выбор истории болезни (рис. 2), после чего она в формате JSON передается во второй компонент, где форматируется и для удобства расчета переносится в СУБД. Для этого все признаки и наблюдения сопоставляются с каждой своей характеристикой (при наличии) и записываются в качестве названия столбцов, в строках записываются их значения. Например, признак «Общая слабость» с характеристиками «Выраженность» и «Периодичность» в СУБД станет двумя признаками – «Общая слабость_Выраженность» и «Общая слабость_Периодич- ность» с соответствующими значениями. Затем происходит обход БП, где попарно сравниваются новый случай из истории болезни и прецедент, для чего каждому признаку (наблюдению) в истории болезни и прецеденте вместо значения присваивается некоторый числовой эквивалент от 0 до 10 в соответствии с базой медицинских терминов и знаний о наблюдениях. Если качественный признак имеет порядковую шкалу, то ему сопоставляется соответствующее число, где 0 соответствует минимально- му значению, а 10 максимальному. Так, напри- мер, признак «Головная боль» с характеристикой «Интенсивность», имея значение «умеренная», получит эквивалент 2,5 (рис. 3). Если используется шкала наименований, то в случае совпадения значений или же попадания в одно и то же интегрирующее значение признакам в истории болезни и прецеденте присваивается 0, то есть полное совпадение; если значения признаков различны, то одному присваивается 0, а другому 10, то есть максимальное различие. При расчете сходимости числовых значений эквивалент рассчитывается следующим образом: 0 сопоставляется диапазону нормы, а далее с шагом 0,6* диапазона этой нормы идем до нужного нам отрезка. Так, например, «Гемоглобин» со значением 103 из нового случая получает эквивалент –1, а значение 190 из прецедента – эквивалент 2 (рис. 4). Затем полученные значения необходимо сместить на начало диапазона 0–10, сохранив расстояние между ними, где 0 получает признак из нового случая, а 3 – признак из прецедента. Также следует учитывать, что максимальное расстояние не может быть более 10. Предполагается, что любые значения, расстояние между которыми превышает 10, для нас одинаково максимально непохожи. Также алгоритм работы решателя подразумевает обработку пропущенных признаков. Если признак отсутствует в прецеденте, то по этому признаку считается максимальное различие, если же в истории болезни – определяется частичная сходимость. Непосредственный расчет похожести случая из истории болезни и прецедента происходит через евклидово расстояние, а затем переводится в проценты. Такой подход позволяет определить сходимость значений признаков на основе его обобщенного, а не абсолютного значения с учетом различных факторов (пола, возраста, состояний и др.). Первые пять прецедентов, набравшие свыше 60 %, возвращаются в подсистему на платформе IACPaaS и предлагаются пользователю в качестве результатов работы (http://www.swsys.ru/uploaded/image/2023-3/2023-3-dop/1.jpg). После этого пользователь может провести уточненный поиск прецедента, выбрав интересующие его признаки. Заключение В работе описана реализация системы, помогающей врачу назначать медикаментозное лечение с учетом персональных данных пациента (анамнеза жизни, сопутствующих заболе- ваний, возраста, предъявляемых жалоб и др.) на основе рассуждения по аналогии (по прецедентам). Особенностями разработанной системы, принципиально отличающими ее от других медицинских систем, являются ориентация на широкий спектр заболеваний, а также использование гибридного метода извлечения прецедентов: с использованием знаний (базы знаний медицинских терминов и признаков) и метода K-ближайших соседей, позволяющего максимально точно рассчитать похожесть разнотип- ных признаков. Следует отметить, что истории болезни описываются в соответствии с терминологией, определенной медицинским сообществом, а изменение/дополнение базы медицинских терминов и знаний о наблюде- ниях не влияет на программные компоненты системы (не требуется модификация программных компонентов). Система реализована как облачный сервис, что позволяет увеличить аудиторию пользователей. Результатом работы системы является не только набор похожих историй болезни, но и демонстрация врачу похожих элементов текущей истории болезни с элементами историй болезни из ранжированного списка. Список литературы 1. Гаврилова А.С. Классификация интеллектуальных информационных систем // Информационные системы и технологии в моделировании и управлении: сб. тр. V Междунар. конф. 2020. С. 11–15. 2. Мехоношина Н.В. О системе поддержки и принятия решений в медицине на основе прецедентного подхода // Научная перспектива. 2016. № 11. С. 113–115. 3. Крылов А.В. Проблема извлечения знаний с использованием рассуждений на основе прецедентов // Изв. вузов. Приборостроение. 2018. Т. 61. № 11. С. 956–962. doi: 10.17586/0021-3454-2018-61-11-956-962. 4. Choudhury N., Begum S.A. A survey on case-based reasoning in medicine. IJACSA, 2016, vol. 7, no. 8, pp. 136–144. doi: 10.14569/IJACSA.2016.070820. 5. Nasiri S., Zenkert J., Fathi M. A medical case-based reasoning approach using image classification and text information for recommendation. In: LNTCS. Proc. IWANN, 2015, vol. 9095, pp. 43–55. doi: 10.1007/978-3-319-19222-2_4. 6. Юдин В.Н., Карпов Л.Е. Неполностью описанные объекты в системах поддержки принятия решений // Программирование. 2017. № 5. С. 24–31. 7. Khussainova G., Petrovic S., Jagannathan R. Retrieval with clustering in a case-based reasoning system for radiotherapy treatment planning. JPCS, 2015, vol. 616, art. 012013. doi: 10.1088/1742-6596/616/1/012013. 8. Hadj-Mabrouk H. Application of case-based reasoning to the safety assessment of critical software used in rail transport. Safety Sci., 2020, vol. 131, art. 104928. doi: 10.1016/j.ssci.2020.104928. 9. Полин Я.А., Зудилова Т.В., Ананченко И.В., Войтюк Т.Е. Деревья решений в задачах классификации: особенности применения и методы повышения качества классификации // Современные наукоемкие технологии. 2020. № 9. С. 59–63. doi: 10.17513/snt.38215. 10. Гаврилова Т.А., Страхович Э.В. Визуально-аналитическое мышление и интеллект-карты в онтологическом инжиниринге // Онтология проектирования. 2020. Т. 10. № 1. С. 87–99. doi: 10.18287/2223-9537-2020-10-1-87-99. 11. Ефименко И.В., Хорошевский В.Ф. Интеллектуальные системы поддержки принятия решений в медицине: ретроспективный обзор состояния исследований и разработок и перспективы // OSTIS. 2017. № 7. С. 251–260. 12. Грибова В.В., Окунь Д.Б. Онтологии для формирования баз знаний и реализации лечебных мероприятий в медицинских интеллектуальных системах // Информатика и системы управления. 2018. № 3. С. 71–80. doi: 10.22250/isu.2018.57.71-80. 13. Gribova V.V., Petryaeva M.V., Okun D.B., Tarasov A.V. Software toolkit for creating intelligent systems in practical and educational medicine. Proc. RPC, 2018, pp. 1–5. doi: 10.1109/RPC.2018.8482130. 14. Цветов В.П. О вложении измерительных шкал // Перспективные информационные технологии: тр. Междунар. науч.-технич. конф. 2018. С. 341–344. 15. Грибова В.В., Клещев А.С., Москаленко Ф.М., Тимченко В.А., Федорищев Л.А., Шалфеева Е.А. Облачная платформа IACPaaS для разработки оболочек интеллектуальных сервисов: состояние и перспективы развития // Программные продукты и системы. 2018. Т. 31. № 3. С. 527–536. doi: 10.15827/0236-235X.123.527-536. Reference List 1. Gavrilova, A.S. (2020) ‘Classification of intelligent information systems’, Information Systems and Technologies in Management Modeling, pp. 11–15 (in Russ.). 2. Mekhonoshina, N.V (2016) ‘On the system of support and decision-making in medicine based on a case-based approach’, Sci. Perspective, (11), pp. 113–115 (in Russ.). 3. Krylov, A.V. (2018) ‘The problem of knowledge retrieving with the use of precedent-based reasoning’, J. of Instrument Engineering, 61(11), pp. 956–962 (in Russ.) doi: 10.17586/0021-3454-2018-61-11-956-962. 4. Choudhury, N., Begum, S.A. (2016) ‘A survey on case-based reasoning in medicine’, IJACSA, 7(8), pp. 136–144. doi: 10.14569/IJACSA.2016.070820. 5. Nasiri, S., Zenkert, J., Fathi, M. (2015) ‘A medical case-based reasoning approach using image classification and text information for recommendation’, in: LNTCS. Proc. IWANN, 9095, pp. 43–55. doi: 10.1007/978-3-319-19222-2_4. 6. Yudin, V.N., Karpov, L.E. (2017) ‘Dealing with not fully described objects in decision support systems: Alternative approaches’, Programming and Comput. Software, (5), pp. 24–31 (in Russ.). 7. Khussainova, G., Petrovic, S., Jagannathan, R. (2015) ‘Retrieval with clustering in a case-based reasoning system for radiotherapy treatment planning’, JPCS, 616, art. 012013. doi: 10.1088/1742-6596/616/1/012013. 8. Hadj-Mabrouk, H. (2020) ‘Application of case-based reasoning to the safety assessment of critical software used in rail transport’, Safety Sci., 131, art. 104928. doi: 10.1016/j.ssci.2020.104928. 9. Polin, Ya.A., Zudilova, T.V., Ananchenko, I.V., Voytiuk, T.E. (2020) ‘Decision trees in classification problems: application features and methods for improving the quality of classification’, Modern High Technologies, (9), pp. 59–63 (in Russ.). doi: 10.17513/snt.38215. 10. Gavrilova, Т.A., Strakhovich, E.V. (2020) ‘Visual analytical thinking and mind maps for ontology engineering’, Ontology of Designing, 10(1), pp. 87–99 (in Russ.). doi: 10.18287/2223-9537-2020-10-1-87-99. 11. Efimenko, I.V., Khoroshevsky, V.F. (2017) ‘Intelligent decision support systems in medicine: state of the art and beyond’, OSTIS, (7), pp. 251–260 (in Russ.). 12. Gribova, V.V., Okun, D.B. (2018) ‘Ontologies for the formation of knowledge bases about disease treatment in medical intelligent systems’, Informatika i Sistemy Upravleniya, (3), pp. 71–80 (in Russ.). doi: 10.22250/isu.2018.57.71-80. 13. Gribova, V.V., Petryaeva, M.V., Okun, D.B., Tarasov, A.V. (2018) ‘Software toolkit for creating intelligent systems in practical and educational medicine’, Proc. RPC, pp. 1–5. doi: 10.1109/RPC.2018.8482130. 14. Tsvetov, V.P. (2018) ‘On attaching measuring scales’, Advanced Information Technologies: Proc. Intern. Sci. and Tech. Conf., pp. 341–344 (in Russ.). 15. Gribova, V.V., Kleschev, A.S., Moskalenko, F.M., Timchenko, V.A., Fedorischev, L.A., Shalfeeva, E.A. (2018) ‘IACPaaS cloud platform for the development of intelligent service shells: current state and future evolution’, Software & Systems, 31(3), pp. 527–536 (in Russ.). doi: 10.15827/0236-235X.123.527-536. |
Постоянный адрес статьи: http://swsys.ru/index.php?id=5023&like=1&page=article |
Версия для печати |
Статья опубликована в выпуске журнала № 3 за 2023 год. [ на стр. 486-492 ] |
Возможно, Вас заинтересуют следующие статьи схожих тематик:
- О некоторых проблемах предметной области поддержки принятия решений
- Интеллектуальная система, основанная на многоуровневой онтологии химии
- Система поддержки принятия решений по управлению рисками опасных ситуаций в сложных системах газоснабжения
- Информационная и алгоритмическая поддержка интеллектуальной системы экологического мониторинга воздуха на основе нейронных сетей
- Препроцессорная обработка множеств прецедентов для построения решающих функций в задачах классификации
Назад, к списку статей