№1

16 Марта 2024

2024

1. Вычисления обратных функций распределений: алгоритмы и программы [№2 за 2024 год]
Агамиров Л.В., Агамиров В.Л., Вестяк В.А.
Точный расчет ряда функций распределения случайных переменных в прикладных задачах математической статистики вызывает существенные вычислительные трудности, обусловленные наличием бесконечных пределов интегрирования, необходимостью минимизации целевых функций и отсутствием удовлетворительных аппроксимаций. Для решения поставленных задач авторами данной статьи получены точные аналитические соотношения, позволяющие производить численное интегрирование функций распределения коэффициента вариации и нецентрального распределения Стьюдента, сводящееся к вычислению однократных интегралов. Обратные функции распределения определяются минимизацией на основе симплекс-метода Нелдера–Мида. Аналогично решается задача точного вычисления числовых характеристик порядковых статистик. Разработаны алгоритмы и программы на Javascript с открытым кодом для реализации указанных вычислительных задач. Расчеты иллюстрируются графиками и таблицами, в которых представлены результаты вычисления квантилей нецентрального t-распределения Стьюдента в диапазоне объемов выборки от 3 до 50, вероятностей от 0,01 до 0,99 и доверительных вероятностей 0,9, 0,95 и 0,99. Время расчета в полном диапазоне всех параметров составляет не более 10–15 секунд на компьютере средней производительности, точность расчета – порядка 10-5. Отмечается, что основные временные затраты составляет численное интегрирование в связи с наличием бесконечных пределов интегрирования, в то время как минимизация осуществляется довольно быстро (не более 20–30 итераций). В статье также представлены результаты вычислений квантилей относительных коэффициентов вариации для объемов выборки 3–10, генеральных коэффициентов вариации 0,05, 0,3, 0,5 и вероятностей в диапазоне от 0,01 до 0,99. Выполнены сравни-тельные расчеты числовых характеристик нормальных и вейбулловских порядковых статистик, полученных прямым интегрированием и соответствующими аппроксимациями. В рассматриваемых программах применяются лишь простейшие и достаточно точные аппроксимации стандартных распределений: нормального распределения, гамма-функции, неполной гамма-функции. Разработанные алгоритмы пригодны для широкого класса непрерывных распределений, обратные функции которых не имеют приемлемых аппроксимаций.

2. Глобальная оптимизация на основе гибридизации алгоритмов роя саранчи и колонии пауков [№2 за 2024 год]
Родзин С.И.
Перспективным решением задач глобальной оптимизации являются метаэвристики, инспирированные природой. Они представляют собой недетерминированные алгоритмы, исследующие пространство поиска решений, обучающиеся в процессе поиска, не привязанные к конкретной задаче, хотя и не гарантирующие точного решения. Целью данного исследования является разработка эффективного алгоритма для решения прикладных проблем глобальной оптимизации многомерных мультиэкстремальных функций, встречающихся в задачах вычислительной филогенетики, при проектировании электрических схем, расчетах инженерной безопасности зданий, калибровке моделей распространения радиосигналов и в других. Для достижения этой цели предложен гибридный алгоритм, моделирующий паттерны поведения роя саранчи и колонии пауков. Основное внимание уделено снижению вероятности преждевременной сходимости гибридного алгоритма, поддержке баланса между скоростью сходимости алгоритма и диверсификацией пространства поиска решений (интенсификация/диверсификация). Приводятся этапы модифицированных алгоритмов колонии пауков и роя саранчи, моделирующих различные паттерны их поведения, что позволяет снизить влияние очень хороших или плохих решений на процесс поиска. Гибридизация алгоритмов осуществляется путем их последовательной комбинации (препроцессор/постпроцессор). Алгоритм экспериментально протестирован на семи известных многомерных функциях. Результаты сопоставлены с конкурирующими алгоритмами роя частиц, дифференциальной эволюции, колонии пчел. Предлагаемый алгоритм обеспечивает лучшие результаты для всех рассмотренных функций. Проверка полученных результатов с использованием Т-критерия суммы рангов Уилкоксона для независимых выборок показала, что результаты по алгоритму являются статистически значимыми. Разработанное программное приложение предназначено для использования в рамках университетского курса по машинному обучению и биоинспирированной оптимизации, а также для решения широкого круга научно-прикладных задач поисковой оптимизации.

3. Представление экономической концепции кластера с помощью специализированной онтологии [№2 за 2024 год]
Напольских Д.Л.
Объектом исследования является специализированная онтология как форма представления экономической концепции кластера для применения в интеллектуальных системах, предметом – иерархия понятий (классов) онтологии домена «Кластеры» и структура отношений между ними. Методологический инструментарий исследования составляют онтологический язык OWL второй версии, редактор онтологий и фреймворк для построения баз знаний Protégé, программные инструменты работы с онтологиями. В статье предлагается структурная схема, отражающая соотношение применяемых в рамках исследования инструментов. Описана последовательность этапов разработки специализированной онтологии для представления экономической концепции: определение перечня основных классов понятий онтологии, формирование таксономической иерархии предметной онтологии, разработка структуры составных понятий, входящих в онтологию, определение отношений между элементами онтологии. Представлен перечень основных классов онтологии домена «Кластеры», разработана таксономическая иерархия кластеров и экономических систем кластерного типа. В ходе исследования проведена систематизация совокупности используемых в рамках онтологии отношений. Помимо стандартных для Protégé универсальных отношений между объектом и классом, а также между подклассом и классом, были выделены 17 типов отношений, необходимых для полного представления концепции кластера. Предлагаемая онтология домена «Кластеры» является основой для интеллектуального анализа различных данных о кластерах в рамках научно-исследовательских задач и при реализации кластерной политики. Представленные в работе результаты являются основой для дальнейших исследований процессов интеграции инновационных кластеров, цифровых платформ и экосистем в контексте проблем управления региональным развитием.

4. Применение глубокого обучения в интерфейсах мозг–компьютер для распознавания движений [№2 за 2024 год]
Павленко Д.В., Татарис Ш.Э., Овчаренко В.В.
Перспективными направлениями применения машинного обучения являются анализ электроэнцефалограммы (ЭЭГ) и разработка нейроинтерфейсов, которые служат для помощи людям с ограниченными возможностями, а также в реабилитационных процедурах. Использование искусственных нейронных сетей позволяет значительно упростить разработку подобных устройств. Нейросети дают возможность автоматически выделять паттерны ЭЭГ, связанные с определенными состояниями, и проводить сложную обработку сигнала в режиме реального времени. Важным аспектом при создании нейроинтерфейсов является разработка программного обеспечения, способного детектировать и классифицировать движения пользователя. В рамках данного исследования решались задачи классификации паттернов сенсомоторных ритмов ЭЭГ, которые связаны с воображаемыми и реальными произвольными движениями верхних конечностей. Была разработана модель по аналогии с архитектурой модели EEGNet. Данная модель предназначена для анализа ЭЭГ в режиме реального времени с отечественного энцефалографа NVX52. Для этой цели были собраны два датасета с записями здоровых людей с использованием неполной международной схемы наложения электродов 10–10, которая включала в себя 32 канала. В ходе исследования удалось достичь точности классификации ряда воображаемых движений до 80 %, распознавания признаков реальных движений до 78 % и превысить показатели распознавания по сравнению с изначальной моделью более чем на 10 %. В перспективе планируется использование данной модели в коррекционных тренингах с применением комплекса, состоящего из неинвазивного интерфейса мозг–компьютер и экзоскелетов кистей рук. Такие комплексы используются в рамках мероприятий, направленных на реабилитацию детей, страдающих детским церебральным параличом.

5. Сравнительный анализ методов сжатия табличных данных [№2 за 2024 год]
Гарев К.В.
В работе проанализированы методы компрессии табличных данных, используемых в рамках функционирования платформы «Инфраструктура научно-исследовательских данных» (Платформа ИНИД). Оператором платформы является Российский центр научной информации. Основная цель исследования – выявление наиболее оптимальных методик сжатия данных, способных быть интегрированными в структуру Платформы ИНИД для доработки функционала по обмену и управлению научными данными. В ходе работы проведен тщательный анализ пяти наиболее популярных методов сжатия данных, доступных для реализации с использованием программных средств Python: Deflate (gzip), LZMA, Bzip2, Brotli и Snappy. Для каждой из рассмотренных технологий сжатия выявлены их преимущества и недостатки с учетом специфики обработки табличных данных, в том числе коэффициента сжатия, скорости обработки и степени сохранности информации. Результаты данного исследования могут использоваться в практике обмена, хранения, обработки и анализа табличных данных в рамках Платформы ИНИД. Особое внимание уделено анализу преимуществ и недостатков каждого из методов сжатия. Это позволяет сформировать рекомендации по выбору наиболее подходящих технологий, соответствующих строгим требованиям к производительности, эффективности сжатия и надежности сохранности данных. Важным аспектом исследования является фокусировка на возможности оптимизации процессов внутри Платформы ИНИД, что направлено на повышение ее эффективности как инструмента в области работы с научными данными. Кроме того, данная работа способствует углублению понимания потенциала применения современных методов сжатия данных в контексте практик обмена научными данными, открывая перспективу для дальнейших исследований и разработок в этой области.

6. Применение алгоритмов сжатия информации для задачи когнитивного отображения проектного пространства многослойных экранов защиты от радиации [№2 за 2024 год]
Зинченко Л.А., Казаков В.В., Карышев Б.В.
В статье рассмотрены особенности применения алгоритмов снижения размерности в задачах проектирования многослойных радиационно стойких экранов защиты электронной аппаратуры для использования в космическом пространстве. Алгоритмы проецируют исследуемые данные о многослойных защитных экранах из пространства с высокой размерностью в пространство с низкой размерностью. При этом сохраняется семантика данных, что позволяет визуализировать большие наборы информации высокой размерности и многократно упрощает пользовательский визуальный анализ, а также применение некоторых алгоритмов и подходов в автоматизированном режиме. В статье рассмотрено применение следующих алгоритмов снижения размерности: анализ главных компонент (PCA), анализ ядра главных компонент (KernelPCA), стохастическое вложение соседей с t-распределением (t-SNE), равномерное приближение и проекция (UMAP), автоэнкодер (AE), вариационный автоэнкодер (VAE). В случае нейросетевых архитектур сжатия представлены предлагаемые архитектуры сетей, используемые в расчетах и тестировании. По предложенной методике исследована целесообразность комбинации нескольких алгоритмов снижения размерности, применяемых по цепочке. На основании проведенного исследования сделан вывод о результативности применения указанных алгоритмов, а также их комбинации для последующей обработки или визуализации. Кратко рассмотрено программное обеспечение, реализующее один из предложенных подходов в анализе и обработке информации о многослойных радиационно стойких экранах защиты электронной аппаратуры для использования в космическом пространстве. В результате сделан выбор в пользу алгоритма UMAP. Для анализа конфигураций с достаточно большим количеством параметров рекомендуется использовать алгоритм t-SNE с предварительным сжатием алгоритмом UMAP, который упрощает исходный набор данных, улучшая результат работы t-SNE.

7. Сегментация файлов неисполняемых форматов для выявления угроз нарушения информационной безопасности, реализуемых в форме эксплоитов [№2 за 2024 год]
Архипов А.Н., Кондаков С.Е.
В статье описана прикладная задача сегментации файлов неисполняемых форматов с целью выявления угроз нарушения информационной безопасности, реализуемых в форме эксплоитов (вредоносного кода). Актуальность исследования обусловлена необходимостью решения научной задачи выявления эксплоитов, в том числе тех, для которых применялись технологии обфускации, и повышения эффективности подсистемы антивирусной защиты информации за счет повышения чувствительности и специфичности выявления эксплоитов. Цель авторов исследования – создание алгоритма сегментации файлов неисполняемых форматов, позволяющего представить их в виде блоков (фрагментов), обеспечивающих максимальную вероятность вхождения в их состав элементов эксплоита. Сегментация файлов неисполняемых форматов применяется для обеспечения возможности последующего углубленного анализа не всего файла целиком, а его фрагментов на наличие вредоносного кода. Предметом исследования является множество методов, методик, моделей, алгоритмов сегментации файлов неисполняемых форматов с целью выявления угроз нарушения информационной безопасности, реализуемых в форме эксплоитов (вредоносного кода). В работе применяются научные методы анализа, измерения и сравнения. Авторами данной статьи разработан алгоритм сегментации, который позволяет представить файл неисполняемого формата в виде блоков оптимальных размеров, необходимых для выявления в их составе элементов эксплоита. Алгоритм базируется на математической модели эксплоита, внедренного в файл неисполняемого формата, разработанной авторами и математически описывающей структуру, составные элементы и показатели, характеризующие его. Предлагаемый алгоритм может использоваться для создания новых методов, методик, моделей, алгоритмов и средств, направленных на повышение эффективности защиты информации от воздействия вредоносного кода, распространяемого в форме эксплоитов, в том числе созданных с применением технологий обфускации (запутывания) программного кода.

8. Реализация программного комплекса психодиагностики с обратной связью на основе компьютерного зрения [№2 за 2024 год]
Иващенко А.В., Александрова М.В., Жейков Д.С., Мазанкина Е.В., Захарова Е.В., Колсанов А.В.
В статье представлен программный комплекс психодиагностики, позволяющий учитывать вовлеченность респондентов при прохождении тестов. Предметом исследования является управление глубиной погружения пользователей интерактивных пользовательских интерфейсов. Предлагается формальная модель иммерсивной среды, предназначенная для реализации системы управления погружением пользователя в процессы человеко-компьютерного взаимодействия путем мониторинга и контроля выполняемых действий в ответ на возникающие события. В качестве таких событий могут рассматриваться воздействия на пользователя в реальном мире, а также аудиовизуальные стимулы, формируемые в иммерсивной среде автоматически. Ответное поведение должно включать цепочки действий, автоматически фиксируемые средствами компьютерного зрения и окулографии. Разработанный программный комплекс психологической диагностики и медицинской реабилитации позволяет в отличие от аналогов реализовать обратную связь по мониторингу и контролю вовлеченности пациентов. Для этого в состав системы входит подсистема компьютерного зрения, включающая видеокамеру и программное обеспечение видеоконтроля двигательной активности пациента. Программное обеспечение отслеживает общий объем мимических движений, движений головы, а также идентифицирует текущее эмоциональное состояние с помощью искусственной нейронной сети. Для обеспечения высокой вовлеченности пользователя предусмотрена персонификация пользовательского интерфейса и тестов. Практическая значимость работы состоит в реализации мониторинга вовлеченности пациентов при прохождении психологического тестирования и использования этой информации для персонификации медицинских услуг. Анализ вовлеченности пользователей программного комплекса психологической диагностики позволяет дополнить результаты психологического тестирования и адаптировать последовательность и содержание тестов, сохраняя интерес пользователя и снижая влияние внешних раздражителей.

9. Автоматическая генерация заданий по результатам анализа использования их банка в интеллектуальной обучающей системе [№2 за 2024 год]
Сычев О.А., Прокудин А.А., Денисов М.Е.
Развитие методов генерации учебных заданий и их классификации для применения в учебном процессе позволило реализовать интеллектуальную обучающую систему, способную при необходимости автоматически генерировать задания в фоновом режиме. В статье описана архитектура интеллектуальной обучающей системы с фоновой генерацией заданий, рассмотрена система CompPrehension, реализующая этот принцип. Для решения проблемы использовались методы символьного искусственного интеллекта и онтологических рассуждений, объектно-ориентированного проектирования и программирования, а также системного анализа. В работе представлены основные функциональные элементы таких компонентов системы, как тренажер, банк заданий, генератор заданий и домен (предметная область), а также их взаимодействие с БД для хранения заданий и с машинами вывода для их решения. Апробация подхода на банке заданий по определению порядка выполнения операторов в выражении показала способность системы избирательно пополнять несбалансированный банк, исходя из его состава и истории запросов на поиск заданий в нем. Менее чем за пять суток было сгенерировано несколько тысяч заданий на каждый концепт с недостаточным числом заданий. Это дает низкую вероятность получения одинаковых заданий даже при одновременном тестировании сотен студентов. Результаты исследования имеют практическую значимость для учебных заведений, стремящихся совершенствовать обучающий процесс.

10. Инжиниринг цифрового тренажера для обучения операторов формования листового стекла [№2 за 2024 год]
Мешалкин В.П., Чистякова Т.Б., Петров Д.Ю.
В статье проведен анализ формования листового стекла флоат-методом, определены виды нештатных ситуаций технологического процесса. Выполнен кластерный анализ множества нештатных ситуаций, каждая из которых описана как теоретико-множественная модель. Для упрощения интерфейса цифрового тренажера разработаны модели бизнес-процессов для обучения и аттестации операторов. На основе анализа существующих бизнес-процессов предприятия в нотации BPMN 2.0 разработаны логико-информационные модели перспективных бизнес-процессов Разработка тестов и Аттестация сотрудников. При разработке архитектуры, режимов функционирования и программно-информационного обеспечения цифрового тренажера использована методика model-based system engineering, реализованная в среде визуального моделирования IBM Rhapsody на основе нотаций UML и SysML. Разработаны диаграммы вариантов использования и диаграммы классов цифрового тренажера с использованием языка UML, а также структура БД системы обучения, включающая критерии группировки ситуаций, характеристики ситуаций, функции пользователей системы, и структура ПО. Реализованы основные функции – обучение и тестирование операторов, ведение БД персонала цифрового тренажера, составление отчетов по результатам тестирования, редактирование БД по аварийным ситуациям на основе предварительного анализа опыта технологов и операторов. Цифровой тренажер разработан на языке PascalABC, для записи результатов использована текстовая БД. Разработан пользовательский интерфейс цифрового тренажера.

| 1 | 2 ►