Авторитетность издания
ВАК - К1
RSCI, ядро РИНЦ
Добавить в закладки
Следующий номер на сайте
№3
Ожидается:
16 Сентября 2025
Статьи из выпуска № 1 за 2025 год.
Упорядочить результаты по: Дате публикации | Заголовку статьи | Авторам | |
1. Методы и средства извлечения терминов из текстов для терминологических задач [№1 за 2025 год]
Авторы: Большакова Е.И., Семак В.В.
Просмотров: 2885
В статье рассматривается современное состояние области автоматического извлечения терминов из специализированных текстов на естественном языке, включая научно-технические документы. К числу актуальных практических приложений методов и средств извлечения терминов из текстов относятся создание терминологических словарей, тезаурусов и глоссариев предметных областей, а также выявление ключевых слов и построение предметных указателей для узкоспециализированных документов. Представлен обзор подходов к автоматическому распознаванию и извлечению терминологических слов и словосочетаний, охватывающих традиционные статистические методы, а также методы на основе машинного обучения, включая обучение по признакам терминов и с применением современных нейросетевых языковых моделей. Проводится сравнение подходов, в том числе оценки качества распознавания и извлечения терминов, указываются наиболее известные программные средства для автоматизации извлечения терминов в рамках статистического подхода и обучения по признакам. Описываются исследования, проведенные авторами для распознавания терминов на базе нейросетевых языковых моделей применительно к обработке научных текстов по математике и программированию на русском языке. Кратко характеризуется набор данных с терминологической разметкой, созданный для обучения программных моделей распознавания терминов и охватывающий данные семи близких предметных областей. Программные модели разработаны на основе предобученной нейросетевой модели BERT c ее дообучением двумя способами: как бинарного классификатора терминов-кандидатов (предварительно извлеченных из текстов) и как классификатора для последовательной разметки терминологических слов в обрабатываемых текстах. Для разработанных моделей экспериментально определены оценки качества распознавания терминов, проведено сравнение со статистическим методом. Лучшие результаты продемонстрировали модели бинарной классификации, существенно превосходя остальные рассмотренные подходы. Проведенные эксперименты показывают применимость обученных моделей и для текстов близкой научной области.
2. Авторская метрика оценки близости программ: приложение для поиска уязвимостей с помощью генетической деэволюции [№1 за 2025 год]
Авторы: Буйневич М.В., Израилов К.Е.
Просмотров: 2218
Актуальность темы статьи обусловлена наличием в сфере информационной безопасности задач, требующих сравнения программ в их различных представлениях, таких, как текстовый ассемблерный код (например, для поиска уязвимостей или подтверждения авторства). В работе представлена метрика близости двух текстов в виде списка строк из символов, являющаяся развитием ее предыдущей версии. Основным результатом текущего исследования (как части главного, направленного на генетическую деэволюцию программ) являются сама метрика, а также ее характеристики и особенности, выявленные с помощью проведенных экспериментов. Метрика представлена в аналитическом виде, программно реализована на языке Python, принимает на вход два списка символьных строк для сравнения и коэффициенты учета позиции ее элементов от начала списка и последовательности символов. Результатом ее вычисления является числовое значение в диапазоне от 0 до 1. Новизна метрики заключается в достаточно точной и чувствительной оценке близости двух текстов независимо от форматов представления данных; текущая версия метрики отличается от предыдущей учетом указанных коэффициентов. Теоретическая значимость заключается в развитии способов сравнения произвольных текстов, представляющих собой список символьных строк, содержащих информацию, последовательно излагаемую согласно определенной логике (что требует учета позиции). Помимо общего назначения сравнительных инструментов такого рода, практическая значимость метрики состоит в возможности определения близости двух программ, имеющих бинарное представление машинного кода, предварительно преобразованное в текстовое представление ассемблерного кода.
3. Определение принципов проектирования отечественной платформы обмена научными датасетами [№1 за 2025 год]
Автор: Гарев К.В.
Просмотров: 1884
В работе рассматриваются предпосылки и предложения по созданию отечественной платформы обмена научными датасетами в контексте глобальных тенденций, связанных с развитием открытой науки и распространением FAIR-принципов. На основе анализа зарубежных инициатив (EUDAT, EOSC, DataONE, Dryad, Zenodo) выявляются ключевые проблемы, затрудняющие эффективное использование, сохранение и повторное применение научных данных. К таким проблемам относятся отсутствие единых регламентов для описания датасетов, разрозненность инфраструктурных решений, недостаточная межплатформенная совместимость, а также сложность обеспечения воспроизводимости исследований. Особое внимание уделяется роли профессионального сообщества, важности формирования среды для обмена опытом, проведения междисциплинарных проектов и совершенствования навыков работы с большими массивами данных. При этом подчеркивается необходимость систематизации работы с научными данными и унификации требований к их сбору, хранению, обработке и представлению, что позволит повысить прозрачность исследовательских процессов. В статье обоснована целесообразность внедрения механизмов распределенного хранения, федеративной аутентификации и высокопроизводительных вычислительных ресурсов, способных удовлетворять потребности отечественного научного сообщества. Выдвигаются предложения по проектированию единой платформы обмена научными датасетами – от разработки методологических регламентов и стандартов взаимодействия с внешними системами до принципов интеграции инструментов аналитики и обеспечения надежной защиты данных.
4. Улучшение эргономических показателей наголовной индикации в очках дополненной реальности для применения в гражданской авиации [№1 за 2025 год]
Авторы: Грешников И.И., Давыдов Д.А., Гончар Б.И., Соколов А.В., Коновалова Д.В.
Просмотров: 1748
В статье проводится анализ существующих решений в области наголовной индикации. Предлагается собственная концепция представления пилотажно-навигационной информации в очках дополненной реальности для применения в гражданской авиации. Основным назначением разработанной индикации является предоставление пилоту необходимой пилотажно-навигационной информации на целевом этапе полета. Метод исследования заключался в анализе существующих решений, выявлении их недостатков и в корректировке разработанной индикации на основе рекомендаций опытных пилотов. В процессе работы были определены основные особенности представления пилотажно-навигационной информации, способствующие улучшению эргономических показателей: использование независимых слоев графических объектов пилотажно-навигационной информации, изменение компоновки изображения в зависимости от фазы полета, использование нескольких цветов, возможность голосового управления для отображения нужного слоя индикации. В результате реализовано программное обеспечение, позволяющее проецировать графические изображения мнемосимволов пилотажно-навигационной информации на имитируемую средствами среды Unity закабинную обстановку. Данные объекты индикации размещены с привязкой к следующим параметрам или к их комбинации: положение очков, вектор путевой скорости, строительная ось самолета, закабинное пространство. Разработанное программное обеспечение позволяет также добавлять графические слои от систем синтезированного и улучшенного видения. В статье представлен демонстратор наголовной индикации, созданный на основе данной концепции. Рассмотрены архитектура и функциональность демонстратора, включая видимые пилотом изображения в очках дополненной реальности. Практическая значимость данной работы заключается в улучшении эргономических показателей наголовной индикации по сравнению с существующими вариантами представления пилотажно-навигационной информации.
5. База данных по процессам микробиологической очистки сточных вод и почвы как эффективный инструмент представления данных и знаний [№1 за 2025 год]
Авторы: Досаев А.А., Скичко А.С., Меньшутина Н.В.
Просмотров: 2342
Объектом представленного исследования является системный анализ процессов микробиологической очистки сточных вод и почвы с последующей разработкой базы данных. Актуальность работы обусловлена проблемой неструктурированности больших объемов поступающей разнородной информации по данному направлению. Проведен анализ литературы с описанием существующих баз данных по микробиологической очистке и с указанием их достоинств и недостатков. Дано обоснование актуальности разработки базы данных, объединяющей все ключевые составляющие процессов микробиологической очистки сточных вод и почвы. Проведенсистемный анализ предметной области, с использованием системного подхода построена архитектура хранения данных. Отмечены достоинства разработанной системы, показаны примеры выполнения поисковых запросов. Разработанная база данных «Микробиологическая очистка» содержит обширную информацию о загрязняющих веществах и микроорганизмах с описанием процессов микробиологической очистки. Предлагаемая система хранения данных может быть полезна исследователям, областью научных интересов которых являются процессы микробиологической очистки, микробиология, химия и химическая технология. Она позволит уменьшить время на поиск информации при выполнении научно-исследовательских работ.
6. Фреймворк для автоматизации прогнозирования остаточного ресурса оборудования при построении проактивных систем поддержки принятия решений [№1 за 2025 год]
Авторы: Задиран К.С., Волкова Д.А., Щербаков М.В.
Просмотров: 2534
В статье описан фреймворк, разработанный для автоматизации исследований в области проектирования проактивных систем поддержки принятия решений. В частности, исследуется задача анализа и прогнозирования временных рядов с целью создания инструментов автоматизации прогнозирования различных процессов в системах управления активами, в том числе технического обслуживания и ремонта. Определена роль процессов автоматизации в управлении активами в этих системах. В работе выделены основные факторы, влияющие на выбор программы для реализации системы предиктивной аналитики. Предложен алгоритм решения задачи прогнозирования оставшегося срока службы на основе анализа данных о производственных активах с использованием компонентов искусственного интеллекта. Предлагаемое программное решение, основанное на CRISP-DM, не является отдельным программным продуктом и может быть встроено в существующее программное обеспечение, поддерживая возможность модификации методов. Фреймворк выполняет следующие функции: загрузка и предобработка данных, построение моделей прогнозирования, прогнозирование временных рядов, оценка прогноза. Разработанный фреймворк обладает гибкой модульной архитектурой для добавления новых методов анализа и прогнозирования. Возможность на основе имеющихся базовых классов переопределить и реализовать собственные источники данных, стадии предобработки, модели прогнозирования и метрики расширяет вариативность и повышает эффективность его функционирования. В статье приведен пример использования фреймворка для решения задачи анализа временных рядов и определения оставшегося срока службы оборудования, демонстрирующий эффективность разработанного продукта в области исследования данных и искусственного интеллекта.
7. Моделирование температурных полей при аддитивном производстве металлических изделий [№1 за 2025 год]
Авторы: Какорин Д.Д., Марголис Б.И.
Просмотров: 2748
В статье обоснована необходимость исследования характера распределения температуры при аддитивном производстве металлических изделий. Рассмотрены особенности моделирования температурного поля, возникающего в процессе послойной электродуговой наплавки металлических деталей плоской геометрической формы с учетом несимметричного конвективно-радиационного теплообмена поверхности с окружающей средой. Подробно описана методика расчета температурного поля в двухмерных пространственных координатах на основе численных конечноразностных методов. При этом учтены возможности сдвига начальной точки наплавленного слоя от края основания, изменения времени выдержки между наплавляемыми слоями и применения принудительного воздушного охлаждения металла. Рассмотрен механизм определения температуры в граничных точках конструкции, непосредственно контактирующих с расплавленным металлом. Разработана программа в среде MATLAB, позволяющая на основе заданных теплофизических характеристик наплавляемого металла, параметров конвективно-радиационного теплообмена и геометрических характеристик наплавляемой конструкции моделировать температурное поле в изделии. Приведены тексты функций TempSurfacing для моделирования температурного поля и TempDepend для учета зависимости теплофизических свойств металла от его температуры перед наплавкой нового слоя. Проверена работоспособность программы на примере наплавки одного слоя металла высотой 2 мм на металлическое основание высотой 5 мм. Показан внешний вид окна программы для ввода исходных данных, и приведены результаты моделирования температурного поля в двухмерных пространственных координатах в текстовом, а также графическом видах. Полученная модель температурного поля позволяет учесть прибавление новых частей металла по длине наплавляемого слоя, а также поэтапное увеличение высоты конструкции за счет послойного наплавления металла. Разработанная модель предназначена для установления оптимального термического цикла процесса послойного электродугового наплавления и идентификации условий теплообмена с учетом изменения рабочих параметров технологического процесса аддитивного производства.
8. Генетический алгоритм размещения требований в задаче планирования производственных процессов потокового типа [№1 за 2025 год]
Авторы: Кибзун А.И., Рассказова В.А.
Просмотров: 2584
В статье рассматривается задача планирования производственных процессов потокового типа. В рамках каскадной схемы комплексное решение охватывает этап назначения подготовительных агрегатов и последующий этап формирования детализированных технологических маршрутов для исполнения заданного множества требований точно в срок и с учетом ограничений на допустимые длительности обработки на каждом переделе. Данная схема реализуется в составе проблемно-ориентированного вычислительного комплекса, однако по ряду естественных причин задача может оказаться несовместной уже на этапе назначения подготовительных агрегатов. Один из путей преодоления обозначенных трудностей – разработка и реализация алгоритмов штрафных функций для поиска максимальных совместных подсистем в противоречивых задачах оптимизации. В настоящей работе для этих целей предлагается идеологически другой подход, основанный на рассмотрении предварительного этапа размещения требований таким образом, чтобы последующие этапы решения комплексной задачи были гарантированно разрешимы. Размещение требований формализуется как задача поиска отображения установленного вида, оптимального по эвристическому критерию потенциальной нагрузки на подготовительные агрегаты в рассматриваемом периоде планирования. Для решения этой задачи авторы статьи разработали генетический алгоритм, что обусловило существенное преимущество по быстродействию в сравнении с фундаментальными подходами математического программирования (например, в сравнении с моделями целочисленного линейного программирования). В целях снижения рисков вымирания популяции на каждой итерации генетического алгоритма применяется правило безусловной миграции представителя с наименьшим значением критерия. Такой подход обеспечивает также эффективные показатели сходимости алгоритма по числу итераций без существенного улучшения целевого функционала. Разработанный генетический алгоритм реализуется как автономный модуль вычислительного комплекса для решения задач планирования процессного производства. Вычислительный эксперимент проводится с использованием данного модуля в разрезе сравнительного анализа качества решения исходной комплексной задачи.
9. Гибридный подход к выделению структурированных данных из «Летописи жизни и творчества А.С. Пушкина» [№1 за 2025 год]
Авторы: Кокорин П.П., Котов А.А., Кулешов С.В., Зайцева А.А.
Просмотров: 2504
Статья посвящена решению проблемы создания программной инфраструктуры для систематизации, аннотирования, хранения, поиска и публикации рукописей и иных материалов, представленных в цифровом виде. Исследование построено на материалах, связанных с жизнью и творчеством А.С. Пушкина и составляющих важную часть научно-просветительского ресурса «Пушкин цифровой». Актуальность решаемой проблемы обусловлена необходимостью сохранения авторского наследия русских писателей в условиях цифровой трансформации предметной области филологических, источниковедческих и библиографических исследований их трудов, что является частью национальных проектов Российской Федерации «Образование», «Культура», «Наука и университеты». В данном контексте особую роль играет решение задачи извлечения структурированного текста из растровых изображений страниц томов «Летописи жизни и творчества А.С. Пушкина» для использования в разрабатываемых системах хранения, систематизации, публикации материалов библиотечных, архивных, музейных, фонографических и иных фондов и коллекций и частичной автоматизации филологических, источниковедческих и библиографических исследований. В работе предложен гибридный подход, основанный на использовании априорных данных о структуре элементов верстки страницы, технологиях OCR – распознавание текста на базе библиотеки Tesseract и методах верификации. Особенностью разработанных методов верификации является использование регулярных выражений для извлечения структурированных данных из предварительно распознанного текста и автоматизированного конвейера обработки текстов в сборочной системе GitLab. Приведены результаты применения предложенного гибридного подхода. Показано, что этот подход дает удовлетворительные результаты, обеспечивая минимизацию ручной постобработки полученных данных путем вычитки результатов, размещаемых на научно-просветительском ресурсе. Полученные результаты могут использоваться не только в разрабатываемом ресурсе «Пушкин цифровой», но и в других проектах, в основе реализации которых лежит необходимость распознавания и автоматизированной обработки больших объемов оцифрованных авторских текстов, архивных и других бумажных документов.
10. Планирование вычислений в системах реального времени: эффективные алгоритмы построения оптимальных расписаний [№1 за 2025 год]
Авторы: Кононов Д.А., Фуругян М.Г.
Просмотров: 1927
В статье рассматриваются вопросы, связанные с разработкой одного из основных блоков вычислительной системы реального времени – блока планирования вычислений. Предлагаются алгоритмы построения оптимальных расписаний для различных случаев в зависимости от числа процессоров и характеристик работ и ресурсов вычислительной системы. Для однопроцессорного случая с прерываниями и директивными интервалами усовершенствован алгоритм относительной срочности путем использования кучи для хранения данных. Это способствовало понижению вычислительной сложности алгоритма. Разработан алгоритм для задачи с частичным порядком выполнения работ, основанный на предварительной коррекции моментов готовности и директивных сроков и на сведении исходной задачи к задаче без отношений предшествования. Для многопроцессорного случая с прерываниями и директивными интервалами предложен приближенный алгоритм, основанный на обобщении однопроцессорного алгоритма относительной срочности на случай нескольких процессоров. Проведен сравнительный анализ с точным потоковым алгоритмом. Доказано, что в случае учета временных издержек на прерывания и переключения задача является NP-трудной. Для многопроцессорного случая без прерываний и переключений с общим директивным интервалом для всех работ и идентичными процессорами разработан псевдополиномиальный алгоритм, основанный на ограниченном переборе вариантов. Создан приближенный алгоритм для системы с возобновляемыми и невозобновляемыми ресурсами, а также для комплекса со смешанным набором работ (как непрерываемых, так и допускающих прерывания и переключения). Алгоритм основан на сетевом моделировании и сведении исследуемой задачи к поиску потока с определенными свойствами в специальной сети.
| 1 | 2 | Следующая → ►