Прохоров С.А. (sp.prokhorov@gmail.com) - Самарский государственный аэрокосмический университет им. С.П. Королева (национальный исследовательский университет) (профессор, зав. кафедрой), Самара, Россия, доктор технических наук, Куликовских И.М. (kulikovskikh.i@gmail.com) - Самарский государственный аэрокосмический университет им. С.П. Королева (национальный исследовательский университет) (доцент), Самара, Россия, кандидат технических наук | |
Ключевые слова: комплекс программ, метод ортогональных разложений, пространственная схема, интеллектуальный анализ данных |
|
Keywords: software, orthogonal transformation, spatial scheme, data intelligent analysis |
|
|
В последнее время широкое применение получили программные продукты интеллектуального анализа данных «Data Mining», являющиеся междисциплинарной областью и развивающиеся на базе широкого пласта знаний: экспертные системы, информационный поиск, оперативная аналитическая обработка, теория БД, хранилища данных, эффективные вычисления, статистика, нейросети, распознавание образов [1–3]. Большинство систем интегрируют сразу несколько подходов, но каждая имеет ключевую компоненту.
Как было отмечено, разработка программного продукта в рамках «Data Mining» предполагает наличие ступенчатой платформы анализа данных, каждый уровень которой включает набор программ в соответствии с представленной структурной схемой (см. рис. 2). Опишем программное наполнение каждого из уровней. Поверхностный уровень содержит программы – ввода и интерпретации данных; – построения и преобразования корреляционной функции (КФ) (включает часть программы, связанной с построением КФ); – построения простейших ортогональных функций; – построения модели КФ в простейших базисах; – построения модели спектра в простейших базисах; – имитационного моделирования; – обработки внешних данных; – формирования отчетов. Глубокий уровень содержит программы – построения и преобразования КФ (включает часть программы, связанной с преобразованием КФ); – построения обобщенных ортогональных функций; – построения модели КФ в обобщенных базисах; – построения модели спектра в обобщенных базисах. Скрытый уровень представляет собой программу, реализующую технологию аналитической обработки данных (рис. 3). Предлагаемая технология включает следующие этапы: формирование набора данных, его распределение, построение моделей в рамках аналитического подхода [6, 7], реализация механизмов поиска скрытых закономерностей. На первом этапе формируется исходный набор данных: происходит загрузка данных из файла либо генерирование совокупности выборок, подлежащих дальнейшему анализу. На втором этапе сформированные наборы данных распределяются по анализируемым характеристикам li (i – порядок анализируемой характеристики). На третьем этапе осуществляется построение корреляционно-спектральных характеристик (функциональных и обобщенных) в рамках аналитического подхода. На последнем этапе выполняется поиск скрытых закономерностей на основе разработанных механизмов по полученным моделям корреляционно-спектральных характеристик.
Таким образом, разработанная пространственная схема взаимодействия объектов позволяет создавать программные продукты, предполагающие наличие поэтапной обработки исходной информации. При этом построение данной схемы производится на различных уровнях создания конечного продукта: – на уровне программного кода при описании математических моделей, положенных в основу работы программного модуля; – на уровне объектов и модулей при описании конечной программы, входящей в комплекс программ; – на уровне формирования комплекса на основе имеющихся программ в зависимости от поставленной задачи. Применение пространственной схемы взаимодействия объектов позволит снизить ресурсные и временные затраты на получение конечного продукта, а при создании комплекса программ в рамках систем «Data Mining» организовать ступенчатую платформу анализа данных. Литература 1. Data Mining Community's Top Resource. URL: http://www.kdnuggets.com (дата обращения: 01.06.12). 2. Knowledge Discovery Through Data Mining: What Is Knowledge Discovery? USA, California, Tandem Computers Inc., 1996. 3. Дюк В.А. Data Mining – интеллектуальный анализ данных. СПб: СПИИ РАН: URL: http://www.inftech.webservis.ru/it/ database/datamining/ar2.html (дата обращения: 01.06.2012). 4. Джексон Д. Ряды Фурье и ортогональные полиномы; [пер. с англ.]. М., Л.: Глав. изд-во иностран. лит-ры, 1948. 5. Дедус Ф.Ф., Махортых С.А., Устинин М.Н., Дедус А.Ф. Обобщенный спектрально-аналитический метод обработки информационных массивов. Задачи анализа изображений и распознавания образов. М.: Машиностроение, 1999. 357 с. 6. Прохоров С.А., Куликовских И.М. Численно-аналитический подход к вычислению интегралов при построении ортогональных моделей // Вестн. СамГТУ: Физматнауки. 2009. № 2 (19). С. 140–146. 7. Прохоров С.А., Куликовских И.М. Применение метода ортогональных разложений для выявления зависимостей между характеристиками ортогональных базисов // Аналитические и численные методы моделирования естественно-научных и социальных проблем: сб. стат. IV Междунар. науч.-технич. конф. Пенза: Приволж. дом знаний, 2009. С. 81–83. |
http://swsys.ru/index.php?id=3200&lang=%E2%8C%A9%3Den&like=1&page=article |
|