Авторитетность издания
Добавить в закладки
Следующий номер на сайте
В Российском государственном социальном университете рассмотрена актуальная проблема наличия ошибок в обучающих выборках, предназначенных для последующего построения по методу прецедентов решающих функций, используемых в задачах классификации новых объектов.
28.07.2016В последнее время интенсивно развивается группа методов под общим названием Data Mining, ориентированных прежде всего на обработку массивов данных значительного размера, содержащих информацию об интересующих объектах, с целью извлечения из них сведений требуемого вида. Как правило, на первом этапе исследования выделяемых объектов решается задача классификации, в которой каждый такой экземпляр должен быть отнесен к какому-либо из уже известных непересекающихся классов объектов Ai из общей совокупности {A} = {A1, A2, …, Ak}. Обычно индивидуальные свойства исследуемых объектов выражают через значения их существенных характерных числовых признаков: {х1, х2, …, хn}. При этом каждому исследуемому объекту с номером s взаимно-однозначно соответствует своя точка {a1s, a2s, …, ans} в n-мерном пространстве значений признаков U, на котором введена некоторая мера r. Такой подход позволяет геометрически иллюстрировать методы классификации в n-мерных метрических пространствах.