Авторитетность издания
Добавить в закладки
Следующий номер на сайте
В Тюменском государственном университете создан программный комплекс – интеллектуальная система автоматического определения категории потенциальных адресатов текста.
15.11.2016Решение задач автоматической классификации текстов в последние годы стало одним из приоритетных направлений развития исследований в областях информационного поиска и искусственного интеллекта. Средства автоматической классификации текстов находят применение не только при отборе наиболее релевантных результатов поисковых запросов, но и при решении таких прикладных задач, как фильтрация спама, составление персональных подборок новостей, автоматическое аннотирование, снятие неоднозначности при автоматическом переводе, определение языка текста.
Задача классификации текстов подразделяется на две подзадачи: обучение классификатора и непосредственная классификация текстов. Наибольшую трудность при этом составляет первая подзадача, от успешности решения которой в итоге зависит достоверность проведенной классификации.
Для обучения классификатора прежде всего проводится построение модели текста
– представление в виде набора признаков. Решение задачи поиска
классификационных признаков зависит от тематики текстов и цели классификации.
Выделению значимых классификационных признаков посвящены работы многих
исследователей.
Подробное описание дается в статье «Интеллектуальная система автоматического определения категории потенциальных адресатов текста», автор Глазкова А.В. (Тюменский государственный университет, Тюмень).