Авторитетность издания
Добавить в закладки
Следующий номер на сайте
В Санкт-Петербургском государственном университете аэрокосмического приборостроения совместно с Санкт-Петербуржским государственным электротехническим университетом «ЛЭТИ» им. В.И. Ульянова (Ленина) предложен новый метод классификации текстов
27.05.2026Эксперимент, проведенный для разных длин векторов, показал преимущество предложенного метода перед базовым. Он демонстрирует точность классификации текстов выше 0,9 и с увеличением длины вектора сравниваемых строк текстов достигает 0,97. Оценка точности базового классификатора текстов на тех же примерах выросла с 0,28 до 0,68, поскольку он не обучаем, то повысить значение не представляется возможным.
Учет семантической близости не только снижает ошибку классификации, но и время выполнения (получения) результата.
Подробное описание дается в статье «Практические аспекты применения расстояния Дамерау – Левенштейна в задачах классификации текста», авторы Татарникова Т.М. («Санкт-Петербургский государственный университет аэрокосмического приборостроения», г. Санкт-Петербург), Миляев Д.Р. («Санкт-Петербургский государственный электротехнический университет “ЛЭТИ”» им. В.И. Ульянова (Ленина)», г. Санкт-Петербург).


