Авторитетность издания
Добавить в закладки
Следующий номер на сайте
В МГУ имени М.В. Ломоносова создана система проектирования лингвистических процессоров Treeton
22.04.2009Вместо аннотаций в Treeton используются структуры, называемые тринотациями. Понятие тринотации является расширением понятия аннотации. Тринотация – это аннотация, которой приписан лес (множество корневых деревьев), в узлах его стоят другие тринотации, а дугам приписаны синтаксические связи. Дополнительно выделяется служебный тип связи, означающий, что одна тринотация является составляющей другой. Для описанной структуры должен выполняться ряд аксиом.
Понятие тринотации оказывается очень близким к определению размеченной системы синтаксических групп. Тринотации удобны для моделирования синтаксических структур в рамках различных подходов к описанию поверхностного синтаксиса. Возможно использование деревьев зависимостей, систем составляющих и смешанных подходов.
Система Treeton позволяет работать с тринотациями. Во-первых, существует программный интерфейс, с помощью которого можно производить элементарные преобразования над множеством тринотаций. Во-вторых, есть готовые модули, решающие определенные задачи с помощью тринотаций. Среди них следует выделить модуль синтаксического анализа Treevial.
Подробное описание дается в статье «Система Treeton: анализ под управлением штрафной функции», авторы – Мальковский М.Г., Старостин А.С. (Московский государственный университет имени М.В. Ломоносова).