На правах рекламы:
ISSN 0236-235X (P)
ISSN 2311-2735 (E)

Авторитетность издания

ВАК - К1
RSCI, ядро РИНЦ

Добавить в закладки

Следующий номер на сайте

2
Ожидается:
16 Июня 2024

В Московском государственном университете им. М.В. Ломоносова совместно с компанией ABBYY исследовался подход к решению задачи автоматического синтаксического анализа.

22.10.2014

Актуальность и практическая значимость задачи автоматического синтаксического анализа текстов на естественном языке не вызывает сомнений. Ее часто приходится решать в рамках более крупных задач, таких как информационный поиск, извлечение информации, автоматическое реферирование, машинный перевод.

Главной причиной, обусловливающей сложность задачи автоматического синтаксического анализа, является присущее любому естественному языку явление омонимии: одни и те же языковые знаки, помещенные в различные контексты, могут интерпретироваться по-разному. В подавляющем большинстве текстов на естественном языке омонимия может быть без труда разрешена, то есть текст обычно строится так, что человек (если он является носителем соответствующего языка) способен воспринять его однозначно. Это происходит благодаря тому, что в момент восприятия каждой следующей единицы текста для разрешения неоднозначности человек способен привлекать разнообразные контексты: контекст слов текущего предложения, соседних предложений (в первую очередь для учета анафорических связей), текста в целом (например учет тематики текста), прагматический контекст (при каких условиях, в какой ситуации текст был порожден и др.). Для качественного автоматического синтаксического анализа необходимо уметь моделировать контексты всех перечисленных типов и учитывать их в процессе автоматического анализа. Заметим, что на сегодняшний день большинство синтаксических анализаторов умеют работать с контекстом только в рамках одного предложения. Лишь немногие анализаторы учитывают контексты соседних предложений и всего текста в целом. Прагматический контекст не учитывает ни один из известных авторам синтаксических анализаторов.

Подробное описание дается в статье «Восстановление эллипсиса как задача автоматической обработки текстов», авторы: Мальковский М.Г., Миняйлов В.С. (Московский государственный университет им. М.В. Ломоносова, Москва), Старостин А.С. (Компания ABBYY, Москва).