ISSN 0236-235X (P)
ISSN 2311-2735 (E)

Journal influence

Higher Attestation Commission (VAK) - К1 quartile
Russian Science Citation Index (RSCI)

Bookmark

Next issue

2
Publication date:
16 June 2024

The article was published in issue no. № 3, 1994
Abstract:
Аннотация:
Author: () -
Ключевое слово:
Page views: 9670
Print version

Font size:       Font:

Рассматривается задача построения описания на русском языке сцен, наблюдаемых роботом на улице [1].

Вся информация о неязыковой действительности представлена в виде конечного множества М троек вида х R у, где х и у - объекты, наблюдаемые роботом в сцене, a R - связывающие их пространственные отношения.

Процесс синтеза связного текста происходит поэтапно. Сначала работает алгоритм выделения содержания (основной, наиболее существенной информации) из наблюдаемой неязыковой действительности [2, 3, 4]. Содержание сцены, таким образом, соответствует конечной последовательности S троек вида х R у, выбранной из множества М, фиксирующего полную информацию о сцене. Образно говоря, в результате работы алгоритма выделения содержания на глубинном (семантическом) уровне мы получаем "голую" семантическую структуру наблюдаемой роботом сцены в виде последовательности 5 троек х R у. Для перехода на поверхностный уровень на этом же этапе х, у и R присваиваются имена, соответствующие названию объектов и отношений на русском языке.

В итоге мы получаем описания сцен в виде последовательностей предложений русского языка в их самом примитивном варианте и воспринимаем такое описание как прообраз будущего связного текста. Вот пример такого описания:

"Солнце. Облако 1. Облако 2. Забор 1 ЛЕВЕЕ домик. Домик ЛЕВЕЕ забор 2. Домик ПОД труба. Труба ПОД дым. Забор 2 СПЕЦ калитка. Липа 1 ЗА забор 1. Липа 2 ЗА забор 1. Птичка НАД забор 2. Скамейка ПЕРЕД забор 1. Сидящий человек 1 НАД скамейка. Шляпа 1 НАД сидящий человек 1. Сидящий человек 2 НАД скамейка. Шляпа 2 НАД сидящий человек 2".

На втором этапе работа проводится в плане автоматического редактирования. Для получения связного текста на русском языке из приведенной последовательности так называемых предложений необходимо:

1)   избавиться от референциальных индексов;

2)   ввести информацию о падежах;

3)   учитывая актуальное членение, построить текст таким образом, чтобы каждый объект вводился в описание через уже введенный;

4)   определить правила для обработки специальных отношений (СПЕЦотношекий);

5)   выбрать способ перехода от семантической структуры к синтаксической;

6)   избавиться от однообразия и лишних повторов - упоминаний об объектах, о которых только что шла речь, - и так далее.

При этом необходимо учитывать, что при построении текста мы руководствуемся принципом описания сцены "слева направо".

Способ организации словаря и правила построения связного текста [5, 6] оформлены в виде последовательности процедур, самой мощной из которых оказалась процедура "склейки" [7].

Как уже отмечалось, с каждым элементом х R у последовательности 5 можно сопоставить отдельные предложения русского языка, однако более естественными и компактными получаются тексты, в которых в одном предложении "склеены" несколько элементов последовательности. В системе предусмотрены некоторые правила такой "склейки".

Одним из существенных компонентов "склейки" является введение конструкций с относительным словом "который", обеспечивающих на поверхностном уровне плавность и слитность текста, устраняющих ненужные повторы наименований объектов (т.е. тавтологии в тексте) путем их замещения.

Рассмотрим основные семантические модели конструкций со словом "который", учитываемые нами при синтезе связного текста, описывающего пространственные сцены, наблюдаемые роботом на улице.

Специфика нижеприведенных моделей, отличающая их от обычных семантических моделей с ролевыми определениями участников ситуации, или от синтаксических моделей, определяющих синтаксические роли в предложении, обусловлена типом задачи синтеза (от пространственных изображений к тексту) и ограниченностью предметной области. Она заключается в том, что в моделях релевантными, кроме типов отношений, оказываются количество объектов и порядок их описания (слева направо и на основе "табели о рангах" объектов и отношений [1 - 7] ).

МОДЕЛЬ 1. Общий вид модели

СПЕЦ

---> у1 ------- > ["который"]--------- > z1

 &

---> у2-- ->-- > ["который"]--------- > z2

СПЕЦ

Информацию, содержащуюся в данной схеме, следует понимать так: х - объект, связанный СПЕЦотношениями с двумя другими объектами yl и у 2, к каждому из которых присоединяется третий объект (z1 или z2) при помощи слова "который" с предлогом, его вводящим.

Наиболее адекватными такой модели являются синтезируемые тексты типа:

..." дом         с забором,          в         котором [имеется] калитка, и

 (х) (СПЕЦ) (у1 ) (предлог)-------------------- (z1)                (&)

с трубой, из которой [идет] дым ". (СПЕЦ) (у2) (предлог)         (z2)

Частными случаями модели являются ситуации, в которых какой-либо из компонентов общей модели отсутствует. Это соответственно следующие случаи:

СПЕЦ а) ...1 х---- > у1 ------------------ > ["который"]            > z1 ,

т.е. у2 (а следовательно, и &, и z2) отсутствует. Этой модели адекватны тексты типа:

..." дом с забором, в котором [имеется] калитка, (х) (СПЕЦ) (у1 ) (предлог)                    (z1)

СПЕЦ

б)   .... х------------ > у2---------- > ["который"]--------- > z2 ,

т.е. y1 (а следовательно, и &, и z1) отсутствует. Этой модели соответствуют тексты типа:

..."дом с трубой, из которой [идет] дым " . (х) (СПЕЦ)   (у2) (предлог)            ,          (z2)

в)                    СПЕЦ

---------- > y1

…. X                 &

-------- > у2---------- > ["который"]-------- > z2 ,

СПЕЦ

т.е. здесь отсутствует z1. В этом случае сначала синтезируется текст, соответствующий верхней части схемы модели (т.е. с отсутствующим третьим компонентом), а затем текст, соответствующий нижней части схемы, содержащей конструкцию со словом "который". Данному случаю адекватны тексты типа:

..."дом с забором и с трубой, из которой [идет] дым ".

 (х)(СПЕЦ) (у1) (&)(СПЕЦ) (у2) (предлог)----------                (z2).

Соответственно :

г)               СПЕЦ

----------- > у1 ---------- > ["который"]--------- > z1

... X                         &

----------- > у2

СПЕЦ

т.е. здесь отсутствует z2. И следовательно, аналогично случаю в) сначала синтезируется текст, соответствующий нижней части схемы (т.е. с отсутствующим третьим компонентом), а затем текст, соответствующий верхней части, содержащий конструкцию со словом "который". Данному случаю адекватны тексты типа:

..."дом с трубой и с забором, в котором [имеется] калитка", (х) (СПЕЦ) (у2) (4) (СПЕЦ) (у1) (предлог)--------------------------------------------------------------                          (zl )

Правила в) и г) отражают лингвистическую закономерность предпочтительного порядка расположения в конце части предложения, отягченной "шлейфом" (в данном случае - придаточным предложением) [9].

И, наконец, случай

Д)

 ... х1 СПЕЦ

&                    у--------- > ["которыя"]----------- > z ,

х2 СПЕЦ

отличающийся от всех остальных случаев тем, что здесь два равноценных объекта связаны с объектом, к которому присоединяется следующий посредством введения конструкции с "который". Этой модели адекватны тексты типа:

..."человек 1 И человек 2 [несут] ящик, на котором [сидит] птичка". (х1) (&) (х2) (СПЕЦ) (у) (предлог)--------------------------------------------- .--                     (z)

(x1 & х2), т.е. "человек 1 И человек 2", как уже описывалось в [6, 7], автоматически трансформируются в текст "ДВА ЧЕЛОВЕКА".

МОДЕЛЬ 2

При помощи этой модели рассматриваются случаи, когда объект х отсутствует (в отличие от модели 1), но зато объект z может быть не один или связан СПЕЦотношением, например с объектом w или с конъюнкцией объектов (w1 & w2).

Частными случаями этой модели являются ситуации, характеризующиеся указанными различиями, а именно:

а)   ... у------------- > ["который"]------------- > z .

Это самый простой случай, и ему адекватны синтезируемые тексты типа:

... "скамейка, на которой [сидит] человек" ; (у) (предлог) ------------------------------------ (z)

б) ... у----- > ["который"]---- > (z1 4 z2) .

Этому случаю адекватны соответственно тексты типа:

... "скамейка, на которой [сидят] два человека" ; (у) (предлог)       --------------------------------- СКЛЕЙКА (z1 4 z2)

СПЕЦ

в)   ... у---------- > ["который"] ---------- > z---------- > w .

Здесь (в отличие от случаев а) и б)) появился еще один объект и>, связанный с z СПЕЦотношением. Этому случаю адекватными являются тексты типа:

... "скамейка, на которой [сидит] человек в шляпе" ;

(у) ПРЕДЛОГ —---------- (z) СПЕЦ (w)

г)                                                                            СПЕЦ

--------- > W1

... у---------- > ["который"]----------- > z (&)

-------- > W2

СПЕЦ

Здесь с z связаны (через конъюнкцию СПЕЦотношений) два объекта. Адекватными рассмотренному случаю являются синтезируемые тексты типа:

..."грузовик, рядом с которым [стоит] человек с лопатой и в . шляпе", (у)           ПРЕДЛОЖН.ГРУППА             ------------------------------- (z) (СПЕЦ W1 ) 4 (СПЕЦ w2)

д)                                                                              СПЕЦ

------------------- > zi--------------- > wi

... у---------- > ["который"]                   4

---------------- > Z2

е)                                        ----------------- > z1

... у---------- > ["который"]                     4

----------------- > z2----------- > w2

СПЕЦ

ж)                                                                             СПЕЦ

----------------- > z1---------- > wl

... у---------- > ["который"]                     4        (4)

----------------- > Z2---------- > w2

СПЕЦ

Случаи д) и е) являются частными случаями модели ж), и все они представляют собой как бы наращение модели б) одним (в случаях д) и е)) или двумя (в случае ж)) объектами. Им адекватны синтезируемые тексты типа:

д)е) "скамейка, на которой [сидят] два человека, один из них в шляпе". (у)        предлог                        (z1 4 z2)          (z1 V z2) СПЕЦ (w)

И соответственно ж) - тексты типа:

ж) "скамейка, на которой [сидят] два человека, один из них с

(у) ПРЕДЛОГ------ --------------- (Z1 4 z2)           (z1Vz2) СПЕЦ

книгой , другой - в шляпе ". (wl) (4) (z2Vz1) СПЕЦ (w2)

МОДЕЛЬ 3

Эта модель отличается от предыдущих тем, что конструкции с "который" относятся не к тому объекту, за которым они следуют непосредственно (т.е. у), а к тому, от которого этот у зависит (т.е. х).

Общий вид модели 3

СПЕЦ       _                      -------------------------- > w1

х---------- > у                    ["который"]---------- > z (4)

СПЕЦ                                                                                   > w2

СПЕЦ

 Ей адекватны синтезируемые тексты типа:

"грузовик с песком, рядом с которым стоит человек с лопатой и в шляпе", (х) СПЕЦ (у) ПРЕДЛ.ГР.                 (z) СПЕЦ (w1 ) 4 СПЕЦ (w2)

Частные случаи этой модели характеризуются отсутствием либо одного из составляющих ее последних звеньев, либо отсутствием обоих, т.е.:

                        СПЕЦ

а)   х------------ > у               ["который"]----------- > z------------- > w

СПЕЦ

(отсутствует одно звено и соответственно конъюнкция СПЕЦотиошений). По такой модели синтезируются тексты типа:

"грузовик с песком, рядом с которым [стоит] человек с лопатой". (х) СПЕЦ (у) ПРЕДЛ.ГР    ___________________________ (z) СПЕЦ (w)

б) ---------------------------------

х----------- > у               ["который"] ----------- > z

СПЕЦ

Соответственно синтезируются тексты типа:

..." грузовик с песком, рядом с которым [стоит] человек", (х) СПЕЦ (у) ПРЕДЛ.ГР.     ---------------------------------------------------- (z)

Как можно было заметить из приведенных примеров синтезированных текстов, всюду конструкции с "который" характеризуются тем, что они вводятся (присоединяются) предлогами. Это мотивировано двумя факторами. Во-первых, тем, что в предлогах содержится информация о пространственных отношениях, связывающих пары объектов, и во-вторых, они выполняют на поверхностном уровне синтаксическую и стилистическую функции.

Беспредложные конструкции в описываемых нами сценах могли бы иметь место только в случае присоединения объектов, расположенных ПРАВЕЕ только что описанного объекта. Но именно этого и не следует делать ввиду того, что при построении описания мы руководствуемся принципом описания "слева направо", и следовательно, в тексте может Получиться слишком много "которых", что стилистически было бы не совсем оправданным. Достаточно и того, что в текстах не так уж мало "ПРАВЕЕ", ибо принцип описания "слева направо" именно это и предусматривает. Здесь тавтология заранее спланирована (т.е. мотивирована принципом порядка выдачи описания).

Таким образом, на основе всего сказанного для автоматического синтеза текстов, описывающих на русском языке пространственные сцены, могут быть сформулированы следующие правила:

Основное правило (для моделей 1 и 2):

Конструкции с относительным словом "который" вместе с предлогами, их присоединяющими ("в", "из", "на", "под", "перед", "рядом с"), вводятся непосредственно после определяемого всей конструкцией слова (объекта).

Правило для модели 3:

Если объект, к которому относится конструкция с "который", осложнен СПЕЦотношением (или их конъюнкцией), то конструкция вместе с предлогом, ее присоединяющим, вводится после слова (объекта), связанного с определяемым объектом СПЕЦотношением.

Иными словами: Конструкция с относительным словом "который" присоединяется не к определяемому объекту непосредственно, а к последнему слову куста, представляющего определяемый объект вместе с зависимыми от него словами, так как в этом случае конструкция с "который" определяет уже не элементарный, а сложный объект (например "грузовик с песком, на котором...", "человек в шляпе, за которым...", "человек с лопатой и в шляпе, рядом с которым..," и т.п.).

В случае возникновения семантической неоднозначности на поверхностном уровне могут быть предложены две возможности снятия таковой:

-     уточнение определяемого объекта при помощи процедуры "вопрос-ответ", извлекающей недостающую информацию из глубинного уровня;

-     недопущение "склейки" (т.е. возможность синтезировать не одно сложное предложение с "который", а два простых).

Рассмотренные модели просты в реализации и не противоречат ни традиционным, ни современным взглядам. Нам же они помогли наилучшим образом реализовать работу процедуры "склейки" при переходе от глубинного уровня к поверхностному, т.е. при переходе от семантических структур к синтаксическим. В результате тексты описываемых сцен получились компактными и вполне естественными с точки зрения носителей русского языка. Например, приведенный выше так называемый текст сравнительно просто преобразовывается в следующий: "Светит солнце. Плывут два облака. Стоит домик с забором, в котором имеется калитка, и с трубой, из которой идет дым. За забором растут две липы. На заборе сидит птичка. Перед забором стоит скамейка, на которой сидят два человека. Оба в шляпах".

Список литературы

1.   Ильин Г.М., Шведов A.M., Лейкина Б.М., Откупщикова М.И. Система распознавания и описания зрительно воспринимаемой ситуации (СРОС). Общая структура системы // Сб.: Семантические вопросы искусственного интеллекта. - Киев: Знание, 1975. - С. 24 - 25.

2.   Ильин Г.М., Игнатова В.Н., Смирнова Л.Н. Система распознавания и описания ситуации (СРОС). Алгоритм построения содержания ситуации. - Киев: Знание, 1975. - С. 25 - 26.

3.  Ильин Г.М., Игнатова В.Н., Смирнова Л.Н. Формальное построение содержания ситуации, распознаваемой роботом // Сб.: Робототехника. - Л.: ЛПИ им. Калинина, 1977. - С. 22 - 28.

4.Ильин Г.М., Игнатова В.Н. Задачи автоматического синтеза текстов // Тез. докл. Всесоюз. конф.: Переработка текста методами инженерной лингвистики. - Минск: МГПИИЯ, 1982. - С. 90 - 92.

5.Ильин Г.М., Игнатова В.Н. Модель "неязыковая действительность —> текст" как средство получения информации от робота на естественном (русском) языке // Тез. докл. и сообщ. 12-го Всесоюз. сем. АРСО-12: Автоматическое распознавание слуховых образов. - Киев, 1982. - С. 524 - 526.

6.  Ильин Г.М., Игнатова В.Н. Организация словаря и правила построения текста в одной задаче автоматического синтеза. - Киев, 1982. - С. 527 - 529.

7.  Ильин Г.М., Игнатова В.Н. Автоматический синтез текстов на естественном (русском) языке для описания сцен, распознаваемых роботом // Сб.: Проблемы оптимизации дискретных систем. - Л.: ЛГУ, 1990. - Вып. 25. -С. 171 - 184.

8.  Ильин Г.М., Игнатова В.Н. Система "РИСУНОК <-      > ТЕКСТ" // Программные продукты и системы. -

1992. - 16 2. - С. 48 - 52.

9. Откупщикова М.И. Грамматика порядка слов для русского синтеза при автоматическом переводе (русские научно-технические тексты): Автореф. канд. дис. - Л., 1967. - С. 13.

10. G.M.ILYIN, V.N.IGNATOVA. A system describing a scene which a robot observes and displaying it according to text in natural language. "Industrial applications of artificial intelligence". Edited by Games LAlty and L.Mikulich. North-Holland - Amsterdam - London - New-York - Tokyo. 1991. PP. 130 - 134.


Permanent link:
http://swsys.ru/index.php?page=article&id=1161&lang=en
Print version
The article was published in issue no. № 3, 1994

Perhaps, you might be interested in the following articles of similar topics: