Авторитетность издания
ВАК - К1
RSCI, ядро РИНЦ
Добавить в закладки
Следующий номер на сайте
№3
Ожидается:
16 Сентября 2025
Инструментарий для определения лингво-статистической близости языков с использованием модели тюркской морфемы
Tools for determining a linguistic-statistical affinity of languages using the turkic morpheme model
Дата подачи статьи: 13.06.2017
УДК: 519.688
Статья опубликована в выпуске журнала № 1 за 2018 год. [ на стр. 172-176 ]Аннотация:В статье предлагаются новый подход и инструментарий для лингво-статистического сравнения близости тюркских языков с использованием модели тюркской морфемы. Модель тюркской морфемы является структурированным описанием тюркских морфем, которое состоит из свойств морфем и ситуаций их проявления на всех языковых уровнях (фонологическом, морфологическом, синтаксическом, семантическом). Инструментарий для определения лингво-статистической близости тюркских языков реализован в виде веб-ресурса, который обрабатывает информацию о языке, представленную в БД модели тюркской морфемы. Сравнение близости языков лингво-статистическими методами с использованием модели тюркской морфемы можно осуществлять для разных языковых уровней: морфологического, синтаксического, лексического. В данной работе описаны четыре метода для сравнения на морфологическом уровне: сравнение количества аффиксальных морфем, соответствующих грамматической категории, количества алломорфов, входящих в состав одной морфемы, слитности и раздельности написания морфемы, порядка следования аффиксальных морфем в словоформе. В настоящее время БД модели заполнена для татарского, казахского, крымскотатарского, турецкого, узбекского языков, что позволяет проводить попарное сравнение их лингво-статистической близости. Предложенный метод может быть использован при сравнении морфологий языков для получения информации о близости диалектов к литературному языку, а также о близости диалектов одного языка диалектам и литературному языку других языков. Эти методы и инструментарий применимы не только для тюркских, но и для любых близкородственных языков агглютинативного типа.
Abstract:The article proposes a new approach and tools for linguistic-statistical comparing of Turkic languages affinity using the Turkic morpheme model. This model is a structured description of Turkic morphemes, which consists of morpheme properties and their manifestation contexts at all language levels (phonological, morphological, syntactic and semantic) [3, 5]. The tools determining the linguistic-statistical affinity of Turkic languages is implemented as a web resource that processes information about the language represented in the morpheme model database. Comparing the affinity of languages by linguistic-statistical methods using the Turkic morpheme model can be made at different lan-guage levels: morphological, syntactic, lexical. The paper describes four following methods: comparing the number of affixational mor-phemes corresponding to a grammatical category; comparing the number of allomorphs in one morpheme; comparing the joined-up and separate writing of morphemes; comparing the order of affixational morphemes within the word form. Nowadays the model database is filled up for Tatar, Kazakh, Crimean Tatar, Turkish and Uzbek languages. It allows comparing linguistic-statistical affinity of the languages in pairs. The proposed method can be used to compare language morphologies to obtain information on the affinity of dialects to a literary lan-guage, as well as to detect the affinity of one language dialects to dialects and a literary language of other languages. Our methodology and tools can be used not only for Turkic languages, but for any closely related languages of the agglutinative type.
Авторы: Альменова А.Б. (almen_akmaral-baijan@mail.ru) - Институт прикладной семиотики Академии наук Республики Татарстан (младший научный сотрудник), Казань, Россия, Аспирант | |
Ключевые слова: бд, тюркская морфема, модель, тюркские языки, лингво-статистическое сравнение близости языков |
|
Keywords: database, Turkic morpheme, mathematical model, turkic languages, linguistic-statistical comparison of languages |
|
Количество просмотров: 10847 |
Статья в формате PDF Выпуск в формате PDF (29.74Мб) |
Инструментарий для определения лингво-статистической близости языков с использованием модели тюркской морфемы
DOI: 10.15827/0236-235X.121.172-176
Дата подачи статьи: 13.06.2017
УДК: 519.688
Статья опубликована в выпуске журнала № 1 за 2018 год. [ на стр. 172-176 ]
В статье предлагаются новый подход и инструментарий для лингво-статистического сравнения близости тюркских языков с использованием модели тюркской морфемы. Модель тюркской морфемы является структурированным описанием тюркских морфем, которое состоит из свойств морфем и ситуаций их проявления на всех языковых уровнях (фонологическом, морфологическом, синтаксическом, семантическом). Инструментарий для определения лингво-статистической близости тюркских языков реализован в виде веб-ресурса, который обрабатывает информацию о языке, представленную в БД модели тюркской морфемы.
Сравнение близости языков лингво-статистическими методами с использованием модели тюркской морфемы можно осуществлять для разных языковых уровней: морфологического, синтаксического, лексического. В данной работе описаны четыре метода для сравнения на морфологическом уровне: сравнение количества аффиксальных морфем, соответствующих грамматической категории, количества алломорфов, входящих в состав одной морфемы, слитности и раздельности написания морфемы, порядка следования аффиксальных морфем в словоформе.
В настоящее время БД модели заполнена для татарского, казахского, крымскотатарского, турецкого, узбекского языков, что позволяет проводить попарное сравнение их лингво-статистической близости.
Предложенный метод может быть использован при сравнении морфологий языков для получения информации о близости диалектов к литературному языку, а также о близости диалектов одного языка диалектам и литературному языку других языков. Эти методы и инструментарий применимы не только для тюркских, но и для любых близкородственных языков агглютинативного типа.
Альменова А.Б. (almen_akmaral-baijan@mail.ru) - Институт прикладной семиотики Академии наук Республики Татарстан (младший научный сотрудник), Казань, Россия, Аспирант
Ключевые слова: бд, тюркская морфема, модель, тюркские языки, лингво-статистическое сравнение близости языков
Ссылка скопирована!
Постоянный адрес статьи: http://swsys.ru/index.php?page=article&id=4418 |
Версия для печати Выпуск в формате PDF (29.74Мб) |
Статья опубликована в выпуске журнала № 1 за 2018 год. [ на стр. 172-176 ] |
Статья опубликована в выпуске журнала № 1 за 2018 год. [ на стр. 172-176 ]
Возможно, Вас заинтересуют следующие статьи схожих тематик:Возможно, Вас заинтересуют следующие статьи схожих тематик:
- Модель формирования адаптивной среды обучения и оценка ее эффективности
- Модель интерактивной обучающей системы
- Программное обеспечение для учета и хранения клинической и социодемографической информации о больных
- Унифицированное описание функционирования информационных радиоэлектронных систем для оценки программного обеспечения учебно-тренировочных средств
- Моделирование боевых действий в оперативно-тактических и тактических тренажерах
Назад, к списку статей