Регистрация / Вход
Прислать материал

Классификация слов испанского языка для их генерации и определения

Сведения об участнике
ФИО
Епифанцев Алексей Александрович
Вуз
Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Рязанский государственный радиотехнический университет"
Тезисы (информация о проекте)
Область наук
Информационные технологии и вычислительные системы
Раздел области наук
Информационные технологии
Тема
Классификация слов испанского языка для их генерации и определения
Резюме
Предлагается классификация слов испанского языка по типам формообразования на основе универсальной модели формообразования. Выполненная классификация будет использована для заполнения словарей автоматизированной обучающей системы, а также в системах автоматической обработки слов, использующих генерацию и определение словоформ.
Ключевые слова
автоматическая обработка текстов, морфологический анализ и синтез, генерация и определения форм слов, классификация слов естественных языков
Цели и задачи
1)Классифицировать все слова испанского языка по типам в соответствии с моделью формообразования метода генерации и определения форм слов.
2)Каждый тип формообразования описать цепочками преобразований.
3)Заполнить словари Интернет-приложения морфологического анализа и синтеза слов естественных языков.
Введение

В работе [1] предложен универсальный метод генерации и определения форм слов естественных языков различных семейств и групп. Метод основан на представлении формообразования в виде последовательности преобразований и предназначен для решения задач на морфологическом уровне обработки текстов (включает в себя задачи генерации и определения). Доказаны возможность применения метода генерации и определения для естественных языков и адекватность предложенной модели формообразования.

Методы и материалы

В настоящее время разработано Интернет-приложение для морфологического анализа и синтеза количественных числительных, а также их перевода на английский, испанский, немецкий, финский языки, основанное на методе генерации и определения форм слов.  Больная часть переводов из университетов таких стран, как США и Канада, связана с испанским языком поэтому именно он был выбран для классификации.

Полученная классификация будет использована при заполнении словарей системы генерации и определения форм слов разрабатываемого Интернет-приложения для обработки слов испанского языка.

Для классификации слов испанского языка используется словарь, включающий 14000 слов [2], а также учебник [3].

Наиболее сложной частью речи испанского языка с точки зрения морфологии являются глаголы. Поэтому в первую очередь была проведена классификация испанских глаголов и были построены цепочки преобразования для спряжения глаголов испанского языка.

В результате выделено 11 различных групп глаголов по правилам формообразования. Также были выделены 26 глаголов индивидуального спряжения. В итоге были получены выделено 37 различных типов формообразования глаголов. Каждый тип формообразования описан цепочками, соответствующим правилам и критериям [1].

Описание и обсуждение результатов

В результате классификации глаголов испанского языка были получены следующие результаты:

  1. Было классифицировано 1049 глаголов испанского языка;
  2. Всего было выделено 37 различных типов формообразования глаголов, среди которых 3 типа без изменения основы при спряжении, 8 типов с изменением основы при спряжении и 26 типов глаголов индивидуального спряжения. 

В настоящее время производится классификация существительных и прилагательных испанского языка. Исследовано словообразование приведенных в словаре [2].

Используемые источники
1. Пруцков А.В. Генерация и определения форм слов естественных языков на основе их последовательных преобразований // Вестник Рязанского государственного радиотехнического университета. — 2009. — № 27. — С. 51-58.
2. Филиппова О.Н.,Санчес Павон М.,Разыграева Л.И. Краткий испан-ско-русский и русско-испанский словарь. – М.: Издательство “Со-ветская энциклопедия’, 1964.
3. Дышлевая И.А. Курс испанского языка для начинающих. – СПб.: “Издательство Союз”, 2000.
Information about the project
Surname Name
Epifantsev Alexey
Project title
Classification spanish words by type of formation to fill dictionaries for morphological word processing application
Summary of the project
It offered Spanish adjectives classification by type of formation. Classification will be used fill dictionaries for automated training system and for automatic words processing, using generation and recognition of the wordforms.
Keywords
natural languages processing, morphological analysis and syntheses, generation and recognition of the wordforms, classification natural languages words