Инд. авторы: | Мансурова М.Е., Койбагаров К.Ч., Барахнин В.Б., Солтангельдинова М.., Бердибеков С.. |
Заглавие: | Применение морфологического анализатора казахского языка для автоматизированного наполнения онтологии фактографической поисковой системы |
Библ. ссылка: | Мансурова М.Е., Койбагаров К.Ч., Барахнин В.Б., Солтангельдинова М., Бердибеков С. Применение морфологического анализатора казахского языка для автоматизированного наполнения онтологии фактографической поисковой системы // Известия Кыргызского государственного технического университета им. И.Раззакова. - 2016. - № 2(38). - С.61-66. - ISSN 1694-5557. |
Внешние системы: | РИНЦ: 26586247; |
Реферат: | rus: Данная работа посвящена разработке анализатора для автоматизации морфологической разметки текстов корпуса казахского языка. Для осуществления морфологической разметки используются лексический и морфологический анализаторы. Задачей лексического анализатора является определение границ предложений, выделение слов, идентификаторов и пунктуационных маркеров. Морфологический анализатор выполняет поиск слов в словаре казахского языка и определяет их морфологические параметры. На выходе морфологического анализатора мы получим список лемм (нормальная форма слова), аффиксов и морфологических характеристик слова. Осуществляемая с помощью разработанного анализатора морфологическая разметка является этапом автоматической обработки текста, которая позволяет осуществлять поиск нужных пользователю слов, форм слова, лексических конструкций и т.д. В данной работе описывается применение модуля морфологического анализатора для автоматизированного наполнения онтологии фактографической поисковой системы. eng: This work is concerned with the development of the parser for automation of morphological markup of the texts of the Kazakh National corpus. The parser includes the lexical and morphological analyzers to perform the morphological markup of the texts. The task of a lexical analyzer is to determine the boundaries of sentences, to display words, identifiers and punctuation marks. The morphological analyzer performs the search for words in the dictionary (which is a separate database) and determines their morphological parameters. At the output of the morphological analyzer, we have a list of lemmas (a normal form of the word), affixes and morphological characteristics of the word. Morphological markup of the texts is a stage of automatic text processing, which allows to use the marked texts to solve the different problems of Natural Language processing. This paper describes the application of morphological parser of the Kazakh language to automated filling of the ontology of factographic retrieval system. |
Ключевые слова: | facts extraction; factogaphic retrieval; morphological markup; morphological parser; автоматизированное наполнение онтологии; извлечение фактов; фактографический поиск; морфологическая разметка; морфологический анализатор; automated ontology filling; |
Издано: | 2016 |
Физ. характеристика: | с.61-66 |
Цитирование: | 1. Makhmudov M.: Systems of automatic recycling of Turkic text on lexical and morphological level, Elm, 114 p. Baku (1991) (In Russian) 2. Migalkin V.V.: Modeling of the Yakut language spelling and development a set of programs to check the spelling of Yakut texts in Windows environment, Author. diss.. Ph.D., Yakutsk (2005) (In Russian) 3. Sadyqov T.: Problems of modeling of Turkic morphology: an aspect of causing Kyrgyz nominal inflectional forms, 119 p. Publishing House of the "Ilim" (1987) (In Russian) 4. Sirazitdinov Z.A.: Modeling grammar of Bashkir language. Inflectional system. 160 p. Ufa (2006) (In Russian) 5. Sirazitdinov Z.A.: On the modeling of inflectional system agglutinative language pair combinations (for example, the Bashkir language) / Actual problems of modern Mongolian and Altaic. Proceedings of the International Scientific Conference. Elista, 2014. pp 139-143. (In Russian) 6. Altenbek G., Wang Xiao-long: Kazakh Segmentation System of Inflectional Affixes. In: Joint Conference on Chinese Language Processing, pp.183-190 (2010) 7. Zafer H.R., Tilki B., Kurt A., Kara M.: Two-level description of Kazakh morphology. In: Proceedings of the first International Conference on Foreign Language teaching and Applied Linguistics, FLTAL 2011, Sarajevo (May 2011). 8. Sharipbaev A.A.: Intelligent morphological analyzer, based on semantic networks: Conference proceedings Open Semantic Technologies for Intelligent Systems (2012) 9. Bekmanova G.T.: Some approaches to the problems of automatic word changes and morphological analysis in the Kazakh language. In: Bulletin of the East Kazakhstan State Technical University Named by D. Serikbayev, №1, pp. 192-197, Ust-Kamenogorsk (2009) (In Russian) 10. Zhubanov A.H.: Basic principles of formalization of the Kazakh text content, 250 p. Almaty (2002) (In Russian) |