Инд. авторы: | Барахнин В.Б., Пастушков И.С. |
Заглавие: | Технология автоматизированного наполнения онтологии фактографической поисковой системы |
Библ. ссылка: | Барахнин В.Б., Пастушков И.С. Технология автоматизированного наполнения онтологии фактографической поисковой системы // Вестник Новосибирского государственного университета. Серия: Информационные технологии. - 2015. - Т.13. - № 4. - С.5-13. - ISSN 1818-7900. - EISSN 2410-0420. |
Внешние системы: | РИНЦ: 26122505; |
Реферат: | rus: В работе излагается технология автоматизированного наполнения онтологии фактографической поисковой системы. Суть технологии заключается в извлечении ключевых слов (словосочетаний) из корпуса текстов одно-родной тематики с целью дальнейшего использования извлеченных ключевых слов в качестве возможных значений атрибутов сущностей, описываемых в создаваемой онтологии предметной области, предназначенной для организации фактографического поиска в расширенном корпусе текстов соответствующей тематики. Предлагаемая технология основана на применении метода опорных векторов для разметки в текстах частей речи с после-дующим использованием метода случайных блужданий для извлечения семантически связанных ключевых слов (словосочетаний). К набору этих словосочетаний с целью отнесения конкретного словосочетания к определенному атрибуту описываемой в тексте сущности применяется обученная нейронная сеть со скрытым слоем. Таким образом, по набору семантически связанных пар слов строится онтология для конкретного документа, формирующаяся при работе нейронной сети, и далее с использованием СУБД на основе полученных данных организуется поиск. eng: This work is about technology of automated factographic retrieval system ontology filling. This technology contains extracting keywords from corpus of texts with similar topic for following using these keywords as possible values of entity’s attributes, that describes in created ontology of subject field for organizing of factographic retrieval in expanded corpus of text appropriated topics. Sug-gested technology based on support vector model for stamming text and following random-walk method for extracting keywords. After learned hidden layer neural network works with set of these keywords. So, ontology for document formed in neural network working builds by the set of seman-tic connected pairs of words and after with use of database search organizing. |
Ключевые слова: | FACT; AUTOMATED ONTOLOGY FILLING; FACTS EXTRACTION; INTELLIGENT SYSTEMS; ФАКТ; ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ; АВТОМАТИЗИРОВАННОЕ НАПОЛНЕНИЕ ОНТОЛОГИЙ; ИЗВЛЕЧЕНИЕ ФАКТОВ; ФАКТОГРАФИЧЕСКИЙ ПОИСК; FACTOGAPHIC RETRIEVAL; |
Издано: | 2015 |
Физ. характеристика: | с.5-13 |
Цитирование: | 1. Барахнин В. Б., Федотов А. М. Построение модели фактографического поиска // Вестн. Новосиб. гос. ун-та. Серия: Информационные технологии. 2013. Т. 11, вып. 4. С. 16-27. 2. Wittgenstein L. Logisch-Philosophische Abhandlung // Annalen der Naturphilosophie. Leipzig: Verlag Unesma, 1921. Vol. 14. Parts 3/4. P. 185-262. 3. Chen P. P. The entity-relational model. Toward a unified view of data // ACM TODS. 1976. № 1. P. 9-36. 4. Барахнин В. Б., Федотов А. М. Уточнение терминологии, используемой при описании интеллектуальных информационных систем, на основе семиотического подхода // Изв. вузов. Проблемы полиграфии и издательского дела. 2008. № 6. С. 73-81. 5. Михайлов А. И., Черный А. И., Гиляревский Р. С. Основы информатики. М.: Наука, 1968. 6. Добров Б. В., Лукашевич Н. В., Синицын М. Н., Шапкин В. Н. Разработка лингвистической онтологии по естественным наукам для решения задач информационного поиска // Тр. VII Всерос. науч. конф. «Электронные библиотеки: перспективные методы и технологии, электронные коллекции» (RCDL'2005). Ярославль, 2005. С. 70-79. 7. Welty C., McGuinness D., Uschold M., Gruninger M., Lehmann F. Ontologies: Expert Systems all over again // AAAI-1999 Invited Panel Presentation. 1999. 8. Нариньяни А. С. Кентавр по имени ТЕОН: Тезаурус + Онтология // Тр. междунар. семинара «Диалог'2001» по компьютерной лингвистике и ее приложениям. Аксаково, 2001. Т. 1. C. 184-188. 9. Хайкин С. Нейронные сети. Полный курс. 2-е изд., испр.: Пер. с англ. М.: ООО «И. Д. Вильямс», 2006. 10. Bellaachia A., Al-Dhelaan M. HG-RANK: A Hypergraph-based Keyphrase Extraction for Short Documents in Dynamic Genre. // Making Sense of Microposts (# Microposts2014). http://ceur-ws.org/Vol-1141/paper_06.pdf |