Инд. авторы: | Barakhnin V.B., Fedotov A.M., Skachkov D.M., Solovyov A.A., Zhizhimov O.L. |
Заглавие: | Technology of Geographic Data Extraction from Text Documents |
Библ. ссылка: | Barakhnin V.B., Fedotov A.M., Skachkov D.M., Solovyov A.A., Zhizhimov O.L. Technology of Geographic Data Extraction from Text Documents // Современные информационные технологии для фундаментальных научных исследований в области наук о Земле (г. Петропавловск-Камчатский, 8-13 сентября 2014 г.): Материалы Международной конференции. - 2014. - Владивосток: Дальнаука. - P.124-124. - ISBN: 978-5-8044-1470-3. - http://kamchatka2014.fegi.ru/images/abstracts1.pdf#page=126 |
Внешние системы: | РИНЦ: 26542698; |
Реферат: | rus: В работе рассматриваются вопросы создания технологии извлечения географических фактов из текстовых документов достаточно произвольной структуры, при этом используется следующее определение факта: содержащаяся в тексте и метаданных документа совокупность связей между сущностями, описываемыми в онтологии информационной системы. Построены онтология, которая включает необходимые компоненты для временного и географического поиска, и схема тезауруса (в ее основе лежит схема Тезауруса географических названий Института Гетти), подходящая для использования при внедрении в электронные библиотеки. При содержательном наполнении тезауруса, предназначенного для извлечения фактов из текстов, связанных с географическими объектами, расположенными на территории Российской Федерации, целесообразно использовать Тезаурус географических названий Российской государственной библиотеки, дополненный иерархическими связями и ретроспективными сведениями. Непосредственная работа по извлечению фактов из текста опирается на совокупное применение методов синтаксического и семантического анализа. Само же извлечение факта, относящегося к тому или иному упоминаемому в тексте субъекту, описанному в онтологии, состоит в определении значения предиката, связанного с этим субъектом, при этом наименование географического объекта может выступать в роли как субъекта, так и предиката. |
Издано: | 2014 |
Физ. характеристика: | с.124-124 |
Ссылка: | http://kamchatka2014.fegi.ru/images/abstracts1.pdf#page=126 |
Конференция: | Название: Современные информационные технологии для фундаментальных научных исследований в области наук о Земле Город: Петропавловск-Камчатский Страна: Россия Даты проведения: 2014-09-08 - 2014-09-13 Ссылка: http://kamchatka2014.fegi.ru |