Инд. авторы: | Князева А.А. |
Заглавие: | Принципы идентификации объектов в структурированных документах |
Библ. ссылка: | Князева А.А. Принципы идентификации объектов в структурированных документах // Вестник Новосибирского государственного университета. Серия: Информационные технологии. - 2013. - Т.11. - № 1. - С.58-67. - ISSN 1818-7900. - EISSN 2410-0420. |
Внешние системы: | РИНЦ: 19597227; |
Реферат: | eng: The paper describes the problem of real word objects identification, which are mentioned in the structured documents. The approach takes into account different features for identification and its weights depending on its significance. The application of the proposed model to the problem of identification of persons that act as authors of publications based on data from the electronic library catalog is considered.
rus: Рассматривается задача идентификации объектов реального мира, упоминаемых в структурированных документах. Сформулированный подход позволяет учитывать различные признаки, по которым производится идентификация, и присваивать им различные веса в зависимости от их значимости. Рассматривается применение предлагаемой модели к задаче идентификации персон, выступающих в роли авторов публикаций, на основе данных электронного каталога библиотеки. |
Ключевые слова: | структурированные документы; связывание записей; identification of objects; Databases; structured documents; Record linkage; идентификация объектов; Базы данных; |
Издано: | 2013 |
Физ. характеристика: | с.58-67 |
Цитирование: | 1. Князева А. А., Колобов О. С., Турчановский И. Ю., Федотов А. М. Ранжированный поиск в библиографических базах данных//Вестн. Новосиб. гос. ун-та. Серия: Информационные технологии. 2009. Т. 7, вып. 4. С. 81-96. 2. Князева А. А., Турчановский И. Ю., Колобов О. С. Автоматическое связывание документов//Электронные библиотеки: перспективные методы и технологии, электронные коллекции: Тр. XIV Всерос. науч. конф. RCDL’2012. Переславль-Залесский: Изд-во «Университет города Переславля», 2012. С. 360-369. 3. Князева А. А., Турчановский И. Ю., Колобов О. С. Автоматическое связывание структурированных документов//Материаловедение, технологии и экология в 3-м тысячелетии: Сб. докл. V Всерос. конф. молодых ученых [Электронный ресурс]. Томск: Изд-во ИОА СО РАН, 2012. CD-ROM. 4. Elfeky M. G., Elmagarmid A. K., Verykios V. S. TAILOR: A Record Linkage Tool Box//Proc. of the XVIII International Conference on Data Engineering (ICDE 02). IEEE Computer Societyю Washington, DC, 2002. P. 17-28. 5. Рубцов Д. Н., Барахнин В. Б. Выявление дубликатов в разнородных библиографических источниках//Вестн. Новосиб. гос. ун-та. Серия: Информационные технологии. 2009. Т. 7, вып. 3. С. 86-93. 6. Newcombe H. B., Kennedy J. M., Axford S. J., James A. P. Automatic Linkage of Vital Records//Science. 1959. Vol. 130. P. 954-959. 7. Fellegi I. P., Sunter A. B. A Theory for Record Linkage//J. of the American Statistical Association. 1969. Vol. 64. P. 1183-1210. 8. Belin T. R., Rubin D. B. A Method for Calibrating False-Match Rates in Record Linkage//J. of the American Statistical Association. 1995. Vol. 90. P. 694-707. 9. Bilenko M., Mooney R. Learning to Combine Trained Distance Metrics for Duplicate Detection in Databases: Technical Report AI-02-296/Artificial Intelligence Lab. University of Texas at Austin, 2002. 10. Mahalanobis P. C. On the Generalized Distance in Statistics//Proc. of the National Institute of Sciences of India. 1936. Vol. 2 (1). P. 49-55. 11. Князева А. А., Турчановский И. Ю., Колобов О. С. Автоматический авторитетный контроль для распределенных библиографических баз данных//Распределенные информационные и вычислительные ресурсы (DICR’2010): Материалы XIII Рос. конф. с участием иностранных ученых [Электронный ресурс]. Новосибирск: ИВТ СОРАН, 2010. CD-ROM. 12. Князева А. А., Колобов О. С. Восстановление связей между библиографическими записями//Современные проблемы математики, информатики и биоинформатики: Материалы Междунар. конф., посвящ. 100-летию со дня рождения члена-корреспондента АН СССР Алексея Андреевича Ляпунова [Электронный ресурс]. Новосибирск: ИВТ СО РАН, 2011. CD-ROM. 13. Федотов А. М., Жижимов О. Л., Князева А. А., Колобов О. С., Мазов Н. А., Турчановский И. Ю., Федотова О. А. Проблемы авторитетного контроля для распределенных электронных библиотек и библиографических баз//Вестн. Новосиб. гос. ун-та. Серия: Информационные технологии. 2011. Т. 9, вып. 1. С. 89-101. 14. Князева А. А., Колобов О. С., Турчановский И. Ю. Наличие информации для связывания на примере базы данных «MedArt»//Распределенные информационные и вычислительные ресурсы (DICR’2012): Материалы XIV Рос. конф. с междунар. участием [Электронный ресурс]. Новосибирск: ИВТ СО РАН, 2012. CD-ROM. 15. Bennett R., Christal H.-D., O’Neill E. T., Tillett B. VIAF (Virtual International Authority File): Linking the Deutsche Nationalbibliothek and Library of Congress Name Authority Files//International Cataloging and Bibliographic Control. 2007. Vol. 36 (1). P. 12-19. |