Инд. авторы: Федотов А.М., Прозоров О.В., Федотова О.А., Бапанов А.А.
Заглавие: О подходе к тематической классификации документов
Библ. ссылка: Федотов А.М., Прозоров О.В., Федотова О.А., Бапанов А.А. О подходе к тематической классификации документов // Вестник Новосибирского государственного университета. Серия: Информационные технологии. - 2017. - Т.15. - № 1. - С.79-88. - ISSN 1818-7900. - EISSN 2410-0420.
Внешние системы: РИНЦ: 28983480;
Реферат: rus: Работа посвящена анализу подходов и алгоритмов классификации текстовых документов. Рассматривается подход к тематической классификации документов. Для этого используется специально построенная мера близости документов, учитывающая специфику предметной области. Значения весовых коэффициентов в формуле для вычисления меры близости определяются предполагаемой априорной достоверностью данных соответствующей шкалы.
eng: The work is devoted to the analysis of approaches and algorithms for the classification of text documents. The approach to the thematic classification of documents is considered. For this purpose, a specially constructed measure of the proximity of documents is used, taking into account the specifics of the subject area. The values of the weight coefficients in the formula for computing the proximity measure are determined by the assumed a priori reliability of the data of the corresponding scale.
Ключевые слова: мера близости; координатное индексирование; документ; nominal scale; measure of proximity; coordinate indexing; document; номинальная шкала;
Издано: 2017
Физ. характеристика: с.79-88
Цитирование: 1. Михайлов А. И., Черный А. И., Гиляревский Р. С. Основы информатики. 2-е изд. М., 1968. 2. Федотов А. М., Тусупов Д. А., Самбетбаева М. А., Еримбетова А. С., Бакиева А. М., Идрисова А. И. Модель определения нормальной формы слова для казахского языка//Вестн. НГУ. Серия: Информационные технологии. 2015. Т. 13, № 1. С. 107-116. ISSN 1818-7900. EISSN 2410-0420. 3. Федотов А. М., Идрисова И. А., Самбетбаева М. А., Федотова О. А. Использование тезауруса в научно-образовательной информационной системе//Вестн. НГУ. Серия: Информационные технологии. 2015. Т. 13, № 2. С. 86-102. ISSN 1818-7900. EISSN 2410-0420. 4. Федотов А. М., Барахнин В. Б., Жижимов О. Л., Федотова О. А. Модель информационной системы для поддержки научно-педагогической деятельности//Вестн. НГУ. Серия: Информационные технологии. 2014. Т. 12, № 1. С. 89-101. ISSN 1818-7900. EISSN 24100420. 5. Большакова Е. И., Клышинский Э. С., Ландэ Д. В., Носков А. А., Пескова О. В., Ягунова Е. В. Автоматическая обработка текстов на естественном языке и компьютерная лингвистика. М.: МИЭМ, 2011. 272 с.