Инд. авторы: Барахнин В.Б., Ткачев Д.А.
Заглавие: Оценка эффективности метода параллельной реализации процесса кластеризации текстовых документов на основе алгоритма Fris-Cluster
Библ. ссылка: Барахнин В.Б., Ткачев Д.А. Оценка эффективности метода параллельной реализации процесса кластеризации текстовых документов на основе алгоритма Fris-Cluster // Вестник Новосибирского государственного университета. Серия: Информационные технологии. - 2012. - Т.10. - № 4. - С.95-103. - ISSN 1818-7900. - EISSN 2410-0420.
Внешние системы: РИНЦ: 18754827;
Реферат: eng: This paper presents a variant of the parallel execution of certain phases of the clustering of documents using the algorithm FRiS-Cluster. We give quantitative values of time the process is to demonstrate the benefits of implementing the parallel implementation of the various stages of processing: a preliminary analysis of documents, which includes calculation of similarity measures, and partly in the performance of the clustering process itself.
rus: Представлен вариант параллельного выполнения некоторых этапов кластеризации документов с использованием алгоритма FRiS-Cluster. Приведены количественные оценки времени выполнения процесса, наглядно демонстрирующие преимущества внедрения параллельной реализации на различных этапах обработки: при предварительном анализе документов, включающем вычисление мер сходства, а также частично при выполнении непосредственно процесса кластеризации.
Ключевые слова: Parallel algorithms; кластеризация текстовых документов; clustering text documents; параллельные алгоритмы;
Издано: 2012
Физ. характеристика: с.95-103
Цитирование: 1. Борисова И. А., Загоруйко Н. Г. Функции конкурентного сходства в задаче таксономии // Материалы Всерос. конф. с международным участием «Знания – Онтологии – Теории» (ЗОНТ-07). Новосибирск, 2007. Т. 2. С. 67–76. 2. Борисова И. А., Загоруйко Н. Г. Использование FRiS-функций для решения задачи SDX // International Conference «Classification, Forecasting, Data Mining» CFDM 2009. Varna, 2009. P. 110–116. 3. Барахнин В. Б., Нехаева В. А., Федотов А. М. О задании меры сходства для кластеризации текстовых документов // Вестн. Новосиб. гос. ун-та. Серия: Информационные технологии. 2008. Т. 6, вып. 1. С. 3–9. 4. Киселев М. Метод кластеризации текстов, основанный на попарной близости термов // Сборник работ участников конкурса «Интернет-математика 2007». Екатеринбург: Изд-во Уральского университета, 2007. С. 74–83. 5. Барахнин В. Б., Ткачев Д. А. Кластеризация текстовых документов на основе составных ключевых термов // Вестн. Новосиб. гос. ун-та. Серия: Информационные технологии. 2010. Т. 8, вып. 2. С. 5–14.