Инд. авторы: | Барахнин В.Б., Ткачев Д.А. |
Заглавие: | Оценка эффективности метода параллельной реализации процесса кластеризации текстовых документов на основе алгоритма Fris-Cluster |
Библ. ссылка: | Барахнин В.Б., Ткачев Д.А. Оценка эффективности метода параллельной реализации процесса кластеризации текстовых документов на основе алгоритма Fris-Cluster // Вестник Новосибирского государственного университета. Серия: Информационные технологии. - 2012. - Т.10. - № 4. - С.95-103. - ISSN 1818-7900. - EISSN 2410-0420. |
Внешние системы: | РИНЦ: 18754827; |
Реферат: | eng: This paper presents a variant of the parallel execution of certain phases of the clustering of documents using the algorithm FRiS-Cluster. We give quantitative values of time the process is to demonstrate the benefits of implementing the parallel implementation of the various stages of processing: a preliminary analysis of documents, which includes calculation of similarity measures, and partly in the performance of the clustering process itself. rus: Представлен вариант параллельного выполнения некоторых этапов кластеризации документов с использованием алгоритма FRiS-Cluster. Приведены количественные оценки времени выполнения процесса, наглядно демонстрирующие преимущества внедрения параллельной реализации на различных этапах обработки: при предварительном анализе документов, включающем вычисление мер сходства, а также частично при выполнении непосредственно процесса кластеризации. |
Ключевые слова: | Parallel algorithms; кластеризация текстовых документов; clustering text documents; параллельные алгоритмы; |
Издано: | 2012 |
Физ. характеристика: | с.95-103 |
Цитирование: | 1. Борисова И. А., Загоруйко Н. Г. Функции конкурентного сходства в задаче таксономии // Материалы Всерос. конф. с международным участием «Знания – Онтологии – Теории» (ЗОНТ-07). Новосибирск, 2007. Т. 2. С. 67–76. 2. Борисова И. А., Загоруйко Н. Г. Использование FRiS-функций для решения задачи SDX // International Conference «Classification, Forecasting, Data Mining» CFDM 2009. Varna, 2009. P. 110–116. 3. Барахнин В. Б., Нехаева В. А., Федотов А. М. О задании меры сходства для кластеризации текстовых документов // Вестн. Новосиб. гос. ун-та. Серия: Информационные технологии. 2008. Т. 6, вып. 1. С. 3–9. 4. Киселев М. Метод кластеризации текстов, основанный на попарной близости термов // Сборник работ участников конкурса «Интернет-математика 2007». Екатеринбург: Изд-во Уральского университета, 2007. С. 74–83. 5. Барахнин В. Б., Ткачев Д. А. Кластеризация текстовых документов на основе составных ключевых термов // Вестн. Новосиб. гос. ун-та. Серия: Информационные технологии. 2010. Т. 8, вып. 2. С. 5–14. |