Инд. авторы: Пестунов И.А., Бериков В.Б., Куликова Е.А., Рылов С.А.
Заглавие: Ансамблевый алгоритм кластеризации больших массивов данных
Библ. ссылка: Пестунов И.А., Бериков В.Б., Куликова Е.А., Рылов С.А. Ансамблевый алгоритм кластеризации больших массивов данных // Автометрия. - 2011. - Т.47. - № 3. - С.49-58. - ISSN 0320-7102.
Внешние системы: РИНЦ: 17023892;
Реферат: rus: Предложен и теоретически обоснован ансамблевый алгоритм кластеризации ECCA (Ensemble of Combined Clustering Algorithms) для обработки больших массивов данных. Представлены результаты экспериментального исследования алгоритма на модельных и реальных данных, подтверждающие его эффективность.
eng: The ensemble clustering algorithm ECCA (Ensemble of Combined Clustering Algorithms) for processing large datasets is proposed and theoretically substantiated. Results of an experimental study of the algorithm on simulated and real data proving its effectiveness are presented.
Ключевые слова: grid-based approach; ensemble clustering algorithm; большие массивы данных; сеточный подход; ансамблевый алгоритм кластеризации; large datasets;
Издано: 2011
Физ. характеристика: с.49-58
Цитирование: 1. Jain A. K. Data clustering: 50 years beyond K-means // Pattern Recogn. Lett. 2010. 31, Is. 8. P. 651-666. 2. Mercer D. P. Clustering large datasets. Linacre College, 2003. URL: http://www.stats.ox.ac.uk~mercer/documents/Transfer.pdf (дата обращения: 21.03.2011). 3. Ilango M. R., Mohan V. A survey of grid based clustering algorithms // Intern. Journ. Eng. Sci. and Technol. 2010. 2, N 8. P. 3441-3446. 4. Qiu B.-Z., Li X.-L., Shen J.-Y. Grid-based clustering algorithm based on intersecting partition and density estimation // Lect. Notes Artif. Intel. 2007. 4819. P. 368-377. 5. Akodjènou-Jeannin M.-I., Salamatian K., Gallinari P. Flexible grid-based clustering // Lect. Notes Artif. Intel. 2007. 4702. P. 350-357. 6. Ma Eden W. M., Chow Tommy W. S. A new shifting grid clustering algorithm // Pattern Recogn. 2004. 37, N 3. P. 503-514. 7. Lin N. P., Chang C.-I., Chueh H.-E. et al. A Deflected grid-based algorithm for clustering analysis // WSEAS Transactions on Computers. 2008. 7, N 4. P. 125-132. 8. Shi Y., Song Y., Zhang A. A shrinking-based approach for multi-dimensional data analysis // Proc. of the 29th VLDB Conference. Berlin, Germany, 2003. P. 440-451. 9. Куликова Е. А., Пестунов И. А., Синявский Ю. Н. Непараметрический алгоритм кластеризации для обработки больших массивов данных // Тр. 14 Всеросс. конф. «Математические методы распознавания образов». М.: Изд-во MAKS Press, 2009. С. 149-152. 10. Strehl A., Ghosh J. Clustering ensembles - a knowledge reuse framework for combining multiple partitions // Journ. Machine Learning Research. 2002. 3. P. 583-617. 11. Бирюков А. С., Рязанов В. В., Шмаков А. С. Решение задач кластерного анализа коллективами алгоритмов // Журн. вычисл. матем. и матем. физики. 2008. 48, № 1. С. 176-192. 12. Hong Y., Kwong S. To combine steady-state genetic algorithm and ensemble learning for data clustering // Pattern Recogn. Lett. 2008. 29, N 9. P. 1416-1423. 13. Berikov V. B. Construction of the ensemble of logical models in cluster analysis // Lect. Notes Artif. Intel. 2009. 5755. P. 581-590. 14. Дуда Р., Харт П. Распознавание образов и анализ сцен. М.: Мир, 1976. 559 с. 15. Кендал М., Стьюарт А. Многомерный статистический анализ и временные ряды. М.: Наука, 1976. С. 441-443. 16. Ester M., Kriegel H.-P., Sander J., Xu X. A density-based algorithm for discovering clusters in large spatial database // Proc. of the Intern. Conf. Knowledge Discovery and Data Mining (KDD`96). 1996. P. 226-231.