Инд. авторы: Дурдин Д.С., Витяев Е.Е.
Заглавие: Дополнительный Data Mining модуль для Microsoft SQL Server 2005 на основе системы Discovery
Библ. ссылка: Дурдин Д.С., Витяев Е.Е. Дополнительный Data Mining модуль для Microsoft SQL Server 2005 на основе системы Discovery // Вестник Новосибирского государственного университета. Серия: Информационные технологии. - 2008. - Т.6. - № 2. - С.69-79. - ISSN 1818-7900. - EISSN 2410-0420.
Внешние системы: РИНЦ: 11480498;
Реферат: rus: Компания Microsoft осуществляет интеграцию методов Data Mining в Microsoft SQL Server 2005. Сейчас в SQL запросе к Microsoft SQL Server 2005 можно не только формировать выборку данных, но и вызывать Data Mining модуль, прилагаемый к Microsoft SQL Server 2005. Компания Microsoft предоставила интерфейс прикладного программирования компаниям занимающимся разработкой методов Data Mining для реализации и интеграции своих собственных методов в виде дополнительного модуля к SQL Server 2005. Целью данной работы является разработка дополнительного модуля для Microsoft SQL Server 2005, реализующего систему интеллектуальному анализу данных Discovery. Эта система реализует реляционный подход к обнаружению знаний (Relational Data Mining), основанный на логическом (relational) представлении информации в данных и обнаружении закономерностей путем логико-вероятностного семантического вероятностного вывода. Реляционный подход и реализующая его система Discovery были адаптированы для работы с источниками данных под управлением СУБД Microsoft SQL Server 2005. В результате реализованный программный модуль позволяет извлекать из данных знания, обладающие свойствами статистической значимости и непротиворечивости, а также демонстрирует высокий уровень точности построения прогнозов.
eng: Microsoft Company integrates Data Mining methods and Microsoft SQL Server 2005. Now SQL query to Microsoft SQL Server 2005 may include not only the sample formation but also run some Data Mining method on this sample that is incorporated in Microsoft SQL Server 2005. Microsoft Company produced an open source of API for Data Mining plug-ins development by Data Mining companies. These plug-ins may be automatically integrated in SQL Server 2005. The purpose of this work is plug-in development that realizes the Data Mining system Discovery. This system implements the Relational Data Mining approach for knowledge discovery. It uses logical (relational) representation of the data information and discovers regularities based on the special semantic probabilistic inference. Relational Data Mining approach and system Discovery were adapted for the Microsoft SQL Server 2005 conditions. In result, the realized plug-in may discover knowledge from data with statistical significance and predict with high accuracy.
Ключевые слова: plug-in; DBMS; прогнозирование; Scientific discovery; data mining; модуль; SQL Server; СУБД; prediction;
Издано: 2008
Физ. характеристика: с.69-79
Цитирование: 1. Freitas A. A. Understanding the Crucial Differences Between Classification and Discovery of Association Rules. Pontificia Universidade Catolica - Parana Dept. of Computer Science, 2000. 2. Tang Z., MacLennan J. Data Mining with SQL Server 2005. Wiley Publishing, Inc., 2005. 483 с. 3. Kovalerchuk B., Vityaev E. Correlation of Complex Evidences and Link Discovery // Proc. of the Fifth International Conference on Forensic Statistics. Venice, 2002. 4. Kovalerchuk B., Vityaev E. Data Mining in Finance: Advances in Relational and Hybrid Methods. Kluwer, 2000. 308 с. 5. Витяев Е. Е. Извлечение знаний из данных. Компьютерное познание. Модели когнитивных процессов. Новосибирск, 2006. 293 с. 6. Kovalerchuk B. Comments on the Microsoft Draft Standard (Specification) for Data Mining / Dept. of Computer Science. Central Washington University, 2000. 7. Кендалл М. Дж., Стьюарт А. Статистические выводы и связи. М.: Наука, 1973. 899 с. 8. Закс Ш. Теория статистических выводов. М.: Мир, 1975. 776 с. 9. Halpern J. Y. An analysis of first-order logic of probability. Artificial Intelligence. 1990. С. 311-350. 10. Vityaev E., Kovalerchuk B. Visual Data Mining with Simultaneous Rescaling // Visual and Spatial Analysis. Advances in Data Mining, Reasoning and Problem Solving. Springer, 2004. P. 371-385.