Инд. авторы: Крайванова В.А., Бручес Е.П., Минаков А.М., Анкудинов К.Л., Пчельников Д.В.
Заглавие: Архитектура категоризатора событий в гетерогенном пространстве параметров
Библ. ссылка: Крайванова В.А., Бручес Е.П., Минаков А.М., Анкудинов К.Л., Пчельников Д.В. Архитектура категоризатора событий в гетерогенном пространстве параметров // Ползуновский альманах. - 2018. - № 4. - С.134-138. - ISSN 2079-1097.
Внешние системы: РИНЦ: 36470585;
Реферат: rus: В статье описывается алгоритм определения гетерогенных параметров для текстов, описывающих события: тематику, локации и даты. Описана специфика работы с гетерогенными данными из многих источников. Предложенный алгоритм реализован в виде части проекта LifeLines.
Ключевые слова: тематическое моделирование; извлечение именованных сущностей; text mining; автоматическая обработка текста;
Издано: 2018
Физ. характеристика: с.134-138
Цитирование: 1. LifeLines. Ленты событий [Электронный ресурс] // Агрегатор СМИ исторических фактов. - Электрон. текст. дан. - Новосибирск, 2018. - Режим доступа: https://lifelines.name/lines. 2. Landauer, T. K. Dumais, S. T. A solution to Plato's problem: The Latent Semanctic Analysis theory of the acquisition, induction, and representation of knowledge. Psychological Review 1997, 104, pp. 211-140 3. Mikolov T., Chen K., Corrado G., Dean J. Efficient estimation of word representations in vector space // In Proceedings of ICLR, 2013. 4. Alghamdi R., Alfalqi K. A Survey of Topic Modeling in Text Mining // International Journal of Advanced Computer Science and Applications(IJACSA), 6(1), 2015. - Режим доступа: http://dx.doi.org/10.14569/IJACSA.2015.06012. 5. Бручес Е.П., Крайванова В.А. Снятие омонимии геолокаций на основе частоты встречаемости контекстов // Ползуновский альманах. - 2017. - № 4. - Т. 3. - С. 103-105. 6. Томита-парсер. [Интернет-ресурс] URL: https://tech.yandex.ru/tomita/ 7. Liang Pang, Yanyan Lan, Jiafeng Guo, Jun Xu, Jingfang Xu, and Xueqi Cheng. 2017. DeepRank: A New Deep Architecture for Relevance Ranking in Information Retrieval. In Proceedings of the 2017 ACM on Conference on Information and Knowledge Management (CIKM '17). ACM, New York, NY, USA, 257-266. DOI: https://doi.org/10.1145/ 3132847.3132914 8. Dorogush A., Ershov V., Gulin A. "CatBoost: gradient boosting with categorical features support". Workshop on ML Systems at NIPS 2017. 9. Yadav V., Bethard S. A Survey on Recent Advances in Named Entity Recognition from Deep Learning models // In Proceedings of the 27th International Conference on Computational Linguistics, 2018. Pp. 2145-2158. - Режим доступа: http://aclweb.org/anthology/C18-1182. 10. LifeLines. Ленты событий [Электронный ресурс] // Агрегатор СМИ исторических фактов. - Электрон. текст. дан. - Новосибирск, 2018. - Режим доступа: http://gis-lab.info. 11. Wikidata [Электронный ресурс]. . - Режим доступа: https://www.wikidata.org/wiki/ Wikidata:Main_Page.