Инд. авторы: Шокин Ю.И., Юрченко А.В.
Заглавие: О моделях организации хранения и использования научных данных: основные принципы, процессы и механизмы
Библ. ссылка: Шокин Ю.И., Юрченко А.В. О моделях организации хранения и использования научных данных: основные принципы, процессы и механизмы // Информационно-управляющие системы. - 2019. - № 3. - С.45-54. - ISSN 1684-8853.
Внешние системы: DOI: 10.31799/1684-8853-2019-3-45-54; РИНЦ: 41148600; SCOPUS: 2-s2.0-85073829575;
Реферат: rus: Введение: проблемы организации хранения и использования научных данных усложняются с ростом их количества и разнообразия, при этом научные данные обладают рядом особенностей, не позволяющих полностью переносить на них подходы и инструменты, используемые в коммерческих и государственных структурах, работающих с данными. Обеспечение исследователей специализированными средствами для оперирования с данными - актуальная задача организации научных исследований. Цель: выявление и описание основных принципов работы с научными данными, процессов и этапов этой работы, механизмов реализации принципов и решений задач организации хранения и использования научных данных. Результаты: рассмотрены и описаны принципы, на которых может основываться хранение и использование научных данных, в том числе FAIR Data Principles. Основная цель организации работы с научными данными и центральный фокус принципов - эффективное использование и переиспользование научных данных. Представлена иерархия механизмов, которые могут применяться при работе с научными данными для решения научных и организационных задач. Перечислены основные процессы / этапы жизненных циклов научных данных и процессов исследований, основанных на них. Рассмотрен ряд принятых моделей таких жизненных циклов. Предлагается вместо попытки построить универсальную модель использовать или создавать модели на основе представленного списка этапов под конкретные случаи или классы задач исследований, основанных на данных. Практическая значимость: сформированная в работе иерархия классов понятий для области «организация хранения и использования научных данных» будет использована как ядро соответствующей онтологии и при разработке нормативных документов, рекомендаций и информационных систем поддержки научных исследований, основанных на данных.
eng: Introduction: Storage and usage of research data become more sophisticated as their quantity and diversity grow. Research data have a number of features which do not allow you to copy the approaches and tools used in commercial or governmental data-processing facilities. Providing researchers with specialized tools for working with data is an urgent task in research management. Purpose: Identifying and describing the basic principles for working with research data, the processes and stages of this work, the mechanisms for implementing the principles and solving the problems of organizing the storage and usage of research data. Results: We review and discuss the principles on which the storage and usage of research data can be based, including the FAIR Data Principles. The main goal of organizing the work with research data and the central focus of its principles is the effective use and reuse of this data. We present a hierarchy of mechanisms which can be applied when working with research data for solving scientific and organizational problems. The main processes and lifecycle stages of scientific data and research processes based on them are listed in the article. A number of well-known models of such lifecycles are considered. It is proposed, instead of trying to build a universal model, to use or create models based on the presented list of stages for specific cases or classes of data-driven research. Practical relevance: The hierarchy of concept classes developed in the work for the field “Organizing the storage and usage of scientific data” will be used as an ontology core, and for the development of regulatory documents, recommendations and information systems supporting data-driven research.
Ключевые слова: жизненный цикл научных данных; управление данными; основанные на данных научные исследования; научные данные; scientific information system; research data lifecycle; data management; data-driven research; research data; FAIR data principles; научная информационная система;
Издано: 2019
Физ. характеристика: с.45-54
Цитирование: 1. Cox A. M., Tam W. A critical analysis of lifecycle models of the research process and research data management. Aslib Journal of Information Management, 2018, vol. 70, iss. 2, pp. 142-157. doi:10.1108/AJIM-11-2017-0251 2. Земсков А. И. Data Curation -хранение научных данных и обслуживание ими -новое направление деятельности библиотек. Научные и технические библиотеки, 2013, № 2, с. 85-101. http://www. gpntb.ru/ntb/ntb/2013/2/ntb_2_10_2013.pdf (дата обращения: 30.04.2019). 3. Мелдо А. А., Уткин Л. В., Моисеенко В. М. Алгоритмы диагностики XXI века. Искусственный интеллект в распознавании рака легкого. Практическая онкология, 2018, т. 19, № 3, с. 292-298. doi:10. 31917/1903292 4. Лушнов М. С., Лушнов А. М., Липовицкая И. Н., Головина Е. Г., Ступишина О. М. Медицинская статистика и идентификация факторов риска для здоровья человека в пространстве биосферы. Биосфера, 2010, т. 2, № 1. https://cyberleninka.ru/article/n/meditsinskaya-statistika-i-identifikatsiya-faktorov-riska-dlya-zdorovya-cheloveka-v-prostranstve-biosfery (дата обращения: 30.04.2019). 5. Юрченко А. В. К концепции информационно-аналитической системы поддержки научных исследований, основанных на интенсивном использовании цифровых данных. Вычислительные технологии, 2017, т. 22, № 4, c. 105-120. 6. Городничев М. А., Комиссаров А. В., Можина А. В., Прочкин П. В., Рудыч П. Д., Юрченко А. В. Модели и проектные решения системы хранения и обработки исследовательских данных Ecclesia. Вестник НГУ. Серия: Информационные технологии, 2018, т. 16, № 3, с. 87-104. doi:10.25205/1818-7900-2018-16-3-87-104 7. Юрченко А. В. О сервисном подходе к формированию и оценке востребованности киберинфраструктуры науки. Информационные технологии, 2018, т. 24, № 4, с. 219-232. doi:10.17587/it.24.219-232 8. Шокин Ю. И., Федотов А. М., Барахнин В. Б. Проблемы поиска информации. Новосиб.., Наука, 2010. 197 с. 9. Федотов А. М., Леонова Ю. В. Требования к прототипу системы управления информационными ресурсами в распределенных информационных системах поддержки научных исследований. Вычислительные технологии, 2018, т. 23, № 5, c. 82-109. doi:10.25743/ICT.2018.23.5.008 10. Wilkinson M. D., et al. The FAIR guiding principles for scientific data management and stewardship. Scientific Data, 2016, vol. 3, article number: 160018. doi:10.1038/sdata.2016.18 11. GO FAIR Initiative. https://www.go-fair.org/fair-principles/(дата обращения: 30.04.2019). 12. Paskin N. Digital Object Identifier (DOI®) System. Encyclopedia of Library and Information Sciences. Third Edition. 2010. Available at: http://www.doi. org/overview/080625DOI-ELIS-Paskin.pdf (accessed 30 April 2019). 13. Towards the Semantic Web: Ontology-driven Knowledge Management/Ed. John Davies, Dieter Fensel and Frank van Harmelen. John Wiley 14. Yozwiak N. L., Schaffner S. F., Sabeti P. C. Data sharing: Make outbreak research open access. Nature, 2015, vol. 518, iss. 7540, pp. 477-479. doi:10.1038/518477a 15. Cutcher-Gershenfeld J., et al. Five ways consortia can catalyse open science. Nature, 2017, vol. 543, iss. 7647, pp. 615-617. doi:10.1038/543615a 16. Allan R. Virtual research environments. From portals to science gateways. Chandos Publishing, Oxford, UK, 2009. 284 p. 17. Faundeen J. L., Burley T. E., Carlino J. A., Govoni D. L., Henkel H. S., Holl S. L., Hutchison V. B., Martm E., Montgomery E. T., Ladino C. C., Tessler S., Zolly L. S. 2013. The United States Geological Survey Science Data Lifecycle Model. U.S. Geological Survey Open-File Report, 2013, 1265, 4 p. doi:10.3133/ofr20131265 18. Data Life Cycle Models and Concepts. CEOS Version 1.2. 2012. Available at: http://wgiss.ceos.org/dsig/whitepapers/Data Lifecycle Models and Concepts v12.docx (accessed 30 April 2019). 19. Wissik T., Durco M. Research data workflows: from research data lifecycle models to institutional solutions. CLARIN 2015 Selected Papers, Linkoping Electronic Conference Proceedings, Annual Conference 2015, Wroclaw, Poland, October 14-16, 2015, Linkoping University Electronic Press, Linkopings universitet, 2015, pp. 94-107. Available at: http://www.ep.liu.se/ecp/123/008/ecp15123008.pdf (accessed 30 April 2019).