Инд. авторы: | Кихтенко В.А., Чубаров Д.Л. |
Заглавие: | Технологии параллельной обработки данных в задачах анализа больших объёмов спутниковых снимков |
Библ. ссылка: | Кихтенко В.А., Чубаров Д.Л. Технологии параллельной обработки данных в задачах анализа больших объёмов спутниковых снимков [Электронный ресурс] // Тезисы докладов четырнадцатой открытой всероссийской конференции «Современные проблемы дистанционного зондирования Земли из космоса». - 2016. - Москва. - ISBN: 978-5-00015-007-8. - http://smiswww.iki.rssi.ru/d33_conf/thesisshow.aspx?page=133&thesis=5843 |
Внешние системы: | РИНЦ: 28175422; |
Реферат: | rus: В настоящее время сложилась ситуация, когда постоянное возрастание потоков данных дистанционного зондирования (ДДЗ) привело к накоплению сверхбольших объемов информации, а расширение областей их использования и развитие методов и алгоритмов обработки порождает ряд задач в области информационных технологий. Так, при выполнении исследований, требующих агрегации больших объемов ДДЗ, производить обработку данных только на одной рабочей станции уже не представляется возможным. В некоторых случаях одна только загрузка всех необходимых снимков из архива уже требует больших временных затрат. Таким образом, возникает необходимость в использовании распределенных систем анализа данных.
Существует множество таких систем, в качестве примера можно назвать Hadoop, Spark, SciDB, Presto и им подобные. Однако применение этих систем для обработки спутниковых данных связано с рядом трудностей. Во-первых, это необходимость создания модели данных дистанционного зондирования, которая, с одной стороны, обеспечивала бы удобство разработки алгоритмов анализа, а с другой, позволяла бы управляемое автоматическое распараллеливание процесса обработки. Во-вторых, аналитику данных требуется интерактивная среда разработки алгоритмов, обеспечивающая визуализацию результатов расчетов и быстрый отклик на изменения алгоритма обработки или его параметров. При этом важно учитывать пространственную природу данных и предоставить инструменты типичные для ГИС.
По мнению авторов, эффективная реализация такой системы возможна только в результате дополнения существующих архивов спутниковых данных сервисом высокопроизводительной распределенной обработки, способным выполнять пользовательские алгоритмы максимально близко к данным, для чего потребуются значительные аппаратные ресурсы.
В то же время, архивы спутниковых данных зачастую уже поддерживают различные приложения по преобразованию и предоставлению данных, и перед ними стоит задача оптимального использования имеющихся вычислительных мощностей. Эта задача может решаться как применением технологий виртуализации и контейнеризации - каждое приложение “упаковывается” в свой индивидуальный контейнер или виртуальную машину, так и развертыванием этих приложений поверх распределенной высокопроизводительной системы извлечения и обработки данных. В последнем случае эта система становится вычислительным ядром архива.
В докладе описывается опыт создания и эксплуатации системы доступа и аналитической обработки спутниковых снимков hVault, основанной на отображении спутниковых снимков в реляционную модель данных и выполнению запросов к ним на языке SQL, которую мы рассматриваем как прототип высокопроизводительной системы извлечения и обработки данных. Обсуждаются вопросы разделения ресурсов между hVault и другими приложениями и создания приложений на основе hVault. Приводятся оценки производительности и возможности для дальнейшего развития системы.
Работа выполнена при поддержке гранта РФФИ 16-37-00118 мол_а и программы фундаментальных исследований Президиума РАН по стратегическим направлениям развития науки №43П. |
Ключевые слова: | обработка спутниковых данных; геопространственные данные; дистанционное зондирование Земли; Большие Данные; высокопроизводительная обработка; |
Издано: | 2016 |
Ссылка: | http://smiswww.iki.rssi.ru/d33_conf/thesisshow.aspx?page=133&thesis=5843 |
Конференция: | Название: Четырнадцатая Всероссийская открытая конференция «Современные проблемы дистанционного зондирования Земли из космоса» Город: Москва Страна: Россия Даты проведения: 2016-11-14 - 2016-11-18 Ссылка: http://smiswww.iki.rssi.ru/d33_conf/default.aspx?page=126 |