Что такое ГосДата.хаб и какие данные будут в него входить?
В России создадут ГосДата.хаб — проект, объединяющий потоки обезличенных данных госорганов. Огромный массив данных позволит анализировать состояние различных отраслей экономики и в итоге сформировать расширенную аналитику.
В Минцифры сообщают, что реализация проекта намечена на 2022-2024 годы, а в опытную эксплуатацию система будет запущена в 2023 году.
Зачем нужен ГосДата.хаб?
Национальный репозитарий необходим для хранения и обработки данных для государственных аналитических сервисов. Он упростит подготовку отчетов госорганам и бюджетным организациям благодаря автоматизированному формированию документов по заданным алгоритмам. Все собранные данные будут попадать в озеро данных в обезличенном виде. Их деперсонализация будет происходить на стороне поставщика данных.
Что такое озеро данных?
Озером данных (DataLake) называют крупные объемы данных, собранные в «сыром» виде. В таком репозитарии хранятся необработанные данные в их оригинальном формате до тех пор, пока они не понадобятся. Одним из преимуществ озер данных перед хранилищами данных является возможность хранить данные или файлы любого типа — в отличие от более структурированной среды. Еще одно преимущество заключается в том, что при организации озера данных не требуется определять цель его использования, в то время как хранилище данных создается как хранилище для отфильтрованных данных, которые уже обработаны с какой-либо конкретной целью.
Кто будет иметь доступ к ГосДата.хаб?
На первом этапе данные из «ГосДата.хаба» будут доступны для госорганов. В перспективе доступ к ним также получит бизнес. Для этого будет создан датамаркет — один из публичных контуров Национальной системы управления данными (НСУД).
Проект будет развиваться в трех ключевых направлениях:
- разработка автоматизированной интегрированной системы сбора обезличенных данных из государственных информационных систем;
- создание дата-сервисов и использование государственных данных для анализа состояния отраслей экономики и социальной сферы;
- предоставление обезличенных государственных данных бизнесу и гражданам, в первую очередь — разработчикам решений на основе искусственного интеллекта.
Источник