Что такое ГосДата.хаб и какие данные будут в него входить?

Категория:  Законодательство
Ответ редакции

В России создадут ГосДата.хаб — проект, объединяющий потоки обезличенных данных госорганов. Огромный массив данных позволит анализировать состояние различных отраслей экономики и в итоге сформировать расширенную аналитику.

   
   

В Минцифры сообщают, что реализация проекта намечена на 2022-2024 годы, а в опытную эксплуатацию система будет запущена в 2023 году. 

Зачем нужен ГосДата.хаб?

Национальный репозитарий необходим для хранения и обработки данных для государственных аналитических сервисов. Он упростит подготовку отчетов госорганам и бюджетным организациям благодаря автоматизированному формированию документов по заданным алгоритмам. Все собранные данные будут попадать в озеро данных в обезличенном виде. Их деперсонализация будет происходить на стороне поставщика данных.

Что такое озеро данных? 

Озером данных (DataLake) называют крупные объемы данных, собранные в «сыром» виде. В таком репозитарии хранятся необработанные данные в их оригинальном формате до тех пор, пока они не понадобятся. Одним из преимуществ озер данных перед хранилищами данных является возможность хранить данные или файлы любого типа — в отличие от более структурированной среды. Еще одно преимущество заключается в том, что при организации озера данных не требуется определять цель его использования, в то время как хранилище данных создается как хранилище для отфильтрованных данных, которые уже обработаны с какой-либо конкретной целью.

Кто будет иметь доступ к ГосДата.хаб?

На первом этапе данные из «ГосДата.хаба» будут доступны для госорганов. В перспективе доступ к ним также получит бизнес. Для этого будет создан датамаркет — один из публичных контуров Национальной системы управления данными (НСУД).

Проект будет развиваться в трех ключевых направлениях:

  • разработка автоматизированной интегрированной системы сбора обезличенных данных из государственных информационных систем;
  • создание дата-сервисов и использование государственных данных для анализа состояния отраслей экономики и социальной сферы;
  • предоставление обезличенных государственных данных бизнесу и гражданам, в первую очередь — разработчикам решений на основе искусственного интеллекта.

Источник 

   
   

https://digital.gov.ru/ru/events/41556/