"Это будет первая цифровая перепись в Российской Федерации", - подчеркнул глава Росстата Павел Малков на всероссийском конкурсе президентской платформы "Россия - страна возможностей" "Цифровой прорыв" в Казани.
Потребность в технологиях заметно выросла, поскольку люди все неохотнее открывают дверь при переписи населения и идут на контакт. Или же просто не хотят тратить на это свое время. На конкурсе "Цифровой прорыв" Росстат намерен найти и использовать интересные предложения и идеи участников, связанные с переписью населения. Более того, самым отличившимся участникам могут предложить работу. "Я очень надеюсь, что по итогам хакатона кто-то присоединиться к нашей команде", - сказал Павел Малков.
Еще Росстат планирует задействовать большие данные от сотовых операторов и органов власти при осуществлении переписи. По словам Павла Малкова, несколько европейских стран заявили, что будут использовать в следующем раунде переписи населения большие данные. Росстат также начинает экспериментировать в этом направлении. Большие данные также планируется использовать в статистике туризма и многих других отраслях.
В следующем месяце Росстат приступит к разработке Концепции использования больших данных во всех направлениях статистики. "Планируем к середине следующего года показать", - отметил заместитель руководителя Росстата Сергей Егоренко.
Что касается других направлений, в Росстате планируют сделать более точным расчет индекса потребительских цен. Для этого также будут использованы большие данные других органов власти. Сейчас идет эксперимент с использованием данных Федеральной налоговой службы. Также планируется привлекать данные Банка России, Минэнерго, Пенсионного фонда. В последствие могут быть привлечены еще банки и ретейлеры.
"Мы надеемся, что через какое-то время нам удастся перейти от метода прямого наблюдения, как сейчас считается индекс потребительских цен или инфляция, к расчету индекса потребительских цен на основе данных из административных данных других источников информации", - заключил Павел Малков.
Предстоит научиться работать с большими объемами неструктурированных данных. Как отметил Павел Малков, по каждой из 500 позиций, на основе которых считается индекс потребительских цен, нужно понимать, где брать эти данные, научиться их рассчитывать, сопоставлять с тем, что было раньше. Поэтому потребуется не менее двух-трех лет.
Это расширенная версия текста, опубликованного в номере "РГ"