Росстат нашел новые источники для подсчета данных

Полностью отказаться от сбора информации на бумажных носителях, использовать вместо нее административные данные, потоковый сбор, большие данные и информацию, поданную в электронном формате, собирается Росстат с 2022 года, сообщил глава ведомства Павел Малков на общественном совете Росстата в пятницу.

"Немногие из существующих систем могут выступить источником надежных данных для статистики, - предупредил Малков. - Еще нигде в мире большие данные не заменили данные статистики. Нам предстоит научиться использовать новые виды первичной информации для своих целей".

Первым шагом на этом пути будет отказ от бумажной статистической отчетности. Законопроект о переходе на электронную отчетность в пятницу утвердил Совет Федерации.

Росстат выделяет несколько новых источников данных. Есть план расширить использование сведений, которые есть у других госорганов. В том числе у Федеральной налоговой службы и Пенсионного фонда. Там собраны сведения о зарплатах, найме и увольнении сотрудников, их доходах. Надежды есть и на большие и потоковые данные, например, от онлайн-касс магазинов. Из них можно будет брать, например, информацию о текущих ценах - сейчас их собирают регистраторы ведомства, обходя магазины. Ценные сведения могут дать системы бронирования отелей и авиаперелетов, сотовые операторы, банки.

Росстат проводит эксперимент с Пенсионным фондом, по данным этого ведомства рассчитывают 25 показателей, связанных с уровнями занятости и зарплат. Одно из наиболее перспективных направлений - использование показателя медианной зарплаты вместо средней. Медианный размер зарплаты - это сумма, делящая всех работающих на две равные части - одни получают больше, другие - меньше. Малков называет такой показатель более справедливым (70% работников на самом деле получают зарплату ниже средней), кроме того, минтруд планирует исходя из медианного уровня определять минимальный размер оплаты труда. При прежней методике подсчета определить медианное значение удавалось только раз в два года - это намного более трудоемкий процесс, для которого надо собрать данные о каждом работнике в отдельности. Однако, предупреждают в Росстате, выгрузка данных Пенсионного фонда по зарплатам происходит с задержкой в 100-150 дней. Поэтому и данные о медианной зарплате будут определены с отставанием на полгода.

Росстат проводит эксперимент с Пенсионным фондом, по данным этого ведомства рассчитывают 25 показателей, связанных с уровнем занятости и размером зарплат

"Мы не можем просто взять, подключиться к какой-либо системе и разом перейти исключительно на ее использование, - объясняет Малков. - Главная проблема состоит в том, чтобы обеспечить сопоставимость новых показателей с предыдущими данными, иначе они будут бесполезны".

В качестве примера в Росстате приводят опыт работы с единой электронной системой ЗАГС. На адаптацию ее данных по естественному движению населения для нужд Росстата потребовался год работы. Еще больше проблем с информацией от онлайн-касс или внутренних систем учета компаний. Они отличаются по структуре, по наименованиям, по форме представления.