Подсчет результатов переписи проходит в два этапа. Сначала переписные листы обрабатывают в регионах. Из 83 территориальных органов Росстата 68 оснащены специальными сканерами, позволяющими проводить автоматизированную обработку данных.
Помимо своих листов в этих центрах существуют еще и соседские. Из тех регионов, где таких сканеров нет. Скорость сканирования этой машины до 150 бланков в минуту. Специальная программа, содержащая в себе некий словарь подчерков, распознает информацию, записанную графическими метками, цифрами и словами. Важно, что и эти машины, и их программное обеспечение разработаны российскими специалистами.
После сканирования осуществляется экранное кодирование. За каждым регионом (вопрос о месте рождения), национальностью, языком закреплен свой код. В ходе экранного кодирования специальная программа распознает рукописную запись и присваивает ей соответствующий код. Также она "собирает" старые и новые названия под один код. То есть Украинская ССР и Украина будут иметь один номер.
- Это очень ускоряет процесс обработки, - поделилась с журналистами Ольга Титова, начальник отдела информационного обеспечения переписи населения.
Затем оператор исправляет ошибки, допущенные переписчиком при заполнении бланка. Удобно, что программа сама выделяет поля, где допущена неточность. Например, если у 4-летнего ребенка есть отметка об ученой степени или у коренного москвича заполнено поле, касающееся переезда в Москву. Так осуществляется формально-логический контроль данных. На этом этапе ошибки делятся на "мягкие" и "жесткие". Первые можно игнорировать. Либо потому, что они несущественные, либо потому, что исправить их невозможно. Например, если у женщины не заполнена графа о количестве рожденных детей. "Мы здесь ничего не дописываем", - подчеркнула Ольга Титова.
После проверки данных каждый регион присылает DVD-диски с полученной информацией в главный межрегиональный центр обработки и распространения статистической информации. Диски, как и бланки, хранятся и транспортируются в специальных портфелях. К каждому такому портфелю прилагается сопроводительное письмо. Сколько бланков записано и сколько дисков и т.д.
Когда все диски будут получены, начнется формирование центрального хранилища данных, то есть запись полученной информации на сервера. Начальник управления статистики населения и здравоохранения Росстата Ирина Збарская рассказала, что там информация будет храниться вечно. В то время как бумажная версия бланков хранится лишь год после официальной публикации результатов, которая должна быть проведена до 2013 года. Однако первые "цифры" будут уже к концу текущего года. На вопрос конфиденциальности, так волновавший население, Ирина Збарская пояснила, что уже на региональном уровне обработки листы с именами и фамилиями не встречаются.