Новосибирские ученые создали систему, позволяющую переводить дореволюционные тексты в современную русскую орфографию
Старые книги сегодня непонятны для многих россиян. После реформы орфографии русского языка изменились многие правила. Разработанная учеными система автоматически приведет текст в привычный для читателя вид практически без участия человека.
- В старом правописании морфем можно выделить несколько групп слов, - сообщает официальное издание СО РАН "Наука в Сибири". - Исследователи сопоставили устаревшее и современное написание для каждой из групп и, выявив закономерности между ними, описали правила перевода, лежащие в основе программы.
После завершения первого этапа перевода программа переходит к этапу замены устаревших букв.
Алгоритм создан для работы с большими объемами текстов. Он может выполнять рутинную работу редакторов и дает ученым дополнительные инструменты для анализа текстов.
Исследователи рассчитывают, что проект будет востребован массовыми пользователями, например, библиотеками с большим объемом дореволюционных фондов.