25.03.2020 16:57
    Поделиться

    В Сибири создали алгоритм для перевода дореволюционных изданий

    iStock

    Новосибирские ученые создали систему, позволяющую переводить дореволюционные тексты в современную русскую орфографию

    Старые книги сегодня непонятны для многих россиян. После реформы орфографии русского языка изменились многие правила. Разработанная учеными система автоматически приведет текст в привычный для читателя вид практически без участия человека.

    - В старом правописании морфем можно выделить несколько групп слов, - сообщает официальное издание СО РАН "Наука в Сибири". - Исследователи сопоставили устаревшее и современное написание для каждой из групп и, выявив закономерности между ними, описали правила перевода, лежащие в основе программы.

    После завершения первого этапа перевода программа переходит к этапу замены устаревших букв.

    Алгоритм создан для работы с большими объемами текстов. Он может выполнять рутинную работу редакторов и дает ученым дополнительные инструменты для анализа текстов.

    Исследователи рассчитывают, что проект будет востребован массовыми пользователями, например, библиотеками с большим объемом дореволюционных фондов.

    Поделиться