05.06.2019 14:04
    Поделиться

    Фекла Толстая представила поисковик по текстам Льва Толстого

    На книжном фестивале "Красная площадь" телеведущая Фекла Толстая представила новый образовательный проект - электронный поисковик по текстам автора "Войны и мира".

    Проект осуществляется Государственным музеем Л. Н. Толстого, Музеем-усадьбой "Ясная Поляна" и компанией ABBYY, разрабатывающей технологии в области распознавания текстов. 

    "Такого еще не было. Это совершенно новая штука!" - заверила Фекла в начале презентации. Проект представляет собой электронный поисковик по всему миру текстов Льва Николаевича - а это 90 томов.

    Ранее уже был реализован проект "Весь Толстой в один клик". Он заключался в оцифровке наследия писателя. Волонтеры со всего мира справились за две недели. Сложность состояла в разделении основного текста и комментариев, названий и эпиграфов. Сегодня благодаря тому первому проекту все 90 томов можно скачать в любом формате.

    Но разработчики на этом не остановились. "Мы захотели сделать более сложный поиск, который дал бы возможность навигации по всем текстам Толстого", - объяснила Толстая.

    На сайте tolstoy.ru тексты писателя разделены по жанрам (драматургия, отрывки, повести и т.д.), по типам (например, письма) и по датам (сюда можно вбить любую дату и узнать, что писатель делал в это время).

    Искать можно как угодно. Например, по жанру. Как думаете, Толстой писал стихи? Вбиваешь "поэзия", и компьютер выдает стихи писателя. А если "романы", получаем всем известные: "Анна Каренина", "Война и мир", "Воскресение"…

    Сложность, с которой столкнулись разработчики: Толстой писал старой орфографией, а сейчас его произведения издаются в новой. Поисковая система благодаря работе лингвистов и программистов решает вопрос старинных еров и ятей. Какая бы ни была орфография, машина поймет и найдет то, что ищешь.

    И еще одна особенность. Когда вбиваешь определенное слово, помимо цитаты, в которой оно было использовано, сайт подсказывает тип текста, название произведения, дату написания. Нужное слово найдется в любых своих формах.

    Важно, что в поиске по названиям разработчики используют не только известные версии, но и те, которые встречались в черновиках и ранних редакциях писателя. Так, вбив имя Степан Аркадьевич Алабин, мы получаем ссылку на Стиву Облонского.

    В конце презентации разработчики рассказали о будущих планах: поиск по синонимам, расширение жанров, возможность скачивания в формате Excel. "Поиск должен быть удобным, и мы к этому стремимся", - подытожила Фекла.

    Поделиться