Проект осуществляется Государственным музеем Л. Н. Толстого, Музеем-усадьбой "Ясная Поляна" и компанией ABBYY, разрабатывающей технологии в области распознавания текстов.
"Такого еще не было. Это совершенно новая штука!" - заверила Фекла в начале презентации. Проект представляет собой электронный поисковик по всему миру текстов Льва Николаевича - а это 90 томов.
Ранее уже был реализован проект "Весь Толстой в один клик". Он заключался в оцифровке наследия писателя. Волонтеры со всего мира справились за две недели. Сложность состояла в разделении основного текста и комментариев, названий и эпиграфов. Сегодня благодаря тому первому проекту все 90 томов можно скачать в любом формате.
Но разработчики на этом не остановились. "Мы захотели сделать более сложный поиск, который дал бы возможность навигации по всем текстам Толстого", - объяснила Толстая.
На сайте tolstoy.ru тексты писателя разделены по жанрам (драматургия, отрывки, повести и т.д.), по типам (например, письма) и по датам (сюда можно вбить любую дату и узнать, что писатель делал в это время).
Искать можно как угодно. Например, по жанру. Как думаете, Толстой писал стихи? Вбиваешь "поэзия", и компьютер выдает стихи писателя. А если "романы", получаем всем известные: "Анна Каренина", "Война и мир", "Воскресение"…
Сложность, с которой столкнулись разработчики: Толстой писал старой орфографией, а сейчас его произведения издаются в новой. Поисковая система благодаря работе лингвистов и программистов решает вопрос старинных еров и ятей. Какая бы ни была орфография, машина поймет и найдет то, что ищешь.
И еще одна особенность. Когда вбиваешь определенное слово, помимо цитаты, в которой оно было использовано, сайт подсказывает тип текста, название произведения, дату написания. Нужное слово найдется в любых своих формах.
Важно, что в поиске по названиям разработчики используют не только известные версии, но и те, которые встречались в черновиках и ранних редакциях писателя. Так, вбив имя Степан Аркадьевич Алабин, мы получаем ссылку на Стиву Облонского.
В конце презентации разработчики рассказали о будущих планах: поиск по синонимам, расширение жанров, возможность скачивания в формате Excel. "Поиск должен быть удобным, и мы к этому стремимся", - подытожила Фекла.