Новости

23.12.2020 19:17
Рубрика: Общество

Digital Пётр

Искусственный интеллект расшифровал неразборчивый почерк императора
В ходе проекта "Digital Пётр", проводимого Российским историческим обществом (РИО) совместно со СберБанком, были расшифрованы трудно читаемые из-за плохого почерка рукописи Петра I. Это петровское наследие за 26 лет. Впереди у специалистов по анализу данных и искусственному интеллекту еще сто миллионов страниц документов. Но это, как выяснилось на "круглом столе", посвященном 350-летию со дня рождения Петра I, работа нескольких дней.
Нерасшифрованными остаются более ста миллионов страниц рукописного текста. Фото: Российское историческое общество Нерасшифрованными остаются более ста миллионов страниц рукописного текста. Фото: Российское историческое общество
Нерасшифрованными остаются более ста миллионов страниц рукописного текста. Фото: Российское историческое общество

"В течение многих лет изучение выдающейся личности Петра I сдерживалось медленными темпами публикации его рукописного наследия, - начал совещание глава РИО Сергей Нарышкин. - Первый сборник из серии "Письма и бумаги Петра Великого" вышел из печати еще в 1887 году, однако сегодня эта работа по-прежнему далека от своего завершения. Одной из причин ее огромной трудоемкости является неразборчивый почерк императора. Чтобы ускорить введение петровских рукописей в научный и общественный оборот, РИО и СберБанк инициировали проект "Digital Пётр", направленный на расшифровку автографов правителя при помощи новейших информационных технологий".

Как рассказал первый зампред правления СберБанка Александр Ведяхин, удалось получить очень высокую точность: более 98 процентов расшифровки. Европейские же международные аналоги дают для схожих задач 50-60 процентов точности распознавания. "Мы работали вместе с историками и не только применили впервые компьютерное зрение, которое умеет понимать этот сложный текст, но и подгружали знания контекста, о котором писал Петр, - сообщил он. - Получилось расшифровать материалы за 26 лет. Это большой шаг вперед не только с точки зрения исторических знаний, но и с точки зрения математической мысли в России. Можно сказать, мировой рекорд".

Скоропись Петра I прочитали с 98-процентной точностью

Впереди у специалистов по искусственному интеллекту огромная работа: нерасшифрованными остаются более ста миллионов страниц рукописного текста. Однако это только звучит страшно, убежден Александр Ведяхин: "Тот алгоритм, который мы сделали вместе, позволит расшифровать это за короткий промежуток времени. Для примера рукописная книга в 800 страниц может быть расшифрована за 20 минут".

Когда 100 миллионов страниц будут отсканированы, а для этой работы собираются привлечь студентов, перед айтишниками встанет задача сбора "кусков" текста по тематикам. "Такое количество страниц одному человеку невозможно прочитать даже за всю свою жизнь, поэтому искусственный интеллект должен подсказывать, как сгруппированы документы, и выделить в них главное", - объяснил специалист и пообещал, что в России появится специальная платформа для расшифровки русской скорописи. Она будет открытой: историки и любители смогут загружать туда документы и получать расшифровку.

Общество История Роботы: настоящее и будущее