Разработана нейросеть для полного восстановления древних текстов

Nature / Assael, Y., Sommerschield, T., Shillingford, B.

Международная группа из историков и IT-специалистов разработала искусственный интеллект для перевода и восстановления документов на древних языках.

В статье журнала Nature разработчики пишут, что содержание многих сохранившихся до наших времен документов сложно узнать из-за повреждений, а некоторые материалы не позволяют применять радиоуглеродное датирование, поэтому нельзя узнать возраст записи, что, в свою очередь, затрудняет ее интерпретацию.

Так появилась "Итака" - первая нейросеть, которая может восстановить недостающий текст на поврежденных записях, определить их происхождение и дату создания. Ее обучали на крупнейшем собрании греческих текстов. В ход шли как и целые документы, чтобы нейросеть могла понимать контекст, так и слова и отдельные символы.

Как объясняют разработчики - это расширенная версия предыдущей системы - "Пифии". "Итака" при восстановлении достигает точности в 62 процента, при определении места создания - точности в 71 процент. Она может датировать тексты с точностью до 30 лет. Систему уже опробовали историки для переоценки важных периодов греческой истории.

Кстати, создатели заявили о запуске бесплатной версии ИИ - для исследователей, преподавателей и сотрудников музеев. Чтобы сделать "Итаку" максимально ценным инструментом, разработали пособия, чтобы пользователи могли легко интерпретировать полученные с помощью системы данные, так как она генерирует несколько возможных вариантов восстановления текста - нужный выбирает ученый, опираясь на свой опыт.

Поделиться