Исследователи собрали 3,3 миллиона научных рефератов по материаловедению, опубликованных в более чем тысяче журналов с 1922 по 2018 годы, и загрузили их в суперЭВМ. Машина вообще ничего не знала о материаловедении и по разработанному алгоритму анализировала лишь связи между словами. Результат стал для ученых полной неожиданностью. Алгоритм фактически заново открыл периодическую таблицу элементов и кристаллическую структуру металлов. А еще смог предсказать открытие новых термоэлектрических материалов на годы вперед.
Работа алгоритма основана на превращении каждого из примерно 500 000 различных слов из рефератов в набор из 200 чисел (200-мерный вектор), характеризующий, как слова связаны друг с другом. Вектора можно сравнивать, вычитать, складывать и т.д. В итоге выявляются некоторые отношения между этими понятиями, даже если машина не знает их значений.
Ученые провели еще один любопытный эксперимент. Они заложили в компьютер рефераты только до определенной даты, скажем, до 2000 года, и проверили, предскажет ли он материалы, реально открытые после нее. Оказалось, предсказывает! Отсюда вывод: имея такой алгоритм, некоторые известные сейчас материалы могли быть обнаружены на много лет раньше, чем это фактически произошло.
Уже говорят, что в самом ближайшем будущем многие профессии исчезнут. Не замахнулся ли алгоритм и на ученого? Неужели Менделеевы будут не нужны и останутся без работы?