На портале "Национальный корпус русского языка" можно найти цитату Пушкина или Цветаевой всего по одному слову, употребленному в ней, и сравнить, как звучало это слово у других писателей, журналистов.
Если заглянуть на страницу этого же портала, то спокойно переведем русское слово на белорусский (или наоборот) и увидим, как оно употребляется в родственном языке у разных авторов. Например, все та же "тоска". У белорусского писателя Леонида Дайнеко в романе "Меч князя вячкi" (1987):
Цiшыня была глыбокая, як калодзеж, як дзявочы СУМ.
Тишина стояла глубокая, как колодец, как девичья тоска.
У Чингиза Айтматова в романе "И дольше века длится день" (1980-1984):
Не вынес разлуки. А тоска - это вещь страшная.
Не вынес разлукi. А МАРКОТА - гэта ж страшна.
В справочнике указывают год сочинения произведения, чтобы пользователь знал, когда употреблялось то или иное слово, и мог отслеживать тенденции в развитии языка.
Справочную базу создали сотрудники Центра исследований белорусской культуры, языка и литературы НАН Беларуси, Минского государственного лингвистического университета и Института русского языка имени В.В. Виноградова Российской академии наук при поддержке Белорусского республиканского фонда фундаментальных исследований.
Владимир Кощенко, научный сотрудник отдела лексикологии и лексикографии Центра исследований белорусской культуры, языка и литературы НАН Беларуси, который работал над созданием и пополнением белорусского раздела "Национального корпуса русского языка", рассказал о том, как составляются такие справочники:
- Мы сканируем тексты, затем вычитываем их, ищем ошибки, исправляем. Этот процесс технически сложный. По сути, на каждый текст составляется свой паспорт. Зато в корпусе вы можете найти, как то или иное слово, выражение употребляется в творчестве разных авторов, в разные временные отрезки, в художественной литературе и прессе. Если сравнить то, как мы работали над исследованием языка в прошлом и сейчас, то можно сказать, тогда "пахали" на лошади, а сегодня - трактором. Компьютеризация позволяет не только обрабатывать намного больше источников, но и делать их доступными через Интернет из любой точки земли.
Дмитрий Сичинава, старший научный сотрудник отдела корпусной лингвистики и лингвистической поэтики Института русского языка им. В.В. Виноградова Российской академии наук:
- Национальный корпус русского языка - это собрание уникальных, не повторяющихся текстов в электронном виде. Для чего он нужен? Чтобы оценивать частотность тех или иных явлений в языке. Если нужны примеры на какое-нибудь орфографическое правило для диктанта, то традиционно учитель придумывал эти примеры из головы или перечитывал классику и находил там эти примеры. Или брал с полки грамматику и выписывал эти примеры. Составители грамматики, в свою очередь, или перечитывали классику и выписывали примеры на карточки, или держали ее в голове. А сейчас можно все найти в корпусе. В корпус русского языка входят параллельные корпуса. Это тексты и их переводы на какой-то язык. Сначала были только англо-русский корпус и немецко-русский. Сейчас уже и украинский, белорусский, польский довольно большие. Есть французский, итальянский, испанский, армянский.