Еще бы, тут есть и словарные статьи, и целые книги, и статьи прессы, и пустая болтовня пользователей. Поисковые машины все это запоминают и помогают находить интересующие страницы по ключевым словам. Только вот что не удастся, так это получить однозначный ответ на конкретный вопрос. Но некоторые "точные" исследования провести можно. Ведь поисковые системы запоминают не только страницу, на которой они встречали искомое слово. Они знают, какие слова стояли рядом. Это позволяет оценивать традиционные связи слов. Не подумайте, что "штампы" в текстах Интернета интересны лишь филологам: исследование собственного языка - дело увлекательное, почти игра. Более того - поисковые системы специально превращают подобные изыскания в развлечение.
Например, поисковая машина Punto.ru позволяет находить определения слов - для этого ее авторы создали сервис "Мудрец" (punto.ru/definition/). Скажем, системе не составляет труда объяснить, в чем смысл жизни (по мнению Интернета, конечно). Смыслы жизни - это "создавать иллюзию иллюзии", "просто смотреть кино", "честное соревнование". И, конечно, смысл жизни - это "поиск смысла жизни".
Другую игру, более затейливую, открыл недавно портал Яндекс. Программа Funny Yandex (т.е. "Забавный Яндекс") стала победителем конкурса на лучший сервис, созданный на базе так называемых XML-интерфейсов Яндекса. (Этот термин обозначает средства для включения посторонними программистами этого поиска в свои системы.) Автор "Забавного Яндекса" - Сергей Романча из Херсона - сделал простой инструмент для сравнения характеристик различных понятий. Выглядит это очень просто (xml.yandex.ru/cgi/funny-yandex.pl) - в левом окошке пишете список определяемых слов (скажем, груша и банан), а в правом - определений (сладкий и любимый). Программа немного общается с поисковой машиной и показывает табличку, из которой видно, что груша - слаще банана. Зато банан намного любимее.
Сравнивать таким образом можно что угодно: домашних любимцев, торговые марки и политиков. Можно даже доказать, что крокодил больше зеленый, чем длинный.
Еще один пример - игра "Google talk" (douweosinga.com/projects/googletalk) построена на базе американской поисковой системы "Гугл". Последняя, кстати, хорошо ищет и по-русски (google.com.ru). А вот игра, к сожалению, не принимает фразы на нашем языке. Но она все равно интересна: если дать набор из трех слов, система запрашивает "Гугл", какое слово чаще встречается в таком наборе четвертым. Потом отбрасывает первое из четырех слов и подбирает новое слово к оставшимся трем. И так далее - строится забавная цепочка. Например, к "Город Москва - это" мы получим, конечно, "столица", затем "мира", потом "здоровья". Главное, вовремя остановить цепочку, а то выйдет, что Москва - столица Всемирной организации здравоохранения.