04.06.2004 02:00
    Поделиться

    Конкурс Пунто.ру

    Семь лет назад Сергей Москалев взял нож и разрезал на отдельные листочки четырехтомник "Брокгауза и Ефрона" издания 1910 года. Затем они были отсканированы и выложены в Интернет - проект назывался "Брокгаузъ он-лайн". Но тогда программы распознавания текста не были совершенны, поэтому тексты после сканирования требовали "чистки". Москалев и Михаил Морозов создали для этого специальную программу AfterScan, которая автоматически исправляла ошибки в текстах, исходя из наличия невозможных в русском языке сочетаний букв. Скажем, мягкий знак не может стоять после гласной - и это только самое очевидное из таких "несочетаний", а на самом деле их очень много. Так у "Футуры", как назвала себя группа Москалева, появился алгоритм, для которого тогда не было других применений.

    Новая работа для этой технологии нашлась спустя несколько лет. Оказалось, что используя знания о возможных сочетаниях букв в языках, можно автоматически переключать клавиатуру компьютера между русским и английским языком. И это - очень удобно. Программу Punto Switcher загрузили с сервера более 2 миллионов раз, и есть много пользователей компьютера, которые жить без нее уже не могут. Тем более что у этой утилиты есть дополнительные возможности: например, сохранение написанного текста в "дневнике".

    Теперь "Футура" пытается сделать собственную поисковую машину. Точнее, она у нее уже давно есть: Punto.ru. Но, конечно, исследователи не собираются конкурировать с Google по числу проиндексированных документов. Им интересны неочевидные алгоритмы выявления "редких" страниц и надстройки над существующими поисковыми системами. "Футура" даже объявила конкурс "Новое решение" (www.punto.ru/switcher/), победитель которого получит тысячу долларов. Для участия нужно продемонстрировать работающую программу-настройку, которая помогает извлекать ответы из массивов данных в Интернете. Например, опираясь на существующие "искалки".

    Один из претендентов на победу - создатель сервера www.newisearch.com. Эта программа группирует результаты поиска Google, позволяя вам более простым образом уточнять запрос - добавляя или удаляя дополнительные слова. Скажем, если искать Ленина, она предложит выбрать - интересует нас недавний немецкий фильм или Мавзолей. Правда, она, к сожалению, не работает с русским языком. К участию в конкурсе приглашаются не только программисты, но и футурологи, специалисты по интерфейсам, лингвисты. Работы будут приниматься до 30 июня.

    Поделиться