Компания Яндекс разработала и внедрила новую поисковую технологию,
которая позволяет находить совсем свежие документы — через минуты после
их появления в интернете.
Достаточно много поисковых запросов (от 2% в спокойные дни до 8% в
дни важных событий) посвящено событиям, которые случились совсем
недавно. Задавая эти запросы, пользователи ожидают найти в том числе и
документы, которые были созданы только что. Чтобы хорошо отвечать на
такие запросы, Яндекс, во-первых, научился выявлять их среди общего
потока, и во-вторых, внедрил нового поискового робота — Orange. Orange
работает в режиме реального времени. Он умеет находить свежие
документы, как только они появились в интернете, индексировать их и
выкладывать на поисковые сервера буквально за несколько секунд.
Некоторые сайты интернета обновляются не очень часто, а на других —
например, на новостных ресурсах — новые документы создаются постоянно.
Orange обходит такие сайты и добавляет новые документы в поиск по мере
их появления, без задержек.
Чтобы определять, нужна ли свежая информация в ответ на те или иные
запросы, Яндекс разработал несколько детекторов. Они анализируют самую
разную информацию — например, тематику сообщений в СМИ или рост
количества поисковых запросов по той или иной теме.
Напомним, что около полугода н
...
Читать дальше »