7 коммент.

Google серьезно занялся разработкой системы, которая позволит веб сайтам автоматически вносить новый контент в базу данных Google. Индексация такого контента будет проходить в течении нескольких секунд. Аналитик поисковой индустрии Дэнни Саливан (Danny Sullivan) придерживается мнения, что данный сервис может стать “следующим шагом” развития великой компании Google.

Прошлой осенью Брэтт Слэткин (Brett Slatkin), главный разработчик PubSubHubbub (PuSH) – протокол реального времени, рассказал о том, что может настанет тот день, когда Google начнет использовать PuSH для индексации страниц, вместо банального считывания количества ссылок, которые используются всеми поисковиками на протяжение длительного периода времени.

Старший менеджер по продукции компании Google - Дилан Кэйси (Dylan Casey) заявил на знаменательном происшествии поискового маркетинга “Sullivan's Search Marketing Expo” в Санта Клара, Калифорния, что Google планирует запустить похожий сервис, дабы владельцы сайтов могли конкурировать между собой таким способом.

Каким образом может работать данная система

PuSH – это последовательная (синдицированная) система, которая базируется на формате ATOM. С помощью PuSH, издатель сообщает миру о самой интересной и новой информации, ну а система локальных сетей считывает любой контент, который сразу был опубликован. Подписчики потом передают информацию центральной сети “когда некий издатель запостил новую информацию, и контент немедленно доставляется в нужное место анализа”. Таким образом, вся новая информация передается прямо туда “куда надо”, и не нужно следить за некоторыми авторитетными веб изданиями. Например, кто-то опубликовал новость, потом в систему поступает известие, что данная статья доступна, и через несколько секунд система рассылает новость всем подписчикам.

Если Google сможет осуществить индексацию с помощью программы  PuSH, тогда будет происходить опрос любого сайта, и топовая информация (например, заголовок статьи - что-то наподобие RSS фидов), будет использоваться в сервисе. Потом Google будет подписываться к PuSH фидам, чтобы считывать любую новую информацию, которая появится на сайте.

PuSH не повлияет никаким образом на типичный для интернета ссылочный вес, так как сервису нужны будут ссылки, чтобы на них подписаться, но, безусловно, формат реального времени будет использоваться, чтобы увеличить существующий индекс Google.

Как Дэнни Саливан (Danny Sullivan) сегодня выразился: “Google нужно позаботиться о контроле спама, а не только считывать новый контент и  делать индексацию новой информации без тщательной проверки на этот же спам”. Именно такую ситуацию мы наблюдали совсем недавно, и следует отметить – это был полный хаос.

Преимущества индекса реального времени от Google

PuSH – очень эффективный для Google, но Слэткин (Slatkin) говорит, что протокол имеет еще одно очень важное влияние для маленьких веб-изданий. Сейчас много аматорских сайтиков индексируются гуглом не так уже и часто, но с системой PuSH, их контент будет немедленно доставляться в нужное место.

Такой быстрый и эффективный интернет имеет много преимуществ для каждого, но существенные выгоды в поиске не будут ограничены гуглом.

PubSubHubbub – это открытый протокол, и фиды которые будет видеть Google, будут доступны и для таких поисковиков как Yahoo и Bing.

“Разработчики протокола сказали мне продвигать такой открытый проект для всех, даже для наших конкурентов” – говорит Слэткин.

Мы думаем, что данная система будет работать великолепно, и мы делаем все возможное, чтобы осуществить все наши планы в ближайшие дни. Естественно, когда все будет готово, Google объявит об этом на официальном уровне.

Источник: http://www.readwriteweb.com/archives/google_developing_real_time_index.php