10 коммент.

Сколько страниц было проиндексировано поисковиком Google?

Этот вопрос и многие похожие проблемы уже давно стали распространенными в мире поисковой оптимизации. Яркий пример этому, вы можете наблюдать на картинках:

1

Мы видим, что Google выдает 93800  проиндексированные страницы в корневом каталоге seomoz.org. В принципе, звучит очень даже не плохо, но я заметил тот факт, что результаты, недавно введенные, имеют свойство изменятся (число было ближе к 75000), но когда я ввел тот, же запрос в Google.co.uk (через минуту), количество проиндексированных страниц стало еще больше:

2

А теперь я нажимаю обновить результаты на Google.com снова:

3

И что мы видим? Google упустил около 8500 страниц сайта со своего индекса. Это действительно невообразимо, ведь некоторые службы, менеджеры, маркетинговые директоры используют данные Google в своих вычислениях. Вы можете себе представить? Изменение количества страниц, практически ничего не значит для Google, и в ту же секунду вы можете получить два разных результата. Имеют ли ценность такие вычисления?

Увы, но данная проблема существует.

К счастью, есть один хороший способ обойти такую индексацию самой поисковой системой и выйти к более точным результатам. В этом посте, я собираюсь вам рассказать, как пошагово это сделать:

Шаг 1: Перейдите в источники трафика (Traffic Sources) в Google Analytics

4

Кликните “источники трафика” (traffic sources) в Google analytics или другие аналогичные названия, которые используется в вашем наборе анализа сайта.

Шаг 2: Перейдите в раздел поискового трафика (Search Engines)

5

Так как мы желаем узнать, какое количество страниц было оптимизировано поисковиком, следующим, очевидным шагом будет выбрать раздел поисковый трафик "search engines".

Шаг 3: Выберите поисковик

6

Выберите поисковик, индексацию которого, вы желаете узнать и кликните. Если у вас есть проплаченный и органический трафик, тогда вас интересует только второй на этом этапе.

Шаг 4: Фильтр целевых страниц

7

Данный фильтр помогает узнать о реальном трафике (а не от контекстной рекламы, например) индивидуальной страницы от поисковой системы, которую вы выбрали. В этом пункте, вы также найдете магическую надпись “полное количество” страниц, которые получили трафик.

Шаг 5: Запись количества внизу таблицы

8

Счетчик, который расположен внизу таблицы, информирует об уникальном количестве страниц, которые получили хотя бы одно посещение от поисковиков (в данном случае от Google). Это получился, так называемый, Святой Грааль индексации  - количество, за которым вы можете наблюдать на протяжении времени и вычислять, как поисковый бот индексирует ваш сайт и какие страницы попали под индексацию и стали непосредственно трафогенерирующими. Естественно, данный результат не несет никакой полезной информации без анализа на протяжении нескольких недель, например. Но я рекомендую проверять статистику каждый месяц, а для некоторых сайтов каждых 2-3 месяца. Таким образом, вы получаете детальную информацию о ваших страницах: хорошо или плохо они набирают трафик от поисковой системы.

Теперь, с технической точки зрения, я вам расскажу об некоторых недостатках или просто высветлю некоторые особенности данного метода. Статистические данные – это не означает точное количество проиндексированных страниц вашего сайта, это только уникальное количество урлов, которые были получены за один визит с поисковика. Как по мне, то данная информация более точная и более ценная. Точная  - потому, что тяжело оспаривать (поскольку у нас есть визуальные доказательства в самом начале этого поста), ну а почему же ценная?  Дабы ответить на этот вопрос, мне нужно кое-что объяснить.

Почему информация о количестве страниц, получающих ≥1 переходов с поисковиков ценная?

Статистика индексации страниц не сильно полезная информация без какого-либо анализа. Так, например, в бизнесе и сайты используют цифры индексации для составления некоторых  показателей производительности, поскольку им необходимо узнать каким образом страницы попадают в индекс с течением времени. Я хотел бы оспорить этот момент, поскольку нам не нужно знать какие страницы попали в индекс, нам нужно знать, какие страницы ПРИНОСЯТ ТРАФИК.

Если страница находится в поисковом индексе, это еще не несет никакой выгоды, если ей присущи следующие характеристики:

  • слишком низкий Page Rank/ссылочный вес;
  • отображается контент, которые плохо поддается парсингу;
  • мало ключевых слов (или вообще нет), или контент который отдает трафик;
  • не существует, не доступная;
  • представлена в виде дубликата других страниц.

Таким образом, показатели, которые вы желаете вычислить с течением времени, не будут обязательно (и в большинстве случаев) количеством проиндексированных страниц, это только вычисление страниц, которые действительно приносят трафик. Данные показатели также полезны, если вы хотите представить их маркетологам для вычисления коэффициента производительности. Информация говорит о том, как поисковик индексирует и сортирует страницы, которые действительно кому то были нужны (на которые кликают).

Если количество значительно уменьшилось за некоторое время, вы можете изучить страницы, которые не приносят трафик и выполнить необходимые меры. Если цифры увеличиваются, вы можете изучить, какие страницы пользуются большой популярностью и делать похожие. Некоторые индивидуальные урлы могут оповестить о неработающих страницах, о тех которые потеряли свою уникальность. Как вы видите, данный способ анализа предоставляет великолепную возможность изучения вашего сайта, что намного эффективнее, нежели таинственная игра сеошника с низкими показателями индексации.

Некоторые минусы метода

Данное исследование не является идеальным и характерно некоторыми минусами, и поэтому, я также хочу о них написать:

  • Google Analytics (и много других пакетов анализа сайта) иногда использует отобранную информацию для предположительного оценивания ситуации. Если вы желаете быть уверены в абсолютных числах статистики, вам нужно экспортировать в CSV и сделать параллельно в Excel. Вы можете вычеркнуть похожие результаты за два периода и анализировать страницы, которые вообще не приносят трафик. В большинстве случаев, вы можете также пересмотреть страницы, которые набрали или потеряли 5/10/20 + единиц трафика.
  • Лучшая четкость результатов наблюдается при сокращении интервала времени в анализе, но это также понижает вероятность, что страница посещается благодаря длинным НЧ запросам и очень редко вносится в список.
  • Данная технология не поможет вам определить другие части SEO, как, например, дублированный контент (безусловно, в некоторых случаях это возможно, но не так продуктивно, как предоставляют специализированные инструменты - GG WM Tools).

Источник: http://www.seomoz.org/blog/indexation-for-seo-real-numbers-in-5-easy-steps