Индекс Google или количество трафген. страниц?
Сколько страниц было проиндексировано поисковиком Google?
Этот вопрос и многие похожие проблемы уже давно стали распространенными в мире поисковой оптимизации. Яркий пример этому, вы можете наблюдать на картинках:

Мы видим, что Google выдает 93800 проиндексированные страницы в корневом каталоге seomoz.org. В принципе, звучит очень даже не плохо, но я заметил тот факт, что результаты, недавно введенные, имеют свойство изменятся (число было ближе к 75000), но когда я ввел тот, же запрос в Google.co.uk (через минуту), количество проиндексированных страниц стало еще больше:

А теперь я нажимаю обновить результаты на Google.com снова:

И что мы видим? Google упустил около 8500 страниц сайта со своего индекса. Это действительно невообразимо, ведь некоторые службы, менеджеры, маркетинговые директоры используют данные Google в своих вычислениях. Вы можете себе представить? Изменение количества страниц, практически ничего не значит для Google, и в ту же секунду вы можете получить два разных результата. Имеют ли ценность такие вычисления?
Увы, но данная проблема существует.
К счастью, есть один хороший способ обойти такую индексацию самой поисковой системой и выйти к более точным результатам. В этом посте, я собираюсь вам рассказать, как пошагово это сделать:
Шаг 1: Перейдите в источники трафика (Traffic Sources) в Google Analytics

Кликните “источники трафика” (traffic sources) в Google analytics или другие аналогичные названия, которые используется в вашем наборе анализа сайта.
Шаг 2: Перейдите в раздел поискового трафика (Search Engines)

Так как мы желаем узнать, какое количество страниц было оптимизировано поисковиком, следующим, очевидным шагом будет выбрать раздел поисковый трафик "search engines".
Шаг 3: Выберите поисковик

Выберите поисковик, индексацию которого, вы желаете узнать и кликните. Если у вас есть проплаченный и органический трафик, тогда вас интересует только второй на этом этапе.
Шаг 4: Фильтр целевых страниц

Данный фильтр помогает узнать о реальном трафике (а не от контекстной рекламы, например) индивидуальной страницы от поисковой системы, которую вы выбрали. В этом пункте, вы также найдете магическую надпись “полное количество” страниц, которые получили трафик.
Шаг 5: Запись количества внизу таблицы

Счетчик, который расположен внизу таблицы, информирует об уникальном количестве страниц, которые получили хотя бы одно посещение от поисковиков (в данном случае от Google). Это получился, так называемый, Святой Грааль индексации - количество, за которым вы можете наблюдать на протяжении времени и вычислять, как поисковый бот индексирует ваш сайт и какие страницы попали под индексацию и стали непосредственно трафогенерирующими. Естественно, данный результат не несет никакой полезной информации без анализа на протяжении нескольких недель, например. Но я рекомендую проверять статистику каждый месяц, а для некоторых сайтов каждых 2-3 месяца. Таким образом, вы получаете детальную информацию о ваших страницах: хорошо или плохо они набирают трафик от поисковой системы.
Теперь, с технической точки зрения, я вам расскажу об некоторых недостатках или просто высветлю некоторые особенности данного метода. Статистические данные – это не означает точное количество проиндексированных страниц вашего сайта, это только уникальное количество урлов, которые были получены за один визит с поисковика. Как по мне, то данная информация более точная и более ценная. Точная - потому, что тяжело оспаривать (поскольку у нас есть визуальные доказательства в самом начале этого поста), ну а почему же ценная? Дабы ответить на этот вопрос, мне нужно кое-что объяснить.
Почему информация о количестве страниц, получающих ≥1 переходов с поисковиков ценная?
Статистика индексации страниц не сильно полезная информация без какого-либо анализа. Так, например, в бизнесе и сайты используют цифры индексации для составления некоторых показателей производительности, поскольку им необходимо узнать каким образом страницы попадают в индекс с течением времени. Я хотел бы оспорить этот момент, поскольку нам не нужно знать какие страницы попали в индекс, нам нужно знать, какие страницы ПРИНОСЯТ ТРАФИК.
Если страница находится в поисковом индексе, это еще не несет никакой выгоды, если ей присущи следующие характеристики:
- слишком низкий Page Rank/ссылочный вес;
- отображается контент, которые плохо поддается парсингу;
- мало ключевых слов (или вообще нет), или контент который отдает трафик;
- не существует, не доступная;
- представлена в виде дубликата других страниц.
Таким образом, показатели, которые вы желаете вычислить с течением времени, не будут обязательно (и в большинстве случаев) количеством проиндексированных страниц, это только вычисление страниц, которые действительно приносят трафик. Данные показатели также полезны, если вы хотите представить их маркетологам для вычисления коэффициента производительности. Информация говорит о том, как поисковик индексирует и сортирует страницы, которые действительно кому то были нужны (на которые кликают).
Если количество значительно уменьшилось за некоторое время, вы можете изучить страницы, которые не приносят трафик и выполнить необходимые меры. Если цифры увеличиваются, вы можете изучить, какие страницы пользуются большой популярностью и делать похожие. Некоторые индивидуальные урлы могут оповестить о неработающих страницах, о тех которые потеряли свою уникальность. Как вы видите, данный способ анализа предоставляет великолепную возможность изучения вашего сайта, что намного эффективнее, нежели таинственная игра сеошника с низкими показателями индексации.
Некоторые минусы метода
Данное исследование не является идеальным и характерно некоторыми минусами, и поэтому, я также хочу о них написать:
- Google Analytics (и много других пакетов анализа сайта) иногда использует отобранную информацию для предположительного оценивания ситуации. Если вы желаете быть уверены в абсолютных числах статистики, вам нужно экспортировать в CSV и сделать параллельно в Excel. Вы можете вычеркнуть похожие результаты за два периода и анализировать страницы, которые вообще не приносят трафик. В большинстве случаев, вы можете также пересмотреть страницы, которые набрали или потеряли 5/10/20 + единиц трафика.
- Лучшая четкость результатов наблюдается при сокращении интервала времени в анализе, но это также понижает вероятность, что страница посещается благодаря длинным НЧ запросам и очень редко вносится в список.
- Данная технология не поможет вам определить другие части SEO, как, например, дублированный контент (безусловно, в некоторых случаях это возможно, но не так продуктивно, как предоставляют специализированные инструменты - GG WM Tools).
Источник:












