Что такое индексация и как ее улучшить. Как индексировать страницу в новой версии Search Console

Проверка индексации сайта является тем мероприятием, которое позволяет предупредить снижение уровня заработка вебмастера. Дело в том, что существует такое понятие, как «выпадение» страниц, по разным причинам приводящее к потере трафика.

Недостаточное количество контента на странице, организационные моменты при «переселении» на другой домен, спам – эти и другие причины сводят на «нет» все усилия вебмастеров. Опытный оптимизатор ни за что не допустит такой ситуации, впрочем, как и понижения рейтинга у площадки, продающей «вечные» ссылки. Проверять индексирование веб-сайта – не прихоть, а вынужденная необходимость!

Существует несколько типов поисковых запросов Google, позволяющих увидеть проиндексирована страница или нет

Проиндексированные страницы сайта

Страницы сайта, прошедшие индексацию Google, можно просмотреть, воспользовавшись оператором «site:». Следует учитывать, что индексация является геозависимой, поэтому может выпадать разное число страниц в индексе для и google.com.

Итак, к указанному оператору добавляем нужный url, причем, между оператором и самой ссылкой на сайт не должно быть пробелов:

site: google.ru

Кроме того, можно провести поиск по целому домену или по отдельно взятому подкаталогу:

site: google.com/ webmasters

Для избирательного поиска с целью исключения ненужных страниц нужно поставить перед оператором знак «-». Наглядно это будет выглядеть так:

site:google.ru -site: adwords. google.com

Подобный поиск выдаст результат, в котором будут содержаться все проиндексированные страницы в домене google.ru, за исключением страниц adwords. google.ru.

link:google.ru или link:www

Кроме того, целенаправленный поиск ссылок на определенные страницы выполняется по запросу:

link:google.ru/webmasters

Текущий кэш вашего сайта

Оператор «cache:» информирует об архивированной копии страницы, которая проиндексирована Google. К примеру, cache:google.ru воссоздает новейшую проиндексированную версию главной сайта, а также выдает информацию о дате создания КЭШа, что дает возможность просмотра версии страницы с обычным текстом. Это чрезвычайно удобно, т.к. становится понятно, как именно робот Googlebot может увидеть страницу.

Используя команду «метатег noarchive», можно ограничить доступ пользователей в результатах поиска к кэшированной версии любой страницы. Между тем, страница будет сканироваться и индексироваться поисковиком Google:

Похожие страницы

Оператор «related:» позволяет увидеть ресурсы, подобные искомому сайту. Такой поиск применяется, как правило, для пересекающихся ресурсов.

В Google может быть использовано целый ряд показателей для выявления схожести, но качество возвращаемых сайтов никоим образом не влияет на процесс индексации страниц поисковой системой Google. Рекомендую почитать пост про гугла, там могут быть страницы которых нет в основном поиске.

Не так давно компания Google на пару с NASA (да-да, с аэрокосмическим агентством США) купила у канадской компании D-Wave Systems квантовый компьютер (ну или то, что на сегодня называется квантовым компьютером). Сообщалось, что на его базе планировали (с этой осени) запустить лабораторию по изучению искусственного интеллекта с применением достижений квантовой физики.

Что такое квантовый компьютер - долго объяснять. Но представьте себе в перспективе - некий огромный суперкомпьютер, у которого весь интернет будет находится в оперативной памяти. Необходимости индексировать новый контент и новую информацию, размещаемую в интернете - уже не будет. Информация сразу будет в поиске! В момент ее публикации в интернете! Как вам такая скорость... хотел сказать "индексации", но по-сути "индексации" в привычном значении этого слова уже не будет!

Но пока это в перспективе, и, кажется, не совсем уж такой далекой! Мгновенная индексация информации не за горами. И это хорошо иллюстрирует новшество от компании Google. Теперь по запросу вебмастера, Google сканирует мгновенно предложенный ему адрес странички и также мгновенно размещает его в поиске. Да, такой сервис есть и называется он не аддурилка Google, куда надо сообщать о новом сайте. Инструмент находится в кабинете вебмастеров от Google и доступен всем желающим вебмастерам, подтвердившим права управления на свой сайт.

Как мгновенно проиндексировать страничку в Google?

Быстрая индексация материалов сайтов - головная боль вебмастеров (каких тем только не создано на веб-форумах: "Как быстро вогнать сайт в индекс Google ", "Как ускорить индексацию сайта? ", "Как мгновенно проиндексировать содержимое сайта? " и т.д.). Поскольку преимущественно публикуются уникальные материалы, то существует вероятность кражи контента и публикации его на быстроиндексируемом сайте. Однако, с нововведением Google, это уже в прошлом. Сейчас возможно отправлять странички в Google не только на индексацию, но и прямо в результаты поиска. Делается это очень и очень просто.

  1. Заходим в кабинет вебмастера Google -
  2. На главной странице Инструментов для веб-мастеров выберите нужный сайт (страницы которого нужно вогнать в индекс)
  3. На левой панели находим функцию Просмотреть как Googlebot
  4. В появившемся текстовом поле указываем путь к новой страничке в интернете
  5. В раскрывающемся списке не трогаем (установленный по умолчанию) Веб
  6. Нажимаем Получить содержание (Google получит содержание указанного URL, несколько раз перезагрузив страницу; не спешите ничего нажимать, этот процесс может занять до 10-15 минут).
  7. Когда получим сообщение об успешном получении содержимого, нам станет доступна кнопочка Добавить в индекс - нажимаем на нее.
  8. Нам предложат выбрать одно из двух:

Чтобы добавить отдельный URL в индекс Google, выберите URL и нажмите Отправить (используя этот способ, можно добавлять до 500 URL в неделю)

Чтобы добавить URL и все страницы, на которые он ссылается, выберите URL и все связанные страницы (можно отправлять до 10 таких запросов в месяц)

Непосредственно в кабинете вебмастеров Google это выглядит примерно так:

На официальной страничке документации - нового метода, где подчеркнуты его главные приимущества:

Попасть в результаты поиска Google просто. Не нужно ничего платить, не нужно даже отправлять свой сайт в Google

ясно указано, что

Google не может гарантировать, что все просканированные URL будут включены в индекс.

это подразумевает, что гарантии индексации новой странички в интернете такие же, как и при обычном сканировании поисковыми роботами. Никаких гарантий, что бредовые тексты, машинные и не несущие никакой полезной нагрузки будут попадать в индекс поисковой системы.

Как быстро индексируется страничка в Google?

Нигде не указано, сколько именно времени должно пройти, прежде чем страничка, указанная поисковым паукам, будет проиндексирована и доступна в поиске. Однако, собственные эксперименты показывают, что это происходит сразу . Что именно я вкладываю в слово "сразу "?

По неизвестным причинам, страница, добавленная на индексацию через Googlebot попадает в индекс от мгновенно (пару секунд) до нескольких минут (5-10). В целях эксперимента добавлялись в индекс такие страницы на редкообновляемых сайтах, которые самостоятельно не индексировались в Google по 4-6 дней (и успешно появлялись в индексе сразу же). Лишь в некоторых случаях, единичных, страничка вообще не появлялась в индексе. Впоследствии, она появлялась сама по себе, видимо во время очередного визита другого паука на сайт.

Такой вот подарок от Google любителям мгновенной индексации! Надеюсь, мои советы станут вам полезными!

Оцените материал:

Чтобы проиндексировать сайт в Google, нужно авторизоваться в google-аккаунте и перейти по адресу https://www.google.com/webmasters/tools/submit-url . Там вы должны будете ввести адрес главной страницы своего сайта и пройти проверку на то, что вы не робот. Собственно, этих действий достаточно для того, чтобы ваш интернет-портал индексировался в Гугле – другое дело, что для продвижения в ТОПе выдачи придется приложить гораздо больше усилий.

Теоретически возможны две ситуации, при которых индексация в гугл не пройдет:

    В случае проблем с сервером. Вы увидите сообщение о том, что ваш хостинг не отвечает на запросы системы, и, соответственно, не сможете выполнить процедуру в этот конкретный момент времени. Однако вы можете повторить попытку позже, когда ваш сайт снова заработает. Впрочем, если проблемы с хостингом у вас возникают систематически, то стоит задуматься о смене провайдера. Стабильная работа интернет-портала важна и в контексте «симпатий» поисковых систем, и в связи с необходимостью удовлетворять пожелания и запросы посетителей, а не раздражать их.

    При попадании под санкции. В подобной ситуации на странице появится сообщение о том, что адрес вашего сайта запрещен к добавлению на индексацию. Санкции могут быть разными, и выданы они могут быть по разным причинам. Если вы уверены, что не сделали ничего плохого за время владения сайтом – то, возможно, санкции были наложены за то время, что им управлял предыдущий собственник. Поэтому очень важно проверять сайты на бан поисковиков перед тем, как покупать их. Если же вы узнаете о санкциях уже по факту, то вы можете попробовать узнать их причину на форуме Google. Но для того, чтобы добиться индексации в системе Гугл как можно быстрее, проще будет развивать проект на другом домене.

Быстрая индексация в Google

Далеко не всегда вебмастеру хочется ждать, пока робот поисковой системы сам зайдет на его сайт и проиндексирует новые страницы. Чтобы ускорить этот процесс, можно прибегнуть к нескольким эффективным способам:

    Через панель вебмастера Google. Для этого в разделе «Сканировать» необходимо выбрать пункт «Посмотреть как Googlebot». В соответствующее поле понадобится вставить адрес новой страницы, причем без адреса самого сайта (то есть из URL необходимо удалить эту часть). Далее необходимо нажать на кнопку «Сканировать», а по завершении процесса – на кнопку «Добавить в индекс». Появление сканированной страницы в индексе займет от нескольких минут до получаса. Единственный недостаток такого способа заключается в том, что его необходимо выполнять вручную, и он требует достаточно большого количества времени.

    С использованием файла SiteMap.XML. Это файл, в котором содержатся ссылки на все страницы сайта, информация о датах их изменения, приоритетности просмотра. Он, во многом, определяет то, насколько быстро индексируются новые страницы. Поэтому ссылки на них нужно сразу же добавлять в такой файл, чтобы роботы находили их быстрее. При этом крайне желательно использовать динамический SiteMap.XML, а не обновлять его вручную после каждой корректировки сайта.

    Путем оптимизации файла robots.txt. Этот файл позволяет задать директивы, в соответствии с которыми будут работать поисковые роботы и, соответственно, выполняться индексация сайта в системе Гугл. В контексте скорости этого процесса особое значение имеет директива Disallow, задающая те файлы, страницы и разделы, которые не должны быть проиндексированными. Благодаря ей роботы экономят время и быстрее доходят до новых страниц.

    С помощью RSS-канала и социальных сетей. Увеличить скорость, с которой индексируется новый материал на сайте, можно и посредством добавления наиболее часто пополняемых разделов на RSSканал. Кроме того, вы можете добавлять ссылки на новые страницы в социальные сети (особенно полезна в контексте индексации сайта роботами Google соцсеть Twitter). Еще лучше, если вы сделаете кросспостинг из RSS-ленты в Твиттер.

Таким образом, индексация сайта в Google – это задача, для решения которой достаточно потратить несколько мгновений и сделать пару кликов. Однако быстрая индексация, и тем более – эффективное продвижение сайта в Гугл, требует гораздо более комплексной и продолжительной работы.

Привет, друзья! В сегодняшнем посте я затрону тему индексации сайта в поисковой системе Google. Какие проблемы возникают с ней? Существует ли сейчас основной и дополнительный индекс? Все мои наблюдения на этот счет ниже.

Не знаю как у вас, а у меня Google индексирует меньше страниц, чем Яндекс. По крайней мере он показывает это по таким запросам:

Кстати в этой записи все буду разбирать на примере блога. Он находится в , на нем авторские уникальные статьи, теги, архивы и другие, дублирующие контент страницы (кроме категорий и нумерации страниц по средствам плагины PageNavi) запрещены в robots.txt. Что на такой запрос говорит Яндекс?

Тут уже 281 страница. Причем вообще в sitemap записано примерно 200 страниц + примерно 80 - это как раз те, которые создаются постраничной навигацией. Эти цифры ближе к реальности .

Вернемся опять к гуглу. Получилось, что сейчас он знает только о 172 страницах моего блога. Что же на самом деле? У меня получилась следующая картина:

Сейчас я объясню всю эту таблицу .

Что же получается? Google оказывается знает о 187 страницах + несколько десятков навигационных, а не о 172. По-моему кто-то что-то скрывает или прячет .

Выводы по поводу индексации в Google


До проведения данного анализа я считал, что у моих сайтов проблемы с индексацией страниц в Google. На самом же деле проблемы с тем, что некоторые документы попадают в дополнительный индекс, а о других Google знает, но молчит .

Почему Google отправляет страницы в дополнительный индекс?

  1. Как я уже написал выше, причиной может служить дублирование контента. Для этого можно запретить к индексации дублирующие страницы: теги, архивы и так далее.
  2. Часто страницы с копированным контентом тоже отправляются в сопли, либо просто с незначительным его количеством или низким качеством.
  3. Ошибки поисковой системы. Поисковой робот может неправильно проанализировать страницу, несмотря на то, что она будет являться первоисточником с уникальным и интересным контентом.

Как же вывести страницы из соплей? А вот этим я и буду заниматься. В одном из последующих постов опубликую результаты эксперимента, который должен будет вытащить некоторые страницы блога в основной индекс. Не пропустите . Что вы думаете по поводу индексации ваших сайтов в гугл? Какие особенности были замечены?

Добавление сайта на индексацию в Rambler.

"С 23 июня 2011 года «Рамблер-Поиск» использует поисковые технологии компании «Яндекс», дополняемые собственными сервисами. Добавить сайт в индекс поисковика можно через систему Яндекса ".

Не забудьте добавить свой сайт в Топ100.Rambler , лишним не будет.

Добавление сайта на индексацию в Mail.ru.

Добавить сайт очень просто, отправляете URL и ждете, не забудьте подать БЕСПЛАТНО заявку на попадания в каталог Mail.ru , если одобрят, это будет хорошо. Не закрывая страницу добавления сайта в поиск переходите по ссылке на добавление в каталог Mail.ru и заполняете форму (в этом случае появится возможность подать бесплатно заявку в каталог).

Добавление сайта на индексацию в каталог Aport.ru.

Для добавления сайта придется пройти 5 несложных шага. На первом добавить URL сайта. На первом этапе проверяется на ответ сайта и на наличии сайта в каталоге, если его нет, то появится второй шаг. На втором шаге заполняете данные о сайте, название, описание, ключевики и т.д. На третьем шаге выбираете раздел (разделы напомнили как в каталоге Майл.ру). Четвертый шаг добавляем регион сайта (тоже чем то напомнил Майл.ру). Пятый шаг, вводите капчу(заглавные учитываются) и проверяете введенные данные, если все правильно, жмем далее. Вас добавили, ждем модерации на почтовый ящик.

Добавление сайта на индексацию в GOGO.ru.

Насчет значимости данного ресурса и нахождение в нем я не могу сказать, но могу сказать одно, не помешает, а вдруг и с него зайдут (в практике такого не было, но все меняется). Что бы добавить в интернете есть ссылка http://gogo.ru/wmaster/add_site.html перейдя по ней, я понял что это уже поисковик Mail.ru, (ссылку оставил, на всякий случай).

Добавление сайта на индексацию в NIGMA.ru.

Следующая система nigma.ru. По ней пишут что она дает приток народу, я не заметил, но добавил , может будет толк. Тем более это быстро. Указываете URL, почтовый ящик и периодичность обновления, сохранить и все.

Добавление сайта на индексацию в TAGOO.

Поисковая система тагоо как видно специализируется медийном контенте, если у вас он есть или может быть появится, добавляем . На значимость данного поисковика не берусь судить, не знаю его, но добавил.

Добавление сайта на индексацию Turtle (Черепаха).

Система ориентирована на ресурсы Стран Содружества Независимых Государств СНГ на любом языке, а также русскоязычные ресурсы других стран. Добавить можно . Но в связи со смертью его основателя Дмитрия Крюкова, ресурс временно приостановил свою деятельность. Как написано на сайте ВРЕМЕННО, значит не убираем его со счетов.

Вот мы и дошли до зарубежных поисковых систем.

Добавление сайта на индексацию Yahoo (Яху) и Bing (Бинг).

Яху объеденила свою поисковую систему с Bing и перебрасывает на Bing старый URL для добавления был http://search.yahoo.com/info/submit.html. Добавляем в Bing . Добавляем и радуемся, можем также зарегистрироваться и получить панель вебмастера, я там не регистрировался, но это не показатель. Для наглядности попробуйте.