Индексация сайта поисковыми машинами - www.antula.ru/site-indexing.htm


Индексация сайта поисковыми машинами

Что такое индексация сайта поисковыми системами. Какие основные методы индексации сайта поисковыми системами существуют. Что нужно знать об индексации сайтов поисковыми системами.

        Каждая поисковая система работает на основе уникального алгоритма.

 

        Разработчики алгоритма постоянно стремятся его усовершенствовать. В основе алгоритма работы поисковой системы лежит сбор и анализ полученной информации. Информацией собирается, прежде всего, с сайтов, которые были предложены поисковой системе для индексации их владельцами. Общий смысл индексации сайтов заключается в анализе и распознавании, прежде всего, текстовой информации сайтов.

 

        Графическая информация (фотографии, рисунки, схемы и т.д.) штатно не анализируется и не распознаётся. Задача анализа и распознавания графической информации намного сложнее распознавания текста. Основой успеха сайта является грамотный подбор и расположение на сайте текста.

 

        Поисковая система стремится "понять" содержание как сайта в целом, так и его отдельных страниц. Некоторые поисковики за один раз индексируют не все страницы сайта, а только часть.


 

         Если текста на страницах сайта мало, его релевантность может быть недооценена поисковой системой. Когда текста слишком много поисковая система может обработать только его часть, а остальное проигнорирует. Оптимальное количество текста на одной странице сайта должно быть эквивалентно двум-трём страницам формата А-4.

  

         Сайты непрерывно развиваются. Появляется много новых сайтов. Некоторые сайты удаляются. Содержание самих сайтов часто изменяется и дополняется. Чтобы "быть в курсе дела" поисковой система периодически просматривать содержимое сайтов и "приводить в порядок" имеющуюся у неё информацию. Этот процесс непрерывный и цикличный. Средний цикл равен двум-четырём неделям. Для сайтов разных тематик (информационные сайты, новостные сайты, сайты по компьютерам, сайты по музыке и и.д.) цикл может быть различным. Новостные и информационные сайты индексируются, как правило, чаще остальных. Например, новостные сайты (их отдельные страницы) могут индексироваться несколько раз в час.

 

        В процессе просмотра сайтов может случиться какой-либо непредвиденный сбой и содержимое части сайта или сайт в целом могут оказаться непросмотренными поисковой системой. В результате поисковая система может неверно распознать как содержимое и значимость сайта, так и посчитать сайт несуществующим. Разработчики поисковой системы стараются предусмотреть и исключить сбой и ошибки в работе поисковой системы. Достигаться это может разными способами. Одним из них является повторный просмотр сайта.

 

        Часто бывает, что веб-дизайнеры изменяют структуру сайта и название файлов.

 

      Пример 

      Страницы сайта, на которых были размещены фотографии, обозначались как: foto-1.html, foto-2.html, foto-3.html, foto-4.html, foto-5.html. После реконструкции сайта страницы стали обозначаться: foto1.html, foto2.html, foto3.html, foto4.html, foto5.html. При этом содержимое самих страниц осталось без изменения. В базе данных поисковой системы были запомнены старые названия страниц. Посетители, сделавшие запрос в поисковой системе, будут получать ссылки на несуществующие, с точки зрения поисковой системы, страницы. Чтобы исключить выдачу подобных ошибочных результатов поисковой системе необходимо повторно просмотреть сайт и проиндексировать его содержимое. Несуществующие страницы будут исключены из базы данных, а новые добавлены. При этом посетители в результате отображения запросов поисковой системой будут получать работающие ссылки. 

 

      •  Но может быть ситуация, когда по каким-либо причинам веб- дизайнер временно, например, на один день, исключил из него несколько страниц. В это самое время программа сбора информации (поисковый паук) просмотрела сайт. Она не смогла найти на сайте несколько страниц. До этого страницы были многократно просмотрены и проиндексированы. В базе данных поисковой системы страницы присутствовали несколько лет. Как в этом случае поступить поисковой системе? Возможно несколько основных вариантов действий:

  1. Сразу исключить из базы данных те страницы, которые не были найдены в результате просмотра сайта.

  2. Осуществить повторный просмотр сайта спустя некоторое время. Например, через несколько дней.

  3. Оставить в базе данных несуществующие страницы и исключить их, если при повторной индексации сайта их снова не будет обнаружено.

      Каждый из указанных способов (действий) имеет свои преимущества и недостатки.

 

Способ

Преимущества

Недостатки

Рейтинг сайтов выстраивается сразу после индексации.

Посетитель получает в результате запроса только работающие гиперссылки.

Если отдельные страницы сайта не были просмотрены поисковой системой из-за какой-либо технической ошибки, посетители могут недополучить нужную им информацию. Будет нарушена полнота и точность выдачи результатов.

Рейтинг строится после повторной индексации сайта через несколько часов или дней, когда по "мнению" поисковой системы в сайте существуют, но не просмотрены какие-либо страницы.

Посетитель получает наиболее достоверные результаты.

Усложнение алгоритма работы поисковой системы: необходимо применять интерполяцию и аппроксимацию   полученных результатов, методы математического анализа, теории вероятности, статистики и т.д. Удорожание получения результатов для поисковой системы. 

Рейтинг строится после повторной индексации сайта в соответствии со штатным циклом работы. Несуществующие ссылки исключаются только после следующей индексации сайта.

В случае, когда страницы были непросмотрены поисковой системой из-за какой-либо технической ошибки, но в действительности существуют, посетители имеют возможность их просмотреть.

Если страницы сайты были действительно удалены или переименованы, посетители будут получать неработающие ссылки до проведения следующей индексации.

  

      Алгоритм работы поисковых систем непрерывно развивается и изменяется. Невозможно заранее точно знать, как будут проиндексирован сайт и его отдельные страницы. Заказчикам можно рекомендовать:

  1. Предоставлять веб-дизайнеру контент сайта сразу, а не по частям.

  2. Не просить веб-дизайнера создать сайт, отдельные страницы которого будут заведомо не закончены и находиться на так называемой "реконструкции". Подобная "реконструкция" часто оказывается вечным долгостроем. Самостоятельное наполнение информацией сайта и его наполнение для заказчика представляют часто непосильную задачу.

  3. Изначально определиться с тем, что должно быть размещено на сайте и какие задачи сайт должен решать. Все изменения в структуре сайта и в названии его отдельных страниц отрицательно сказываются на индексации сайта поисковыми системами.

  4. Прислушиваться к мнению веб-дизайнеров. веб-студии "Антула". Любой профессиональный веб-дизайнер заинтересован в том, чтобы созданный им сайт занял высокие позиции по рейтингу. Стремление заказчика получить тот сайт, который ему нужно, не взирая на советы и предостережения веб-дизайнеров, часто приводят к тому, что сайт не приносит желаемой прибыли.

 Резюме

 Индексация сайта поисковыми системами происходит по сложному алгоритму. При создании сайта или редизайна сайта предоставьте веб-дизайнеру весь контент сайта. Особое внимание следует обратить на подготовку текста сайта. Для обеспечения занятия сайтом высоких позиций по рейтингу, результатам, выданными поисковыми машинами по запросам, прислушайтесь к мнению веб-дизайнера.