Рассматриваемая в магистерской диссертации тема стоит на стыке нескольких новых и старых областей компьтерной науки. Термины и понятия из этих областей рассматриваются в большом количестве Internet-ресурсов, и по результам поиска можно увидеть, что данная тема актуальна и пользуется интересом у большого количества научных специалистов и программистов.
Большое количество cсылок AltaVista легко объясняется несовершенством механизма поиска данного сервера, который не модифицировался уже довольно долгое время. При этом общий список ссылок по фразе получается объединением списков найденных ссылок по каждому слову, содержащемуся в фразе. К общему списку также прибавляются результаты поиска по похожим (simular) словам, причём результирующий вывод плохо отсортирован по релевантности. Диаметрально малое количество ссылок у Yahoo объясняется тем, что поиск в большинстве случаев производится в базе директорий Yahoo, где отобраны лишь наиболее популярные и использумые ресурсы. Количество же ссылок по остальным поисковым системам находится между этими двумя серверами и примерно соответсвует возможностям используемых в них поисковых механизмов.
По релевантности полученных ссылок серверы можно распределить следующим образом:
Самым совершенным поисковым механизмом среди русскоязычных систем обладает Yandex. При вводе фразы поисковая машина, кроме количества ссылок на страницу (т.е., собственно релевантности) выводила сначала ресурсы, однозначно содержащие данную фразу, затем те страницы, на которых встречаются слова из фразы, и лишь в конце - страницы, содержащие одно из слов фразы. Ссылки почти не повторяются. Механизм учёта по релевантности Rambler подобен Yandex, однако, видимо не столь же эффективен механизм первичного индексирования (система роботов-spider'ов), т.к. общая база индексированных страниц у Rambler меньше. Количество ссылок, найденных Aport, во многих случаях равно количеству Yandex, однако их ценность существенно меньше из-за менее эффективного учёта релевантности и повторяемости информации.
Среди всемирных поисковых систем лучшим, безусловно, является поисковый сервер Google, причём, как по объёму индексированной информации, так и по релевантности и уникальности (неповторямости) найденных ссылок. Также его система каталогов вместе с системой каталогов Yahoo, являются лучшими в известном пространстве Internet. Большое количество cсылок AltaVista легко объясняется несовершенством механизма поиска данного сервера, который не модифицировался уже довольно долгое время. Их количество обратно пропорционально качеству найденной информации.
Подводя итог по результатам поиска, можно сказать следующее. Как оказалось, вопреки мнению многих пользователей Internet, найти что-то конктретное, нужное в данный момент, не так уж сложно. Главную роль в этом играет постановка цели поиска. Если её однозначно определить, то задача поиска облегчается на порядки. Следовательно, основной элемент поиска в Internet - человек, умеющий однозначно формализовывать свои поисковые запросы.