ДонНТУ >> Портал магистров

Безуглый Евгений Безуглый Евгений Николаевич

Факультет вычислительной техники и информатики

Специальность: Системное программирование

Тема выпускной работы:
Повышение эффективности поисковых систем

Руководитель: Аноприенко А.Я.
Биография          Реферат         Библиотека         Ссылки         Инд. задание

Отчет о поиске по теме "Повышение эффективности поисковых систем" 
Составил:
Безуглый Евгений Николаевич

Целью работы
является анализ актуальности темы, ее популярность на поисковых системах. По скольку тема работы непосрественно связанна с поисковыми системами, то допольнительно анализируется показатель инксирования на той или иной поисковой системе, с учетом языковых особенностей.

Данный отчет содержит результаты поиска выбранных ключевых слов, относящихся к вышеуказанной теме.  Поиск осуществлялся на 4 языках: русский, украинский, английский и польский, в шести поисковых системах: Google.com, yahoo.com, yandex.ru, meta.ru, wirtualnapolska.pl

Результаты поиска на 15.03.09

Запрос google.com yahoo.com yandex.ru ramler.ru meta.ua wirtualnapolska.pl
поисковые системы 9630000 14400000 62000000 34000000 830000 -
поисковые машины 1760000 4060000 14000000 6000000 160000 -
модели поиска 17000000 6970000 189000000 129000000 1724000 -
векторная модель поиска 103000 22900 4000000 145000 11700 -
поиск по сайту 16600000 119000000 1207000000 703000000 5334000 -
information retrieval 46800000 57500000 2000000 191000 6200 34000
information retrieval machines 2920000 11400000 379000 38000 1800  4100
retrieval model 2290000 21900000 737000 286000 2800 10000
vector model of information retrieval 246000 2510000 93000 13000 502 1300
website search 370000000 2380000000 25000000 11000000 109000 1600000
SEO 279000000 778000000 28000000 13000000 274000 7300000
пошукові системи 325000 237000 5176 4000000 520000 -
пошукові машини 37300 16400 244 1000000 127000 -
моделі пошуку 602000 98100 25000 1000000 129000 -
векторна модель пошуку 1340 231 13000 580 1000 -
пошук на сайті 4090000 3760000 653000 5000000 289000 -
оптимізація пошуку 257000 42400 270000 164000 32100 -
systemy wyszukiwania informacji 3480000 736000 3926 3000 16 95000
maszyny wyszukiwawcze 5890 966 126 0 0 880
model wyszukiwania 3860000 2770000 17000 579 42 410000
model wektorowy wyszukiwania 6180 585 15 11 2 120
wyszukiwanie na stronie 7050000 14500000 66000 4000 226 3000000
wyszukiwarka 33200000 92500000 135000 25000 598 19000000
optymalizacja wyszukiwania 62300 212 8 2 9 92000


Результаты поиска на 05.06.2009
Запрос google.com yahoo.com yandex.ru ramler.ru meta.ua wirtualnapolska.pl
поисковые системы 9850000 13600000 41000000 34000000 876000 -
поисковые машины 1070000 3980000 14000000 6000000 186000 -
модели поиска 17300000 7010000 145000000 129000000 1776000 -
векторная модель поиска 93600 19600 4000000 160000 12600 -
поиск по сайту 16900000 118000000 868000000 646000000 5335000 -
information retrieval 8190000 56900000 3000000 194000 6300 34000
information retrieval machines 2940000 11300000 562000 38000 1800  4100
retrieval model 2280000 21800000 1000000 285000 2800 10000
vector model of information retrieval 259000 2420000 21000 13000 502 1300
website search 359000000 2480000000 445000000 11000000 109000 1600000
SEO 277000000 808000000 42000000 12000000 291000 7300000
пошукові системи 278000 232000 5586 4000000 540000 -
пошукові машини 37300 15500 239 1000000 139000 -
моделі пошуку 576000 95700 23000 1000000 131000 -
векторна модель пошуку 1340 235 13000 1344 1900 -
пошук на сайті 4580000 3620000 604000 5000000 324000 -
оптимізація пошуку 212000 45800 99000 164000 32800 -
systemy wyszukiwania informacji 3690000 709000 5355 242 15 95000
maszyny wyszukiwawcze 6320 898 183 0 0 880
model wyszukiwania 3970000 3120000 20000 691 44 410000
model wektorowy wyszukiwania 5560 476 28 11 2 120
wyszukiwanie na stronie 7520000 16100000 120000 5000 228 3000000
wyszukiwarka 34200000 95400000 1000000 25000 606 19000000
optymalizacja wyszukiwania 665000 566000 4329 67 10 92000


Как видно из приведенных выше данных:
  1. Украинские и российские поисковые системы пока отстают от англоязычных аналогов, зато по некоторым показателям опережают польские. Это связано, прежде всего, с развитием этой отрасли информатики в странах.
  2. Польские поисковики абсолютно не распознают кириллицу, о чем свидетельствуют результаты поиска. Зато российские и украинские поисковики находят релевантные документы при запросе на польском языке, но мало. В любом случае, это можно расценивать, как достоинство наших поисковиков.
  3. Количество найденных релевантных документов, как видно из таблиц,  суммарно уменьшилось. Это может быть связанно с "сезонностью" популярности темы. Как известно, летом, наука развивается менее интенсивно, это влияет на количество выпускаемых статей учеными, и на количество посещаемых сайтов. Последнее сильно влияет на рейтинг страницы, а значит страница имеет менше шансов попасть в результирующий список поиска. Однако ошибочно считать, что такого документа нет, или его нет в индексе поисковика.

Практически по всем запросам наименьшее количество релевантных документов найдено украинским поисковиком. Кроме описанной выше причины, следует отметить и то, что украинскими поисковиками проиндексировано меньшее количество документов. Поэтому принципиально высокими показателями украинские поисковики не могут отличиться. Причинами этому есть 2 фактора - время и ресурсы. Время существования украинских поисковиков, по сравнению с гигантами (типа Google.com или Yahoo.com) не сравнимо мало. Как известно, ресурсы интернет в Украине только развиваются ( Украина занимает 62 место по интернет активности, согласно pcweek.ua)

Следует отметить и то, что условно все запросы можно разделить на две категории:

  • научные;
  • коммерческие.

    Во всех поисковиках наблюдается уменьшение количества наденных релевантных документов среди научных и небольшой рост среди коммерческих, причины первого обстоятельства пояснены выше, причинами второго служит постоянное развитие интернет сайтов (в том числе развлекательных порталов, магазинов и т.д. )

 Однако, суммарное количество найденных документов достаточно велико, это свидетельствует о актуальности и широкому развитию этой темы.