Пранскевичус Владислав Александрович

Факультет
Компьютерных наук и технологий
Кафедра
Автоматизированных систем управления
Тема работы
Разработка распределенного поискового робота
Научный руководитель
к.т.н., доцент Привалов М. В.

Пояснения к отчету и таблицам

Представленный отчет о поиске позволяет оценить информационную ситуацию по теме магистерской работы. Он является основным документальным подтверждением глубины и полноты информационного поиска, а также служит для фиксации текущей ситуации в исследуемой области.

Поиск выполнен с использованием шести поисковых систем (Google, Yandex, Rambler, Yahoo, Meta, Bing). Результаты сведены в таблицу. Всего произведено 10 запросов, имеющих отношение к магистерской работе. Из них 3 запроса на русском языке, 7 на английском. 2 запроса соответствует теме магистерской работы.

Данные в таблицах представлены в следующем виде:
- Google (www.google.com): <количество страниц>
- Yandex (www.yandex.ru): <количество страниц>
- Rambler (www.rambler.ru): <количество страниц>
- Yahoo (www.yahoo.com): <количество документов>
- Meta (www.meta.ua): <количество документов>
- Bing (www.bing.com): <количество страниц>

Отчет о поиске за 15.02.2011

Поисковый запрос Google Yandex Rambler Yahoo Meta Bing
Модели и алгоритмы распределенного поискового робота 20,100 40,500 708 19,500 90 14,500
Models and algorithms of parallel web crawler 21,900 31,200 702 20,600 18 172,000
Поисковый робот 756,000 2,724,000 98,000 190,000 177,000 291,000
Пошуковий робот 255,000 470,000 960,000 9,120 178,000 31,000
Веб-краулер 1,528,000 18,000 1,701 988 5,905 934
Web crawler 11,090,000 4,000,000 141,000 4,010,000 10,150,000 4,100,000
Web crawler comparison 207,000 300,000 22,000 159,000 334 848,000
Parallel web crawler 232,000 135,000 10,000 275,000 87 461,000
Паралельний пошуковий робот 15,000 10,000 5,000 41 2,000 109
Concurrency 4,308,000 9,000,000 83,000 1,402,000 5200 1,400,000
Конкурентные вычисления 137,000 1,900,000 170,000 39,000 29,100 92,800
Pi calculus 5,237,000 394,000 38,000 2,110,000 946 2,180,000
Haskell concurrency 314,000 66,000 1,090 86,700 41 117,000
Vladislav Pranskevichus 208 64 0 20 0 110
Владислав Пранскевичус 71 84 5 2 98 1
Владислав Пранскевічус 27 0 0 0 107 0
Привалов Максим Владимирович 21,100 43,000 3,000 9,700 507 29,300
Привалов Максим Володимирович 21,300 701 65 135 212 218
Maxim Privalov 17,100 143,000 2,000 1,800 95 3,120

Отчет о поиске за 15.05.2011

Поисковый запрос Google Yandex Rambler Yahoo Meta Bing
Модели и алгоритмы распределенного поискового робота 20,900 42,000 904 21,500 93 17,000
Models and algorithms of parallel web crawler 22,200 31,200 788 21,100 18 179,000
Поисковый робот 758,000 2,976,000 102,000 190,000 180,000 294,000
Пошуковий робот 275,000 510,000 972,000 9,640 180,000 31,500
Веб-краулер 1,530,000 18,000 1,712 1,110 5,900 1,030
Web crawler 11,100,000 4,000,000 144,000 4,120,000 10,159,000 4,110,000
Web crawler comparison 209,000 300,000 24,000 160,000 361 850,000
Parallel web crawler 238,000 137,000 10,000 275,000 94 466,000
Паралельний пошуковий робот 17,400 11,000 6,000 44 2,000 117
Concurrency 4,350,000 9,000,000 84,000 1,400,000 5300 1,410,000
Конкурентные вычисления 155,000 2,000,000 170,000 40,500 29,800 79,500
Pi calculus 5,240,000 398,000 38,000 2,180,000 966 2,190,000
Haskell concurrency 314,000 68,000 1,196 87,500 49 116,000
Vladislav Pranskevichus 214 72 0 20 0 111
Владислав Пранскевичус 76 87 6 2 107 2
Владислав Пранскевічус 29 0 0 0 104 0
Привалов Максим Владимирович 21,400 45,000 4,000 10,300 596 29,300
Привалов Максим Володимирович 21,600 704 65 135 212 218
Maxim Privalov 17,900 144,000 2,000 1,850 95 3,340

Проиллюстрирем изменения в поисковых системах при помощи 3-х рисунков:

Результаты по запросам на русском языке:

Результаты по запросам на украинском языке:

Результаты по запросам на английском языке:

В русскоязычном сегменте поиска наибольшее количество результатов было получено в результате работы поисковой системы Yandex (5 млн). Наименьшее - Meta (38 тысяч). По результатам поиска лидирует запрос "Поисковый робот" (3,8 миллионов). Наименьшее количество результатов было получено в результате запроса "Модели и алгоритмы распределенного поискового робота" (10 тысяч). По динамике роста лидирует система Meta (21 тысяча). В поисковой сиистеме Google количество результатов уменьшилось (8 миллионов).

Анализируя результаты на украинском языке видно, что Rambler выдает самое большое количество результатов (980 тысяч). Минимальное количество результатов у Yahoo (11 тысяч). Лидером в украиноязычном поиске стал запрос "Пошуковий робот" (2 миллиона). Наименьшее количество результатов у запроса "Паралельний пошуковий робот" (36 тысяч).

По результатам поиска на английском языке лидирует поисковая система Google (21 миллион). Минимальные показатели результатов поиска у Rambler (304 тысячи). Запрос "Web crawler comparison" набрал наименьшее количество результатов (304 тысячи). Наибольшее количество - "Web crawler" (24 миллиона).

Очевидно, что наибольшее количество результатов найдено на английском языке (27 млн). На русском и украинском языках результатов на порядок меньше (на русском - 8 млн, на украинском - 2 млн). Это объясняется тем, что в русско и украиноязычном сегменте ведется на порядок меньше исследдований о поисковых роботах, чем в англоязычном.

Наибольшее количесто результатов дала поисковая система Google - 57%. Наименьшее количество результатов у поисковой системы Meta - 0.2%

Общее количество результатов на момент начала поиска составляло:

Количество результатов в конце поиска:

В русскоязычном сегменте уменьшилось количество ссылок, это может объяснятся тем, что ссылки были низкого качества либо ссылки на старые ресурсы, которые были удалены из индекса.