Отчет о результатах поиска по теме выпускной работы


Цель формирования отчета о поиске – фиксация и анализ основных количественных показателей, характеризирующих информационную ситуацию по теме магистерской работы в период работы над сайтом. Отчет о поиске – важнейший показатель глубины и качества проведенной поисковой работы по теме.

В приведенных ниже таблицах представлены результаты поиска электронных документов с помощью поисковых систем Google, Yandex, Yahoo, Rambler, Meta и Bing. В первом столбце указаны ключевые слова для поиска. Поиск производился на русском, английском и украинском языках для фраз в кавычках и без.

Сравнивая результаты запросов по различным поисковым системам, можно прийти к выводу, что результат очень сильно зависит от поисковой системы и от самого запроса. Запрос, соответствующий теме магистерской работы найден в достаточном количестве только в системах Google и Yandex. Во остальных случаях было найденно достаточное количество документов. По русскому языку в некоторых запросах лидирует система Yandex, однако качество найденного материала в ней уступает системе Google. По английским запросам хорошие результаты показали системы Google и Yahoo. Стоит также отметить что Yahoo и Bing выдают практически равное количество результатов. Meta и Rambler можно назвать аутсайдерами. Результаты полученные данными поисковыми системами невели и не всегда отвечают релевантности поискового запроса.

Отчет о поиске за 07.03.2011

Поисковый запрос Google Yandex Yahoo Rambler Meta Bing
разработка инструментальных средств очистки web-страниц от информационного шума 82 700 151 00 391 7 52 1 070
очищение web-страниц 167 000 534 00 6 770 57 000 2 800 67 000
очистка web-страниц от информационного шума 11 200 550 00 20 500 1 082 669 38 600
получение основного контента web-страницы 127 000 402 00 152 000 45 000 2 900 228 000
Криницкая Алеся Ивановна 1 360 354 28 10 4 106
Мартыненко Татьяна Владимировна 40 200 60 000 13 500 2 000 431 28 000
«разработка инструментальных средств очистки web-страниц от информационного шума» 0 0 391 0 0 1 070
«очищение web-страниц» 0 0 0 0 0 167 000
«очистка web-страниц от информационного шума» 0 0 0 0 0 386 00
«получение основного контента web-страницы» 0 0 152 000 0 0 228 000
«Криницкая Алеся Ивановна» 0 0 28 0 0 106
«Мартыненко Татьяна Владимировна» 3 360 186 13 500 39 11 28
розробка інструментальних засобів очищення web-сторінок від інформаційного шуму 152 5 005 6 1 4 6
очищення web-сторінок 11 800 25 000 74 633 846 99
очищення web-сторінок від інформаційного шуму 543 11 000 52 1 19 213
отримання основного контенту web-сторінки 3 880 7 782 591 93 291 260
Криницька Алєся Іванівна 1 420 23 5 2 1 5
Мартиненко Тетяна Володимирівна 5 880 4 766 2 580 458 551 4 080
«розробка інструментальних засобів очищення web-сторінок від інформаційного шуму» 0 0 6 0 0 6
«очищення web-сторінок» 2 1 1 1 0 2 990
«очищення web-сторінок від інформаційного шуму» 2 1 52 1 0 213
«отримання основного контенту web-сторінки» 0 0 591 0 0 260
«Криницька Алєся Іванівна» 0 0 0 0 0 0
«Мартиненко Тетяна Володимирівна» 165 33 2 580 6 12 4 080
development tools, cleaning web-pages of information noise 260 000 603 090 8 520 000 0 391 8 450 000
purification of web-pages 2 590 000 79 000 9 740 000 46 400 34 900 9 770 000
purification of web-pages of information noise 900 600 56 070 6 150 1 300 6 130
receive basic content web-pages 9 290 000 300 000 1 380 000 51 000 10 610 1 400 000
Krinitskaya Alesya 586 0 8 0 0 8
Martynenko Tatyana 60 200 138 000 37 35 62 37
"Development tools clean web-pages of information noise" 0 0 8 520 000 0 0 8 450 000
"purification of web-pages" 0 0 9 740 000 0 0 9 710 000
"to clean up web-pages of information noise" 0 0 6 004 0 0 5 980
"getting the main content web-pages" 0 0 1 380 000 0 0 1 410 000
"Krinitsky Alesya" 0 0 0 0 0 0
"Martynenko Tatyana" 0 201 38 2 4 36

Отчет о поиске за 15.05.2011

Поисковый запрос Google Yandex Yahoo Rambler Meta Bing
разработка инструментальных средств очистки web-страниц от информационного шума 85 400 18 000 466 7 312 467
очищение web-страниц 597 000 252 000 48 60 000 32 800 88 000
очистка web-страниц от информационного шума 124 000 51 000 21 500 1 059 4 200 22 400
получение основного контента web-страницы 93 700 306 000 330 000 46 000 13 200 328 000
Криницкая Алеся Ивановна 1 610 33 28 24 1 33
Мартыненко Татьяна Владимировна 90 000 62 000 28 800 18 000 1 700 49
«разработка инструментальных средств очистки web-страниц от информационного шума» 0 0 462 0 0 468
«очищение web-страниц» 0 0 3 0 0 2 480
«очистка web-страниц от информационного шума» 0 0 33 000 0 0 328 000
«получение основного контента web-страницы» 0 0 152 000 0 0 228 000
«Криницкая Алеся Ивановна» 0 0 33 0 0 28
«Мартыненко Татьяна Владимировна» 3 570 199 28 800 39 32 49
розробка інструментальних засобів очищення web-сторінок від інформаційного шуму 180 1 272 7 1 3 7
очищення web-сторінок 38 000 27 000 75 4 000 85 700 76
очищення web-сторінок від інформаційного шуму 1 120 1 870 63 3 65 63
отримання основного контенту web-сторінки 15 200 6 523 636 405 5 100 644
Криницька Алєся Іванівна 19 400 20 3 0 1 3
Мартиненко Тетяна Володимирівна 55 400 6 021 2 290 3 000 2 800 2 300
«розробка інструментальних засобів очищення web-сторінок від інформаційного шуму» 0 0 7 0 0 7
«очищення web-сторінок» 2 1 1 2 0 1
«очищення web-сторінок від інформаційного шуму» 2 1 63 2 0 63
«отримання основного контенту web-сторінки» 0 0 636 0 0 644
«Криницька Алєся Іванівна» 0 0 3 0 0 3
«Мартиненко Тетяна Володимирівна» 215 28 2 980 16 22 2 300
development tools, cleaning web-pages of information noise 1 770 000 604 000 1 320 000 320 1 500 13 200 000
purification of web-pages 11 500 000 175 000 102 000 6 000 1 800 102 000
purification of web-pages of information noise 926 000 47 000 9 060 180 129 9 130
receive basic content web-pages 28 600 000 300 000 5 040 000 39 000 1 060 5 060 000
Krinitskaya Alesya 0 44 2 0 0 2
Martynenko Tatyana 77 400 131 000 9 020 617 58 9 070
"Development tools clean web-pages of information noise" 0 0 3 160 000 0 0 3 300 000
"purification of web-pages" 0 0 630 000 0 0 629 000
"to clean up web-pages of information noise" 2 060 000 0 3 550 000 932 3 200 4 280 000
"getting the main content web-pages" 0 0 38 000 000 0 0 37 800 000
"Krinitsky Alesya" 0 0 2 0 0 2
"Martynenko Tatyana" 101 76 17 13 4 17

Анализ полученных результатов

Динамику изменения информационной ситуации и эффективность поисковых систем, можно проиллюстрировать с помощью следующих диаграмм.

Рисунок 1 – Статистика результатов поиска по русскоязычным запросам


Анализируя результаты поиска по русскоязычным запросам можно сделать вывод, что лидирующую позицию занимает поисковая система Bing (1060079 документов), однако ее существенным недостатком является то, что большинством являются ссылки на малоинформативные статьи.

Максимальный темп роста наблюдается за фразами Очищение веб-страниц и Получение основного контента web-страницы, используя поисковые системы Google (430 000 документов) и Yahoo (178 000 документов), а по фразам Очистка web-страниц от информационного шума и Криницкая Алеся выявлено сокращение количества найденных документов поисковыми системами Yandex и Bing. Сокращение количества найденных документов предположительно может быть связано с тем, что в сети удаляются неинформативные страницы, содержащие массу рекламы и практически бесполезную информацию. Стоит также отметить, что сокращение результатов поиска незначительно, и в среднем по каждой поисковой системе наблюдается динамика роста.

Что же касается среднего показателя темпа роста по всем запросам на русском языке, то он составил 1 533 450 документов. Если брать суммарные показатели по каждой поисковой системе, то максимальный темп роста был выявлен у системы Google – 36,7% (562 460 документов), а минимальный по Rambler – 1,3% (19 991 документов).

Рисунок 2 – Статистика результатов поиска по украиноязычным запросам


Анализ статистики украиноязычных запросов показал, что наиболее эффективными можно считать поисковые системы Google и Meta.

Максимальный темп роста наблюдается за фразой Очищення web-сторінок, при использовании поисковой системы Meta (84 854 документов), а минимальные – по фразе Розробка інструментальних засобів очищення web-сторінок від інформаційного шуму, используя поисковую систему Yandex (-9 130 документов). Если брать суммарные показатели по каждой поисковой системе, то максимальный темп роста был выявлен у системы Google (105 675 документов), а минимальный – по Yandex (-10 875 документов).

Что же касается среднего показателя темпа роста по всем запросам на украинском языке, то он составил 186 125 документов.

Рисунок 3 – Статистика результатов поиска по англоязычным запросам


Проанализировав количество найденных документов на английском языке, можно с уверенностью сказать, что безоговорочное первенство за поисковой системой Bing (более 103 591 400 документов). Удельный же вес поисковых систем META и Rambler настолько низки, что даже не были отображены на диаграмме, ввиду небольшого количества найденных документов.

Максимальный темп роста наблюдается за фразой Receive basic content web-pages как в кавычках, так и без них, используя поисковую систему Bing (3 660 000 документов), а минимальные – по фразе Рurification of web-pages как в кавычках, так и без них, используя поисковую систему Yahoo (-9 638 000 документов). Если брать суммарные показатели по каждой поисковой системе, то максимальный темп роста был выявлен у системы Google (31 832 115 документов), а минимальный – по Rambler (-50 376 документов).

Что же касается среднего показателя темпа роста по всем запросам на английском языке, то он составил 69 538 876 документов, что соответствует 27,2% от общего количества найденных документов на английском языке.

Наибольшее количество материалов находит поисковая система Bing – 40,4% от общего количества.

Наименьшее количество материалов находит поисковая система Meta – 0,08% от общего количества.

Общее количество материалов за период поиска возросло на 27%.

Делая вывод о поиске, следует отметить следующее: