Отчет о результатах поиска по теме выпускной работы
Цель формирования отчета о поиске – фиксация и анализ основных количественных показателей, характеризирующих информационную ситуацию по теме магистерской работы в период работы над сайтом. Отчет о поиске – важнейший показатель глубины и качества проведенной поисковой работы по теме.
В приведенных ниже таблицах представлены результаты поиска электронных документов с помощью поисковых систем Google, Yandex, Yahoo, Rambler, Meta и Bing. В первом столбце указаны ключевые слова для поиска. Поиск производился на русском, английском и украинском языках для фраз в кавычках и без.
Сравнивая результаты запросов по различным поисковым системам, можно прийти к выводу, что результат очень сильно зависит от поисковой системы и от самого запроса. Запрос, соответствующий теме магистерской работы найден в достаточном количестве только в системах Google и Yandex. Во остальных случаях было найденно достаточное количество документов. По русскому языку в некоторых запросах лидирует система Yandex, однако качество найденного материала в ней уступает системе Google. По английским запросам хорошие результаты показали системы Google и Yahoo. Стоит также отметить что Yahoo и Bing выдают практически равное количество результатов. Meta и Rambler можно назвать аутсайдерами. Результаты полученные данными поисковыми системами невели и не всегда отвечают релевантности поискового запроса.
Отчет о поиске за 07.03.2011
Поисковый запрос | Yandex | Yahoo | Rambler | Meta | Bing | |
разработка инструментальных средств очистки web-страниц от информационного шума | 82 700 | 151 00 | 391 | 7 | 52 | 1 070 |
очищение web-страниц | 167 000 | 534 00 | 6 770 | 57 000 | 2 800 | 67 000 |
очистка web-страниц от информационного шума | 11 200 | 550 00 | 20 500 | 1 082 | 669 | 38 600 |
получение основного контента web-страницы | 127 000 | 402 00 | 152 000 | 45 000 | 2 900 | 228 000 |
Криницкая Алеся Ивановна | 1 360 | 354 | 28 | 10 | 4 | 106 |
Мартыненко Татьяна Владимировна | 40 200 | 60 000 | 13 500 | 2 000 | 431 | 28 000 |
«разработка инструментальных средств очистки web-страниц от информационного шума» | 0 | 0 | 391 | 0 | 0 | 1 070 |
«очищение web-страниц» | 0 | 0 | 0 | 0 | 0 | 167 000 |
«очистка web-страниц от информационного шума» | 0 | 0 | 0 | 0 | 0 | 386 00 |
«получение основного контента web-страницы» | 0 | 0 | 152 000 | 0 | 0 | 228 000 |
«Криницкая Алеся Ивановна» | 0 | 0 | 28 | 0 | 0 | 106 |
«Мартыненко Татьяна Владимировна» | 3 360 | 186 | 13 500 | 39 | 11 | 28 |
розробка інструментальних засобів очищення web-сторінок від інформаційного шуму | 152 | 5 005 | 6 | 1 | 4 | 6 |
очищення web-сторінок | 11 800 | 25 000 | 74 | 633 | 846 | 99 |
очищення web-сторінок від інформаційного шуму | 543 | 11 000 | 52 | 1 | 19 | 213 |
отримання основного контенту web-сторінки | 3 880 | 7 782 | 591 | 93 | 291 | 260 |
Криницька Алєся Іванівна | 1 420 | 23 | 5 | 2 | 1 | 5 |
Мартиненко Тетяна Володимирівна | 5 880 | 4 766 | 2 580 | 458 | 551 | 4 080 |
«розробка інструментальних засобів очищення web-сторінок від інформаційного шуму» | 0 | 0 | 6 | 0 | 0 | 6 |
«очищення web-сторінок» | 2 | 1 | 1 | 1 | 0 | 2 990 |
«очищення web-сторінок від інформаційного шуму» | 2 | 1 | 52 | 1 | 0 | 213 |
«отримання основного контенту web-сторінки» | 0 | 0 | 591 | 0 | 0 | 260 |
«Криницька Алєся Іванівна» | 0 | 0 | 0 | 0 | 0 | 0 |
«Мартиненко Тетяна Володимирівна» | 165 | 33 | 2 580 | 6 | 12 | 4 080 |
development tools, cleaning web-pages of information noise | 260 000 | 603 090 | 8 520 000 | 0 | 391 | 8 450 000 |
purification of web-pages | 2 590 000 | 79 000 | 9 740 000 | 46 400 | 34 900 | 9 770 000 |
purification of web-pages of information noise | 900 600 | 56 070 | 6 150 | 1 | 300 | 6 130 |
receive basic content web-pages | 9 290 000 | 300 000 | 1 380 000 | 51 000 | 10 610 | 1 400 000 |
Krinitskaya Alesya | 586 | 0 | 8 | 0 | 0 | 8 |
Martynenko Tatyana | 60 200 | 138 000 | 37 | 35 | 62 | 37 |
"Development tools clean web-pages of information noise" | 0 | 0 | 8 520 000 | 0 | 0 | 8 450 000 |
"purification of web-pages" | 0 | 0 | 9 740 000 | 0 | 0 | 9 710 000 |
"to clean up web-pages of information noise" | 0 | 0 | 6 004 | 0 | 0 | 5 980 |
"getting the main content web-pages" | 0 | 0 | 1 380 000 | 0 | 0 | 1 410 000 |
"Krinitsky Alesya" | 0 | 0 | 0 | 0 | 0 | 0 |
"Martynenko Tatyana" | 0 | 201 | 38 | 2 | 4 | 36 |
Отчет о поиске за 15.05.2011
Поисковый запрос | Yandex | Yahoo | Rambler | Meta | Bing | |
разработка инструментальных средств очистки web-страниц от информационного шума | 85 400 | 18 000 | 466 | 7 | 312 | 467 |
очищение web-страниц | 597 000 | 252 000 | 48 | 60 000 | 32 800 | 88 000 |
очистка web-страниц от информационного шума | 124 000 | 51 000 | 21 500 | 1 059 | 4 200 | 22 400 |
получение основного контента web-страницы | 93 700 | 306 000 | 330 000 | 46 000 | 13 200 | 328 000 |
Криницкая Алеся Ивановна | 1 610 | 33 | 28 | 24 | 1 | 33 |
Мартыненко Татьяна Владимировна | 90 000 | 62 000 | 28 800 | 18 000 | 1 700 | 49 |
«разработка инструментальных средств очистки web-страниц от информационного шума» | 0 | 0 | 462 | 0 | 0 | 468 |
«очищение web-страниц» | 0 | 0 | 3 | 0 | 0 | 2 480 |
«очистка web-страниц от информационного шума» | 0 | 0 | 33 000 | 0 | 0 | 328 000 |
«получение основного контента web-страницы» | 0 | 0 | 152 000 | 0 | 0 | 228 000 |
«Криницкая Алеся Ивановна» | 0 | 0 | 33 | 0 | 0 | 28 |
«Мартыненко Татьяна Владимировна» | 3 570 | 199 | 28 800 | 39 | 32 | 49 |
розробка інструментальних засобів очищення web-сторінок від інформаційного шуму | 180 | 1 272 | 7 | 1 | 3 | 7 |
очищення web-сторінок | 38 000 | 27 000 | 75 | 4 000 | 85 700 | 76 |
очищення web-сторінок від інформаційного шуму | 1 120 | 1 870 | 63 | 3 | 65 | 63 |
отримання основного контенту web-сторінки | 15 200 | 6 523 | 636 | 405 | 5 100 | 644 |
Криницька Алєся Іванівна | 19 400 | 20 | 3 | 0 | 1 | 3 |
Мартиненко Тетяна Володимирівна | 55 400 | 6 021 | 2 290 | 3 000 | 2 800 | 2 300 |
«розробка інструментальних засобів очищення web-сторінок від інформаційного шуму» | 0 | 0 | 7 | 0 | 0 | 7 |
«очищення web-сторінок» | 2 | 1 | 1 | 2 | 0 | 1 |
«очищення web-сторінок від інформаційного шуму» | 2 | 1 | 63 | 2 | 0 | 63 |
«отримання основного контенту web-сторінки» | 0 | 0 | 636 | 0 | 0 | 644 |
«Криницька Алєся Іванівна» | 0 | 0 | 3 | 0 | 0 | 3 |
«Мартиненко Тетяна Володимирівна» | 215 | 28 | 2 980 | 16 | 22 | 2 300 |
development tools, cleaning web-pages of information noise | 1 770 000 | 604 000 | 1 320 000 | 320 | 1 500 | 13 200 000 |
purification of web-pages | 11 500 000 | 175 000 | 102 000 | 6 000 | 1 800 | 102 000 |
purification of web-pages of information noise | 926 000 | 47 000 | 9 060 | 180 | 129 | 9 130 |
receive basic content web-pages | 28 600 000 | 300 000 | 5 040 000 | 39 000 | 1 060 | 5 060 000 |
Krinitskaya Alesya | 0 | 44 | 2 | 0 | 0 | 2 |
Martynenko Tatyana | 77 400 | 131 000 | 9 020 | 617 | 58 | 9 070 |
"Development tools clean web-pages of information noise" | 0 | 0 | 3 160 000 | 0 | 0 | 3 300 000 |
"purification of web-pages" | 0 | 0 | 630 000 | 0 | 0 | 629 000 |
"to clean up web-pages of information noise" | 2 060 000 | 0 | 3 550 000 | 932 | 3 200 | 4 280 000 |
"getting the main content web-pages" | 0 | 0 | 38 000 000 | 0 | 0 | 37 800 000 |
"Krinitsky Alesya" | 0 | 0 | 2 | 0 | 0 | 2 |
"Martynenko Tatyana" | 101 | 76 | 17 | 13 | 4 | 17 |
Анализ полученных результатов
Динамику изменения информационной ситуации и эффективность поисковых систем, можно проиллюстрировать с помощью следующих диаграмм.
Рисунок 1 – Статистика результатов поиска по русскоязычным запросам
Анализируя результаты поиска по русскоязычным запросам можно сделать вывод, что лидирующую позицию занимает поисковая система Bing (1060079 документов), однако ее существенным недостатком является то, что большинством являются ссылки на малоинформативные статьи.
Максимальный темп роста наблюдается за фразами Очищение веб-страниц и Получение основного контента web-страницы, используя поисковые системы Google (430 000 документов) и Yahoo (178 000 документов), а по фразам Очистка web-страниц от информационного шума и Криницкая Алеся выявлено сокращение количества найденных документов поисковыми системами Yandex и Bing. Сокращение количества найденных документов предположительно может быть связано с тем, что в сети удаляются неинформативные страницы, содержащие массу рекламы и практически бесполезную информацию. Стоит также отметить, что сокращение результатов поиска незначительно, и в среднем по каждой поисковой системе наблюдается динамика роста.
Что же касается среднего показателя темпа роста по всем запросам на русском языке, то он составил 1 533 450 документов.
Если брать суммарные показатели по каждой поисковой системе, то максимальный темп роста был выявлен у системы Google – 36,7% (562 460 документов), а минимальный по Rambler – 1,3% (19 991 документов).
Рисунок 2 – Статистика результатов поиска по украиноязычным запросам
Анализ статистики украиноязычных запросов показал, что наиболее эффективными можно считать поисковые системы Google и Meta.
Максимальный темп роста наблюдается за фразой Очищення web-сторінок, при использовании поисковой системы Meta (84 854 документов), а минимальные – по фразе Розробка інструментальних засобів очищення web-сторінок від інформаційного шуму, используя поисковую систему Yandex (-9 130 документов). Если брать суммарные показатели по каждой поисковой системе, то максимальный темп роста был выявлен у системы Google (105 675 документов), а минимальный – по Yandex (-10 875 документов).
Что же касается среднего показателя темпа роста по всем запросам на украинском языке, то он составил 186 125 документов.
Рисунок 3 – Статистика результатов поиска по англоязычным запросам
Проанализировав количество найденных документов на английском языке, можно с уверенностью сказать, что безоговорочное первенство за поисковой системой Bing (более 103 591 400 документов). Удельный же вес поисковых систем META и Rambler настолько низки, что даже не были отображены на диаграмме, ввиду небольшого количества найденных документов.
Максимальный темп роста наблюдается за фразой Receive basic content web-pages как в кавычках, так и без них, используя поисковую систему Bing (3 660 000 документов), а минимальные – по фразе Рurification of web-pages как в кавычках, так и без них, используя поисковую систему Yahoo (-9 638 000 документов). Если брать суммарные показатели по каждой поисковой системе, то максимальный темп роста был выявлен у системы Google (31 832 115 документов), а минимальный – по Rambler (-50 376 документов).
Что же касается среднего показателя темпа роста по всем запросам на английском языке, то он составил 69 538 876 документов, что соответствует 27,2% от общего количества найденных документов на английском языке.
Наибольшее количество материалов находит поисковая система Bing – 40,4% от общего количества.
Наименьшее количество материалов находит поисковая система Meta – 0,08% от общего количества.
Общее количество материалов за период поиска возросло на 27%.
Делая вывод о поиске, следует отметить следующее:
- Наибольшее количество литературы по данной теме магистерской работы находится в англоязычных источниках.
- Для поиска литературы на русском и украинском языках целесообразно использовать поисковую систему Google или Yandex, а для англоязычных документов – Yahoo или Bing. Но результат иногда бывает не предсказуем, поэтому, оптимальное решение – выбирать поисковую систему в зависимости от области поиска.
- Суммарно по количеству найденных документов лидируют поисковые системы Google и Bing, а Meta и Rambler значительно проигрывают по количеству найденных источников.
- В данной тематической области преобладают англоязычные источники. Это обусловлено тем, что материалы по данной теме хорошо изучены и представлены англоязычными исследователями.