Отчет о результатах поиска по теме выпускной работы
Данная страница содержит результаты поиска информации по теме магистерской работы в сети Интернет, а также анализ этих результатов. Для оценки динамики изменения объемов поисковой выдачи поиск выполнялся дважды (11/05/2010 и 31/05/2010) по 5 тематическим запросам на 3 языках в 6 поисковых системах (Google, Yandex, Rambler, Yahoo, Meta, msn.com).
Ниже представлены таблицы, в которые сведены все результаты поиска за две вышеуказанные даты. Данные в таблицах представлены в двух видах: одно число обозначает количество сайтов, а два числа через прямую косую – количество сайтов / количество документов. Также для сокращения записи используются множители: буквой K обозначены тысячи, а буквой M – миллионы.
№ п.п. | Запросы | google.com | google.com.ua | yandex.ru | rambler.ru | yahoo.com | meta.ua | msn.com |
---|---|---|---|---|---|---|---|---|
1 | Методы выполнения операций высокой точности над многоразрядными числами в формате с плавающей точкой | 332 | 29 | 3 692 | 3 / 12 | 1 | 5 / 8 | 2 |
2 | Методи виконання операцій з високою точністю над багаторозрядними числами у форматі з плаваючою комою | 5 | 5 | 1 110 | 0 | 0 | 2 / 3 | 0 |
3 | The methods of high precision calculation over the multidigit floating-point numbers | 901 | 0 | 1 468 | 0 | 50 | 1 / 1 | 104 |
4 | повышение точности операций числами плавающей запятой | 7 110 | 726 | 1M | 37k / 299k | 249 | 205 / 680 | 184k |
5 | підвищення точності операцій числами плаваючою комою | 408 | 2 | 2 857 | 12 / 26 | 7 | 54 / 119 | 14 |
6 | improve accuracy operation floating point number | 1 160k | 558 | 674k | 239 / 811 | 1 550k | 79 / 256 | 657k |
7 | операции высокая точность вещественные числа | 43 900 | 5 290 | 153k | 2k / 10k | 412 | 490 / 3 400 | 12 400 |
8 | операції висока точність дійсні числа | 4 080 | 5 170 | 10k | 134 / 344 | 29 | 339 / 1 500 | 58 |
9 | operation high precision real | 5 080k | 3 590 | 2M | 6k / 38k | 21M | 531 / 4 500 | 4 510k |
10 | метод точность интервальный численный анализ | 6 280 | 275 | 11k | 785 / 2k | 19 | 73 / 686 | 397 |
11 | метод точність інтервальний чисельний аналіз | 1 250 | 1 140 | 414 | 40 / 153 | 3 | 37 / 194 | 3 |
12 | method precision interval computations | 3 370k | 416 | 301k | 821 / 3k | 586k | 54 / 180 | 408k |
13 | интервальные вычисления | 36 500 | 2 830 | 67k | 5k / 28k | 3 630 | 262 / 1 500 | 11 400 |
14 | інтервальні обчислення | 10 900 | 9 880 | 1 997 | 328 / 1 826 | 155 | 75 / 584 | 50 |
15 | interval computation | 42.8M | 1 550 | 987k | 3k / 39k | 6 960k | 203 / 1 400 | 1 820k |
№ п.п. | Запросы | google.com | google.com.ua | yandex.ru | rambler.ru | yahoo.com | meta.ua | msn.com |
---|---|---|---|---|---|---|---|---|
1 | Методы выполнения операций высокой точности над многоразрядными числами в формате с плавающей точкой | 265 | 22 | 4 094 | 0 | 1 | 7 / 14 | 3 |
2 | Методи виконання операцій з високою точністю над багаторозрядними числами у форматі з плаваючою комою | 6 | 6 | 1 340 | 0 | 0 | 1 / 1 | 0 |
3 | The methods of high precision calculation over the multidigit floating-point numbers | 1 120 | 6 | 1 495 | 0 | 62 | 0 | 125 |
4 | повышение точности операций числами плавающей запятой | 7 720 | 745 | 38k | 896 / 3k | 272 | 203 / 722 | 3k |
5 | підвищення точності операцій числами плаваючою комою | 432 | 334 | 3 032 | 12 / 33 | 7 | 59 / 142 | 16 |
6 | improve accuracy operation floating point number | 1 130k | 518 | 776k | 249 / 843 | 1 670k | 80 / 315 | 621k |
7 | операции высокая точность вещественные числа | 59 900 | 6 490 | 166k | 2k / 11k | 428 | 492 / 3 600 | 13 900 |
8 | операції висока точність дійсні числа | 4 670 | 5 890 | 12k | 138 / 346 | 31 | 337 / 1 500 | 29 |
9 | operation high precision real | 4 810k | 3 540 | 2M | 6k / 39k | 21.7M | 519 / 4 200 | 3 720k |
10 | метод точность интервальный численный анализ | 6 020 | 308 | 12k | 790 / 2k | 20 | 71 / 699 | 352 |
11 | метод точність інтервальний чисельний аналіз | 1 180 | 1 060 | 440 | 42 / 155 | 3 | 35 / 230 | 3 |
12 | method precision interval computations | 3 690k | 437 | 337k | 830 / 3k | 605k | 48 / 184 | 502k |
13 | интервальные вычисления | 40 100 | 2 850 | 67k | 5k / 28k | 3 680 | 261 / 1 500 | 8 760 |
14 | інтервальні обчислення | 11 100 | 10 100 | 1 995 | 332 / 1 828 | 158 | 152 / 1k | 53 |
15 | interval computation | 49.2M | 1 600 | 1M | 3k / 40k | 6 960k | 204 / 1 500 | 2 040k |
Сразу необходимо отметить аномалии нескольких поисковых систем, в частности, Google, – по некоторым запросам количество найденных ресурсов за более ранний период больше, чем за более поздний период (т.е. количество ресурсов по этим запросам со временем уменьшилось, хотя должно происходить обратное, или, по крайней мере, неуменьшение). Связано это, скорее всего, с реиндексациями, проведенными в данных системах в период между двумя запросами.
Ниже идет многокритериальная оценка результатов поиска.
Оценка по среднему арифметическому
На диаграмме 1 изображена «грубая» оценка поисковых систем по среднему арифметическому результатов запросов каждой системы (для систем с двойной оценкой бралось количество документов).
Диаграмма 1 – Сравнение поисковых систем по среднему арифметическому результатов поиска
Результат получился вполне ожидаемым – на первом месте находится гигант мирового поиска Google, на втором (менее чем с половинным отставанием) – самый мощный зарубежный поисковик Yahoo, третье место с большим отрывом занимает буржуйский MSN, недалеко от него четвертое место занял Yandex. Результаты остальных можно не учитывать, т.к. они близки к нулю.
Общая динамика изменений
Диаграмма 2 демонстрирует динамику изменения среднего арифметического результатов по каждому поисковику отдельно по двум вышеприведенным таблицам.
Диаграмма 2 – Динамика изменений результатов поиска
Наблюдается интересная ситуация – в то время, как у лидеров поиска (Google и Yahoo) средние показатели растут во времени, у большинства остальных (что особенно заметно у Yandex'а и Rambler'а) они падают, что, несомненно, говорит в пользу того, что, как и сказано выше, этими поисковиками была произведена реиндексация. Кстати, из диаграммы также видно, что Google реиндексируется эффективнее и быстрее остальных поисковых систем.
Показатели по языкам
Диаграмма 3 показывает абсолютное распределение среднеарифметических показателей по языкам обоих поисковых экспериментов.
Диаграмма 3 – Абсолютные среднеарифметические показатели по языкам
По диаграмме можно сделать два вывода. Первый: подавляющее большинство ресурсов по теме магистерской работы написаны на английском языке. Второй: диаграмма абсолютного языкового распределения очень сильно похожа на диаграмму среднеарифмитических результатов поиска, что говорит о том, что в основном на общие средние показатели влияет распределение англоязычных ресурсов.
Чтобы иметь возможность оценить поисковики по языкам, была составлена диаграмма 4, в которой языковые значения были нормализованы (абсолютное значение по языку было разделено на сумму всех значений всех поисковиков для данного языка). Конечно, в этом случае нельзя проводить межязыковое сравнение поисковых систем, однако можно оценить долю каждого поисковика по данному языку, а также среднее качество поисковика.
Диаграмма 4 – Относительные среднеарифметические показатели по языкам
По диаграмме можно наблюдать достаточно интересные результаты. Оказывается, первое место по поиску среди русскоязычного контента занимает Yandex, второе (с огромным отрывом) – Rambler, а ожидаемый на первом месте Google занял всего лишь четвертое место; наилучшим поисковиком по англоязычным ресурсам был признан как раз Google, а ожидаемый Yahoo занял второе место. За звание лучшего среди украиноязычных поисковиков ведут равную борьбу сразу Google и Yandex, но пока последний сохраняет за собой лидерство; Meta же, несмотря на украиноязычную направленность, показал худшие результаты не только среди всех украино-ищущих поисковиков, но и среди всех поисковиков вообще. Наилучшими поисковиками были признаны: среди всех – Google, среди отечественных – Yandex, а среди зарубежных – Yahoo.
Выводы
Сперва стоит сказать о том, что наибольшее внимание вопросам, поднимаемым в теме магистерской работы, исходя из поисковых показателей, уделяется зарубежными ресурсами. Русскоязычные ресурсы идут по принципу «постольку – поскольку», и это неудивительно хотя бы потому, что вся фундаментальная документация идет на английском, да и вообще, лидером современного развития компьютерной сферы несомененно является Запад. Ситуацию же в украиноязычном сегменте Интернета можно охарактеризовать либо как «все только начинается», либо как «родился мертвым» и здесь мне более сказать нечего.
Относительно поисковых систем: система, выдающая наибольшее количество ресурсов по запросу не обязательно является самой качественной. Например, в критерий качества входят такие вещи, как выдача на первых страницах наиболее значимых ссылок (т.е. таких, которые являются действительной целью поиска), частая реиндексация (чтобы по запросу всегда выдавать как можно более свежие данные) и скорость работы. Данная работа касалась только такого количественного показателя, как объемы поиска, однако не были задействованы никакие качественные показатели. Оценивая «на глаз», можно сказать, что Google является наиболее сбалансированной системой по большинству показателей (однако и он иногда ошибается, и тогда ему на замену приходит Yandex).