Skip to main content.

Отчет о результатах поиска по теме выпускной работы

Данная страница содержит результаты поиска информации по теме магистерской работы в сети Интернет, а также анализ этих результатов. Для оценки динамики изменения объемов поисковой выдачи поиск выполнялся дважды (11/05/2010 и 31/05/2010) по 5 тематическим запросам на 3 языках в 6 поисковых системах (Google, Yandex, Rambler, Yahoo, Meta, msn.com).

Ниже представлены таблицы, в которые сведены все результаты поиска за две вышеуказанные даты. Данные в таблицах представлены в двух видах: одно число обозначает количество сайтов, а два числа через прямую косую – количество сайтов / количество документов. Также для сокращения записи используются множители: буквой K обозначены тысячи, а буквой M – миллионы.

Таблица 1 – Отчет о поиске от 11/05/2010
№ п.п. Запросы google.com google.com.ua yandex.ru rambler.ru yahoo.com meta.ua msn.com
1Методы выполнения операций высокой точности над многоразрядными числами в формате с плавающей точкой 332293 6923 / 1215 / 82
2Методи виконання операцій з високою точністю над багаторозрядними числами у форматі з плаваючою комою 551 110002 / 30
3The methods of high precision calculation over the multidigit floating-point numbers 90101 4680501 / 1104
4повышение точности операций числами плавающей запятой 7 1107261M37k / 299k249205 / 680184k
5підвищення точності операцій числами плаваючою комою 40822 85712 / 26754 / 11914
6improve accuracy operation floating point number 1 160k558674k239 / 8111 550k79 / 256657k
7операции высокая точность вещественные числа 43 9005 290153k2k / 10k412490 / 3 40012 400
8операції висока точність дійсні числа 4 0805 17010k134 / 34429339 / 1 50058
9operation high precision real 5 080k3 5902M6k / 38k21M531 / 4 5004 510k
10метод точность интервальный численный анализ 6 28027511k785 / 2k1973 / 686397
11метод точність інтервальний чисельний аналіз 1 2501 14041440 / 153337 / 1943
12method precision interval computations 3 370k416301k821 / 3k586k54 / 180408k
13интервальные вычисления 36 5002 83067k5k / 28k3 630262 / 1 50011 400
14інтервальні обчислення 10 9009 8801 997328 / 1 82615575 / 58450
15interval computation 42.8M1 550987k3k / 39k6 960k203 / 1 4001 820k

Таблица 2 – Отчет о поиске от 31/05/2010
№ п.п. Запросы google.com google.com.ua yandex.ru rambler.ru yahoo.com meta.ua msn.com
1Методы выполнения операций высокой точности над многоразрядными числами в формате с плавающей точкой 265224 094017 / 143
2Методи виконання операцій з високою точністю над багаторозрядними числами у форматі з плаваючою комою 661 340001 / 10
3The methods of high precision calculation over the multidigit floating-point numbers 1 12061 4950620125
4повышение точности операций числами плавающей запятой 7 72074538k896 / 3k272203 / 7223k
5підвищення точності операцій числами плаваючою комою 4323343 03212 / 33759 / 14216
6improve accuracy operation floating point number 1 130k518776k249 / 8431 670k80 / 315621k
7операции высокая точность вещественные числа 59 9006 490166k2k / 11k428492 / 3 60013 900
8операції висока точність дійсні числа 4 6705 89012k138 / 34631337 / 1 50029
9operation high precision real 4 810k3 5402M6k / 39k21.7M519 / 4 2003 720k
10метод точность интервальный численный анализ 6 02030812k790 / 2k2071 / 699352
11метод точність інтервальний чисельний аналіз 1 1801 06044042 / 155335 / 2303
12method precision interval computations 3 690k437337k830 / 3k605k48 / 184502k
13интервальные вычисления 40 1002 85067k5k / 28k3 680261 / 1 5008 760
14інтервальні обчислення 11 10010 1001 995332 / 1 828158152 / 1k53
15interval computation 49.2M1 6001M3k / 40k6 960k204 / 1 5002 040k

Сразу необходимо отметить аномалии нескольких поисковых систем, в частности, Google, – по некоторым запросам количество найденных ресурсов за более ранний период больше, чем за более поздний период (т.е. количество ресурсов по этим запросам со временем уменьшилось, хотя должно происходить обратное, или, по крайней мере, неуменьшение). Связано это, скорее всего, с реиндексациями, проведенными в данных системах в период между двумя запросами.

Ниже идет многокритериальная оценка результатов поиска.

Оценка по среднему арифметическому

На диаграмме 1 изображена «грубая» оценка поисковых систем по среднему арифметическому результатов запросов каждой системы (для систем с двойной оценкой бралось количество документов).

Среднее арифметическое результатов поиска

Диаграмма 1 – Сравнение поисковых систем по среднему арифметическому результатов поиска

Результат получился вполне ожидаемым – на первом месте находится гигант мирового поиска Google, на втором (менее чем с половинным отставанием) – самый мощный зарубежный поисковик Yahoo, третье место с большим отрывом занимает буржуйский MSN, недалеко от него четвертое место занял Yandex. Результаты остальных можно не учитывать, т.к. они близки к нулю.

Общая динамика изменений

Диаграмма 2 демонстрирует динамику изменения среднего арифметического результатов по каждому поисковику отдельно по двум вышеприведенным таблицам.

Динамика результатов поиска

Диаграмма 2 – Динамика изменений результатов поиска

Наблюдается интересная ситуация – в то время, как у лидеров поиска (Google и Yahoo) средние показатели растут во времени, у большинства остальных (что особенно заметно у Yandex'а и Rambler'а) они падают, что, несомненно, говорит в пользу того, что, как и сказано выше, этими поисковиками была произведена реиндексация. Кстати, из диаграммы также видно, что Google реиндексируется эффективнее и быстрее остальных поисковых систем.

Показатели по языкам

Диаграмма 3 показывает абсолютное распределение среднеарифметических показателей по языкам обоих поисковых экспериментов.

Абсолютные показатели по языкам

Диаграмма 3 – Абсолютные среднеарифметические показатели по языкам

По диаграмме можно сделать два вывода. Первый: подавляющее большинство ресурсов по теме магистерской работы написаны на английском языке. Второй: диаграмма абсолютного языкового распределения очень сильно похожа на диаграмму среднеарифмитических результатов поиска, что говорит о том, что в основном на общие средние показатели влияет распределение англоязычных ресурсов.

Чтобы иметь возможность оценить поисковики по языкам, была составлена диаграмма 4, в которой языковые значения были нормализованы (абсолютное значение по языку было разделено на сумму всех значений всех поисковиков для данного языка). Конечно, в этом случае нельзя проводить межязыковое сравнение поисковых систем, однако можно оценить долю каждого поисковика по данному языку, а также среднее качество поисковика.

Относительные показатели по языкам

Диаграмма 4 – Относительные среднеарифметические показатели по языкам

По диаграмме можно наблюдать достаточно интересные результаты. Оказывается, первое место по поиску среди русскоязычного контента занимает Yandex, второе (с огромным отрывом) – Rambler, а ожидаемый на первом месте Google занял всего лишь четвертое место; наилучшим поисковиком по англоязычным ресурсам был признан как раз Google, а ожидаемый Yahoo занял второе место. За звание лучшего среди украиноязычных поисковиков ведут равную борьбу сразу Google и Yandex, но пока последний сохраняет за собой лидерство; Meta же, несмотря на украиноязычную направленность, показал худшие результаты не только среди всех украино-ищущих поисковиков, но и среди всех поисковиков вообще. Наилучшими поисковиками были признаны: среди всех – Google, среди отечественных – Yandex, а среди зарубежных – Yahoo.

Выводы

Сперва стоит сказать о том, что наибольшее внимание вопросам, поднимаемым в теме магистерской работы, исходя из поисковых показателей, уделяется зарубежными ресурсами. Русскоязычные ресурсы идут по принципу «постольку – поскольку», и это неудивительно хотя бы потому, что вся фундаментальная документация идет на английском, да и вообще, лидером современного развития компьютерной сферы несомененно является Запад. Ситуацию же в украиноязычном сегменте Интернета можно охарактеризовать либо как «все только начинается», либо как «родился мертвым» и здесь мне более сказать нечего.

Относительно поисковых систем: система, выдающая наибольшее количество ресурсов по запросу не обязательно является самой качественной. Например, в критерий качества входят такие вещи, как выдача на первых страницах наиболее значимых ссылок (т.е. таких, которые являются действительной целью поиска), частая реиндексация (чтобы по запросу всегда выдавать как можно более свежие данные) и скорость работы. Данная работа касалась только такого количественного показателя, как объемы поиска, однако не были задействованы никакие качественные показатели. Оценивая «на глаз», можно сказать, что Google является наиболее сбалансированной системой по большинству показателей (однако и он иногда ошибается, и тогда ему на замену приходит Yandex).