РЕЗУЛЬТАТЫ ПОИСКА В ИНТЕРНЕТ ПО ТЕМЕ МАГИСТЕРСКОЙ РАБОТЫ:
Поиск ключевых терминов производился в два этапа: в марте 2006 года, а второй - в начале мая 2006 года. Количество этапов отвечает минимуму, который необходим для выявления динамики циркуляции информации в различных поисковых системах. Среди обилия различных поисковых систем были выбраны 5 наиболее эффективных и популярных на территории Украины ситемы поиска: GOOGLE, YAHOO!, YANDEX, RAMBLER и META-UA.
Результаты поиска по этим поисковым системам представлены в виде таблиц, расположенные ниже.
Март, 2006
КЛЮЧЕВЫЕ ТЕРМИНЫ | YAHOO | YANDEX | RAMBLER | META-UA | |
Главная антиклиналь Донбасса | 80 | 7 | 2292/615 | 105/16 | 7/7 |
Ольховатско - Волынцевская антиклиналь | 0 | 0 | 2/2 | 2/1 | 0 |
золотоносность Донбасса | 428 | 6 | 2389/673 | 0 | 11/8 |
золотоносный пирит | 331 | 16 | 766/308 | 183/62 | 4/3 |
амвросиевская свита | 4 | 0 | 7998/452 | 9123/1239 | 3/3 |
геохимическая аномалия | 20930 | 98 | 2358/640 | 3120/743 | 103/57 |
вторичный геохимический ореол | 46 | 4 | 400/89 | 839/122 | 9/6 |
золотосульфидная формация | 2 | 0 | 291/119 | 389/112 | 7/6 |
auriferous pyrites | 9389 | 891 | 35/18 | 32/11 | 0 |
gold ore of Donbass | 503 | 170 | 27/14 | 38/21 | 15/12 |
auriferous sulfide | 20053 | 1508 | 48/17 | 35/14 | 2/2 |
Май, 2006
КЛЮЧЕВЫЕ ТЕРМИНЫ | YAHOO | YANDEX | RAMBLER | META-UA | |
Главная антиклиналь Донбасса | 70 | 10 | 2366/664 | 103/16 | 16/9 |
Ольховатско - Волынцевская антиклиналь | 0 | 0 | 2/2 | 2/1 | 0 |
золотоносность Донбасса | 169 | 6 | 1991/674 | 6/2 | 12/7 |
золотоносный пирит | 251 | 20 | 802/319 | 190/71 | 6/5 |
амвросиевская свита | 4 | 0 | 8181/499 | 9907/1496 | 4/4 |
геохимическая аномалия | 20700 | 116 | 2544/733 | 3506/828 | 113/63 |
вторичный геохимический ореол | 41 | 3 | 915/252 | 926/148 | 23/11 |
золотосульфидная формация | 2 | 0 | 319/135 | 407/125 | 7/6 |
геодинамічні зони | 38 | 20 | 472/131 | 696/142 | 268/58 |
кінематичний аналіз | 95 | 29 | 1156/290 | 2069/315 | 422/142 |
auriferous pyrites | 9360 | 882 | 41/21 | 45/19 | 0 |
gold ore of Donbass | 492 | 194 | 30/17 | 41/24 | 18/15 |
auriferous sulfide | 20100 | 1610 | 45/16 | 49/16 | 2/2 |
Анализ
Из приведеных таблиц видна динамика информации, которая наблюдалась на протяжении трёх месяцев. Ввиду специфичности темы магистерской работы общее количество ссылок невелико с учётом того, что большая часть из них не имела прямого отношения к теме работы. Самое большое количество ссылок было зафиксировано в системах GOOGLE, YANDEX и RAMBLER. При этом, системы YANDEX и RAMBLER выдавали наибольшее количество ссылок, не имеющих не малейшего отношения к теме вопроса. Так же отмечено, что эти системы создают выборку ссылок, выделяя в запрашиваемом слове корни и подбирая всевозможные слова и словосочетания с подобными корнями, что создаёт большое количество лишних ссылок. Это создаёт неудобство при запросе терминов, состоящих из нескольких словосочетаний и делает некорректным процесс сужения поиска. Лучшей системой в отношении точности подбора ссылок по темам отмечен GOOGLE. Эта система обладает фильтрами и механизмом сужения поиска. Подобной точностью подбора ссылок обладает так же система YAHOO. Обращает на себя внимание тот факт, что системы GOOGLE и YAHOO обладают самой большой базой данных на англоязычные ресурсы. Система МЕТА имеет самую маленькую базу данных из всех перечисленных систем, и, по - видимому, направлена прежде всего на поиск украинских ресурсов.
Запросы по отдельным терминам обладали противоположной динамикой (с течением времени по отдельным поисковым системам наблюдался как рост, так и спад в рамках запроса по одному термину). Для примера можно взять термин "Главная антиклиналь Донбасса". Из таблиц хорошо видно, что за интервал в два месяца количество ссылок в поисковой системе GOOGLE и RAMBLER уменьшилось, а в системах YANDEX, YAHOO и МЕТА-увеличилось. Возможно, что взятый для сравнения интервал мал для выявления общей глобальной динамики в системах с аномальным уменьшением информации. В сложно организованных системах, в том числе и информационных, постоянно наблюдаются малоамплитудные колебания, которые накладываются на истинные функции поведения - флуктуации. В рамках такой глобальной и сложно организованной системы, как GOOGLE, это явление известно под термином "пляска GOOGLE". Поэтому, для того, чтобы выявить истинную динамику информационного потока и построить его функциональную зависимость с течением времени, необходим временной интервал, не менее года и более.
Обращает на себя внимание и факт темпов изменения информации по отдельным поисковым ситемам. Считается, что при нормальном темпе развития, изменение количества информации происходит на 10-15% за несколько месяцев. Разница в несколько десятков %, а то и в несколько раз говорит об аномальном поведении поисковой системы. Причинами "аномальных ссылок" могут быть как "инфориационный взрыв" (резкое повышение внимания общественности к отдельной проблеме), так и сбои в поисковой системе. Нередко бывает, что поисковая система выдаёт ложную информацию о количестве найденных ссылок. Такие случаи были отмечены при проведении поиска ссылок (обычно при многократной проверке), но такие результаты не брались в учёт. Тем не менее, при анализе, было обнаружено много аномальных результатов, не попадающих под вышеописанную категорию. Так, например, высокий аномальный спад был выявлен по результатам поиска термина "золотоносность Донбасса", особенно в системе GOOGLE. Из таблиц видно, что спад ссылок для этого термина присущ всем поиковым системам, кроме YAHOO, результаты поиска в котором не изменились и RAMBLER, количество ссылок в котором по сравнению с мартом необычайно сильно выросли. На диаграмме, представленной на рис.1, показана динамика ссылок по термину "золотоносность Донбасса" (динамика выражена в процентной разнице).
Рисунок 1. Диаграмма динамики ссылок на примере термина "золотоносность Донбасса" (динамика выражена в процентной разнице количества ссылок между мартом и маем 2006 г.)
По полученным ссылкам отдельно по каждой поисковой системе был проведён анализ информационной динамики, результаты котрого представлены на диаграмме (рис.2). Анализ был выполнен с применением пакета EXEL и производился в несколько этапов:
1) для каждой системы по каждому термину вычислялась процентная разница количества ссылок в разные месяцы;
2) по всем терминам отдельно для каждой поисковой системы вычислялся средний процентный показатель.
Рисунок 2. Диаграмма динамики ссылок в различных поисковых системах (динамика выражена в процентной разнице количества ссылок между мартом и маем 2006 г.)
На диаграмме хорошо видно, что самыми динамичными системами являются YANDEX и МЕТА. Этот факт может свидетельствовать об ускоренном развитии в последнее время отечественных поисковых систем.
Для наглядности сравнительной динамичности использовавшихся поисковых систем была построеня круговая диаграмма, представленная на рис.3.
Рисунок 2. Сравнительная процентная диаграмма динамики ссылок в различных поисковых системах (сектора показывают вклад каждой системы в общую динамику).