Отчет о результатах поиска по теме выпускной работы


Пояснения к отчету и таблицам

Данный раздел представляет собой результаты поиска информации в сети Интернет по теме магистерской диссертации и их анализ. Поиск выполнен с использованием шести поисковых систем (Google, Yandex, Rambler, Yahoo, Meta, Bing) на трех языках – русском, украинском, английском. Результаты сведены в таблицу. Всего произведен 21 запрос, имеющий отношение к магистерской работе. Из них 3 запроса соответствует названию дипломной работы на трех языках. Данные в таблицах представлены в следующем виде:

<поисковая система>:<количество страниц>

Отчет о поиске за 10.04.2010
Поисковый запрос google yandex rambler yahoo meta msn
Исследование влияния подсистем компьютерной торговой системы на ее экономические характеристики 5 520 200 000 26 137 159 1 090
Дослідження впливу підсистем комп'ютерної торгової системи на її економічні характеристики 2 080 15 000 1 17 94 11
Research of influence of subsystems of computer trading system on its economic characteristics 496 000 219 000 0 55 200 12 35 400
Механическая торговая система 111 000 5 000 000 86 000 111 000 10 500 220 000
Механічна торгова система 10 500 24 000 1 359 122 1 500 212
Mechanical trading system 20 500 000 2 000 000 7 000 34 800 000 1 500 9 870 000
Торговые сигналы 392 000 12 000 000 182 000 1 310 000 14 400 660 000
Торгові сигнали 8 100 28 000 30 000 2 540 5 100 1 750
Trading signals 24 500 000 5 000 000 25 000 49 100 000 3 700 8 600 000
Элементы торговой системы 532 000 12 000 000 162 000 849 000 18 300 1 180 000
Елементи торгової системи 49 600 76 000 3 000 2 970 4 600 1 520
Elements of trading system 19 300 000 6 000 000 11 000 22 800 000 3 800 17 100 000
Экономические характеристики компьютерной торговой системы 208 000 2 000 000 7 000 20 800 2 400 38 500
Економічні характеристики комп'ютерної торгової системи 13 300 11 000 230 144 375 126
Economic characteristics of computer trading system 1 490 000 2 000 000 773 3 900 000 285 1 540 000
Критерии оптимизации торговой системы 53 000 840 000 27 000 45 000 2 200 77 800
Критерії оптимізації торгової системи 16 600 10 000 910 163 514 172
Criteria of optimization of trading system 275 000 517 000 2 000 1 280 000 156 823 000
Технические индикаторы рынка 152 000 3 000 000 54 000 354 000 7 200 287 000
Технічні індикатори ринку 22 200 26 000 1 459 1 630 1 400 792
Technical market indicators 2 070 000 2 000 000 6 000 28 700 000 997 7 300 000

Анализ полученных результатов

Для анализа полученных результатов построим графики, сравнивающие количество найденного материала по различным аспектам.

Зависимость количества найденного материала от поисковой системы
Рисунок 1 – Зависимость количества найденного материала от поисковой системы

Англоязычные запросы в поисковых системах
Рисунок 2 – Англоязычные запросы в поисковых системах

Русскоязычные запросы в поисковых системах
Рисунок 3 – Русскоязычные запросы в поисковых системах

Украиноязычные  запросы в поисковых системах
Рисунок 4 – Украиноязычные запросы в поисковых системах

Зависимость количества найденного материала от языка запроса
Рисунок 5 – Зависимость количества найденного материала от языка запроса

Как видно из рисунка 1, по количеству найденных сайтов лидирует поисковик Yahoo(56,41%), второе и третье место занимают системы Bing и Google. Причиной этого является то, что данные поисковики лучше приспособлены к поиску информации на английском языке (рис. 2), а количество полученных ссылок на английский язык, в свою очередь, значительно превышает материалы на русском и украинском языках (рис. 5).

Наименьшие результаты у поисковой системы Meta (0,01%). Соответсвенно у этого поисковика самое низкое количество найденных сайтов на английском языке.

На русском языке наибольшее количество страниц было найдено при помощи поисковика Yandex (78,13%). При чем данный результат превышает результаты всех остальных поисковых систем в несколько раз (рис.3).

В поиске информации на украинском языке лидируют поисковики Google (45,06%) и Yandex(43,81%) с примерно одинаковым количеством найденных сайтов (рис.4).

Значительные результаты по количеству запросов на русском, украинском и английском языках различных поисковых систем обусловлены особенностями морфологии языков и "морфологическими возможностями" поисквых систем [1].

Доля найденных запросов на английском языке составляет 93%, на украинском языке – менее 1%. Причина этого заключается в том, что английский язык является наиболее распространенным языком Интернет и число англоязычных сайтов во много раз превышает количество русско- и украиноязычных. Низкая доля найденных сайтов на русском и украинском языках также свидетельствует о том, что в Росси и, особенно, в Украине биржевая торговля – это довольно новая отрасль, которая только развивается. В связи с этим количество электронных источников по данной тематике значительно уступает объему информации западных стран.

Наибольшее количество результатов по запросу, содержащему название магистерской диссертации, выдали поисковики Yandex на русском и украинском языках и Google на английском. Однако релевантность полученных результатов очень низкая. Наименьшее количество результатов выдал Rambler, релевантность которых практически нулевая.

Отчет о поиске за 11.05.2010
Поисковый запрос google yandex rambler yahoo meta msn
Исследование влияния подсистем компьютерной торговой системы на ее экономические характеристики 13 400 * 198 000 24 164 157 1 230
Дослідження впливу підсистем комп'ютерної торгової системи на її економічні характеристики 2 520 15 000 1 14 95 14
Research of influence of subsystems of computer trading system on its economic characteristics 365 000 225 000 0 54 500 13 37 200
Механическая торговая система 200 000 5 000 000 85 000 131 001 10 400 220 000
Механічна торгова система 15 200 23 000 1 396 92 1 600 175
Mechanical trading system 22 000 000 2 000 000 7 000 31 700 432 1 400 10 200 000
Торговые сигналы 411 000 13 000 000 181 000 1 270 204 14 300 658 000
Торгові сигнали 19 100 30 000 30 000 3 640 5 000 1 790
Trading signals 28 600 000 5 000 000 25 000 51 501 092 3 600 8 900 000
Элементы торговой системы 623 000 12 000 000 161 000 812 008 18 400 1 030 000
Елементи торгової системи 64 300 76 000 3 000 7 640 4 600 1 530
Elements of trading system 20 300 000 6 000 000 11 000 24 600 311 3 600 17 300 000
Экономические характеристики компьютерной торговой системы 139 000 2 000 000 7 000 36 200 2 400 41 600
Економічні характеристики комп'ютерної торгової системи 14 400 11 000 238 144 675 140
Economic characteristics of computer trading system 1 710 000 2 000 000 778 4 000 020 288 1 380 000
Критерии оптимизации торговой системы 67 000 843 000 27 000 53 000 2 200 82 400
Критерії оптимізації торгової системи 18 600 10 000 943 208 511 175
Criteria of optimization of trading system 268 000 526 000 2 000 1 370 009 152 727 000
Технические индикаторы рынка 142 000 3 000 000 54 000 302 033 7 200 287 000
Технічні індикатори ринку 33 700 26 000 1 471 1 530 1 400 872
Technical market indicators 2 210 000 2 000 000 6 000 30 400 751 996 8 320 000

* Стрелки показывают соответственно увеличение и уменьшение полученных результатов по сравнению с предыдущим месяцем. Если в ячейке нет стрелки, то результат либо не изменился, либо изменение невозможно проследить из-за округления числа полученных результатов поисковиком.

Анализ полученных результатов

Как мы видим, результаты поиска по истечению месяца отличаются. Однако отношение результатов поиска по отдельным поисковым системам существенно не изменились, что говорит об отсутствии в данном месяце каких-либо значительных нововведений в алгоритмах обработки информации рассмотренными поисковыми системами. В большинстве случаев произошло увеличение числа результатов.

По некоторым запросам результаты изменились более чем в 2 раза, например, для запросов «Исследование влияния подсистем компьютерной торговой системы на ее экономические характеристики» поисковика Google и «елементи торгової системи» поисковика Yahoo. Наиболее значительные изменения в количестве результатов наблюдается у поисковика Google.

Однако с течением времени изменяется не только количество, но и качество результатов поиска. Причин этому может быть множество.

Возможные причины изменения количества и качества результатов по одному и тому же запросу с течением времени:

  1. Связанные с конкретным поисковым сервисом и методом организации его работы:
    1. Распределённый характер обработки информации поисковым сервисом. Наличие большого количества серверов обработки поисковых запросов обуславливает неоднородность базы данных. Как следствие количество результатов по одному и тому же запросу может ощутимо меняться при выполнении запроса как через длинный, так и через короткий (несколько минут и даже секунд) интервалы времени. В этом случае проявляется особенность взаимодействия с разными серверами [2].
    2. Совершенствование алгоритмов поиска информации и обработки содержимого поисковой базы. Сюда относится совершенствование критериев определения релевантности (т.е. соответствия) страниц-результатов поисковому запросу [1,2].
    3. Регулярный пересчёт «рейтинга» страниц (например, «индекс цитирования» у Google) [3].
    4. Борьба со «спамдексингом» **
  2. Связанные с индексируемыми интернет-ресурсами и особенностями их информационного наполнения:
    1. Создание новых сайтов и закрытие существующих.
    2. Обновление информационного содержимого отдельных Интернет ресурсов. Вследствие чего при повторном запросе информация на сайте может не удовлетворять запросу, или наоборот, появится информация по теме запроса.
    3. Специальное изменение сайта с целью его «продвижения (промоушена)» [4].
      1. Применение специальных мета-тегов. Например, титульная фраза, описание страницы, частота обновления страницы [1]. Однако следует отметить, что слова описания обычно не влияют на ранжирование результатов поиска, и среди русских поисковых систем данный тег использует на практике лишь Yandex [2].
      2. Специальное переоформление отдельных частей страницы, используемых поисковыми роботами при индексировании. Например, изменение позиции слов в титульной фразе, добавление заголовков (<h1>, <h2> и т.д.), выделение фрагментов жирным шрифтом (<b>, <strong>) и др. [2]

** Спамдексинг (от англ. spam и index – спам индекс поисковых систем) – технические приемы вебмастеров, предназначенные для обмана поисковых роботов и «накрутки» положения сайта в результатах поиска [4].

Спаммеры используют самые различные варианты повышения рейтинга страниц: от примитивного «скрытого", невидимого обычному пользователю текста, до создания специальных текстов, где веса слов тщательно рассчитывались в соответствии со значениями, снимаемыми со страниц, занимающих первые позиции в ссылках по необходимым запросам.

В поисках оружия против спамдексинга поисковики дополняют текстовые алгоритмы ранжирования результатов поиска нетекстовыми критериями – а именно, ссылочными [2].

Зачастую сайты, попавшие в число спаммеров, попросту исключаются из индекса, иногда без возможности дальнейшего туда вхождения [1].

Список ссылок:

  1. Александр Москалюк Русские поисковые системы: лингвистические особенности, – 08.12.1999 г. [Электронный ресурс] /Сайт «Все об IT» – ITC.UA, – http://itc.ua/node/223/
  2. Андрей Иванов. Подготовка сайта для индексирования в поисковых системах [Электронный ресурс] /Ашманов и партнеры – продвижение сайтов, конференции, поисковые технологии, – http://www.ashmanov.com/pap/ivsprep.phtml
  3. Праздничный апдейт PR от Google 03.04.2010 как резюме SEO (поисковая оптимизация сайта, поисковое продвижение сайтов, раскрутка сайта) усилий в этом году, – 06.04.2010 г. [Электронный ресурс]/ SEO эксклюзив: поисковая оптимизация сайта, раскрутка сайта, – http://www.seoexcl.ru/?p=101
  4. Краткий глоссарий по поисковой оптимизации [Электронный ресурс]/ Optimization.ru: Поисковая оптимизация и продвижение сайтов в Интернете, – http://www.optimization.ru/glossary.shtml