ДонНТУ Портал магистров

Отчет об информационном поиске

Представленный отчет позволяет оценить информационную ситуацию по теме магистерской работы. Он является основным документальным подтверждением глубины и полноты информационного поиска, а также служит для фиксации текущей ситуации в исследуемой области.

Поиск выполнен с использованием четырех поисковых систем (Google, Яндекс, Bing, Meta). Результаты сведены в таблицу. Всего произведено 12 запросов, имеющих отношение к магистерской работе. Из них три запроса соответствует названию магистерской работы на трех языках, три запроса с ФИО руководителя, а также девять запросов с ключевыми понятиями по теме магистерской работы.

Ниже приведены две таблицы с отчетами о поиске, которые разделяет временной промежуток в два месяца, а также ряд диаграмм, которые позволяют сравнить основные изменения, произошедшие за этот период.

Отчет о поиске за 05.09.2019 г.

Отчет о поиске за 28.12.2019 г.

Анализ результатов

Анализируя статистику количества выданных результатов по поисковым запросам, можно сделать вывод, что наибольшее количество результатов предоставляется поисковой системой Яндекс. Также достаточное количество результатов предоставляет поисковая система Google и Мета.

Поисковая система Bing дает наименьшее количество результатов при поиске, и если для англоязычного запроса количество выданных результатов ещё можно назвать достаточным, то на русском и украинском языках количество выдаваемых результатов катастрофически маленькое. Возможно, такая ситуация сложилась из-за неэффективных алгоритмов индексирования, применяемых в Bing по отношению к русскоязычным и украиноязычным документам.

При сравнении и анализе результатов в отчетах о поиске, которые разделяют промежуток времени, практически, четыре месяца, были найдены некие закономерности, вроде роста количества найденных результатов на запрос, а также закономерность снижения результатов на запрос от поисковика Яндекс. Процент изменения для каждого запроса в каждой из поисковых систем приведен на диаграмме ниже.

Диаграмма – Процент изменения результатов поисковой выдачи в отчетах о поиске

Рис. 1 – Процент изменения результатов поисковой выдачи в отчетах о поиске на русском языке

Диаграмма – Процент изменения результатов поисковой выдачи в отчетах о поиске

Рис. 2 – Процент изменения результатов поисковой выдачи в отчетах о поиске на украинском языке

Диаграмма – Процент изменения результатов поисковой выдачи в отчетах о поиске

Рис. 3 – Процент изменения результатов поисковой выдачи в отчетах о поиске на английском языке

Стабильнее всего рост количества найденных результатов показывает поисковая система Meta. Исключая аномальные показатели многократного увеличения количества выданных результатов, средний прирост составил около 18 процентов.

Поисковая система Bing показывает стабильные показатели и минимальный прирост (для русскоязычного запроса номер 1 показатель отображает не совсем корректно, так как нельзя показать процентный прирост от нуля к единице).

Что касается Google, в обработке русскоязычных запросов наблюдается многократный прирост результатов. В украиноязычном сегменте наблюдается снижение количества выдаваемых результатов. В англоязычном – стабильный прирост количества по всем запросам (по запросу номер три – двукратный).

Что же касается поисковой системы Yandex, поначалу было воспринято мной, как некая аномалия или ошибка в измерениях. Для наглядности, был построен график УМЕНЬШЕНИЯ количества выдаваемых результатов в зависимости от запроса (особое внимание к логарифмической шкале).

Диаграмма – Процент изменения результатов поисковой выдачи в отчетах о поиске

Рис. 4 – График показывает множитель уменьшения количества выдаваемых результатов при поиске в Yandex

Количество всех результатов, кроме одного запроса, уменьшилось в несколько раз. Выдача результатов по некоторым из запросов уменьшилась в сотни раз. Причиной тому стал новый алгоритм ранжирования документов (Вега), применяющийся при поиске. Он был введен в эксплуатацию 17 декабря 2019 года и одним из обновлений было объединение дубликатов проиндексированных документов. Соответствено, полученные данные по количеству результатов в поисковой системе Yandex являются закономерностью и вызваны устранением дубликатов при индексации.