Отчет об информационном поиске

Поиск выполнен с использованием четырех поисковых систем (Google, Яндекс, Bing, Meta). Результаты сведены в таблицу. Всего произведено 15 запросов, имеющих отношение к магистерской работе. Запросы были произведены на русском, украинском и английском языках. Для каждого из языков один запрос соответствует названию магистерской работы, один — ФИО научного руководителя, а также три запроса с ключевыми понятиями по теме магистерской работы. Ниже преведены две таблицы, в которых содержится информация о количестве ссылок на моменты времени, разделенные промежутком в почти три месяца.



Анализ результатов

Сравнивая результаты запросов по различным поисковым системам, можно прийти к выводу, что наилучшие результаты были показаны системой Google. Поисковые запросы в этой системе дают большое количество результатов, в отличии от Bing и Meta, но при этом их качество на порядок выше результатов поисковой выдачи системы Yandex по аналогичному запросу.

Отдельный интерес представляет анализ поисковой выдачи на разных языках. На рисунке 1 представлено распределение результатов для разных языков. Как видим, абсолютное большинство индексированной информации (около 80% – 91%) находится в англоязычном сегменте. Это свидетельствует о том, что в рамках мирового научного сообщества распознавание устной речи с помощью нейросетевых архитекутр действительно является актуальной задачей. Небольшое количество публикаций на русском (порядка 8% – 17%) и украинском (1% — 3%) языке свидетельствует о том, что в Украине и постсоветском пространстве в целом довольно мало исследований в данном направлении. Также стоит отметить уменьшение доли результатов по англоязычным запросам. Это можно связать с переходом Google на новый алгоритм поиска Hummingbird. Переход произошел полгода назад, но мелкие изменения, которые могли повлиять на индексацию англоязычных источников, все еще продолжаются. Также стоит отметить вклад в количество рускоязычных результатов поисковой выдачи Yandex по запросу "Система распознавания устной речи на основе гибридной модели". Количество результатов по данному запросу за почти три месяца увеличилось на порядок. Причиной этому могут быть открытие новых сайтов и переиндексация страниц.


Рисунок 1 — Распределение результатов поиска на разных языках

При сравнении результатов в отчетах о поиске, которые разделяют почти три месяца, необходимо отметить, что для некоторых поисковых запросов количество найденных страниц выросло, а для некоторых упало. Основной вклад изменение количества результатов поисковой выдачи вносят Google и Yandex. Возможные причины такого поведения поисковых систем описаны выше. В основном же следует отметить незначительное уменьшение информации по теме исследования. Это может быть объяснено закрытием некоторых сайтов и изменение политики индексации поисковых систем. Динамика изменения результатов по каждому запросу изображена на рисунке 2.


Рисунок 2 — Распределение результатов поиска на разных языках

Завершая отчет о поиске, следует упомянуть, что большинство поисковых систем сообщают лишь примерное число наденных документов по тому или иному запросу, однако, можно положить (при условии неизменности механизма подсчета количества найденных документов поисковыми системами по даннмоу запросу), что данный факт, влияя на абсолютные показатели, оказывает допустимо несущественное влияние на относительные показатели, такие как динамика изменений, что позволяет сделать заключение о справедливости вышеизложенных выводов.