ДонНТУ   Портал магистров

Отчет об информационном поиске

Представленный отчет позволяет оценить информационную ситуацию по теме магистерской работы. Он является основным документальным подтверждением глубины и полноты информационного поиска, а также служит для фиксации текущей ситуации в исследуемой области.

Поиск выполнен с использованием четырех поисковых систем (Google, Яндекс, Bing, Meta). Результаты сведены в таблицу. Всего произведено 15 запросов, имеющих отношение к магистерской работе. Из них три запроса соответствует названию магистерской работы на трех языках, три запроса с ФИО руководителя, а также девять запросов с ключевыми понятиями по теме магистерской работы.

Ниже приведены две таблицы с отчетами о поиске, которые разделяет временной промежуток в два месяца, а также ряд диаграмм, которые позволяют сравнить основные изменения, произошедшие за этот период.

Отчет о поиске за 07.03.2015 г.

Отчет о поиске за 10.05.2015 г.

Анализ результатов

Следующие диаграммы демонстрируют динамику изменений в результатах поиска.

Наилучшие результаты в поиске показала система Google. Во всех случаях было найдено достаточное количество документов на всех языках. Кроме запроса Інструментарій CMU Sphinx в системе Bing. По этому запросу система нашла 0 результатов из чего мы можем сделать вывод, что данная поисковая система больше ориентирована на поиск по англоязычным ресурсам.

Соотношение количества найденных результатов с помощью различных поисковых систем представлено на рисунке 1. Из этого рисунка видно, что по всем трем языкам, которые использовались в поиске, явным лидером является Google. В период с 07.03.2015 по 10.05.2015 доля поисковых результатов увеличилась на 6%. Поисковая система Meta показала свою относительную стабильность, её доля осталась 23%.

Необходимо отметить, что поисковая система Яндекс при большом числе найденных страниц не дает возможности зафиксировать их точное количество. Поэтому в таблице для Яндекса и приведены приблизительные значения, которые предоставляет поисковая система. Поисковая доля Yandex за указанный период увеличилась на 2%. Доля Bing уменьшилась на 8%.

Следует отметить, что для всех ключевых запросов, которые вводились неоднократно в период с 07.03.2015 по 10.05.2015, количество найденных страниц выросло.

Диаграмма - Найденные материалы в разных поисковых системах на 07.03.2015 и 10.05.2015

Рисунок 1 — Процентное отношение результатов для разных поисковых систем

Важно помнить, что для поиска научных материалов и исследований помимо классических поисковых систем стоит использовать такие специализированные ресурсы, как Google Scholar, eLibrary, Scopus и т.п.

В разных языковых зонах тема освещена неравномерно. Наибольшее количество источников являются англоязычными. Их доля составляет 94 — 96%. Доля русских источников составляет всего 3 — 4%. Украинская доля практически отсутствует и составляет 1 — 2%.

Из всего выше сказанного можно сделать вывод, что тема распознавания речи гораздо более обсуждаема в англоязычном сегменте интернета. Малые доли русских и украинских источников свидетельствуют о том, что в русском и украинском сегменте крайне мало исследований в данном направлении.

Соотношение количества найденных результатов на разных языках представлено на рисунке 2.

Диаграмма - Найденные материалы на разных языках на 07.03.2015 и 10.05.2015

Рисунок 2 — Процентное отношение результатов для разных языков

Стоит отметить, что при сравнении результатов в отчетах о поиске, которые разделяеют два месяца, количество найденных страниц для некоторых запросов возросло, а для некоторых понизилось. Это связано с тем, что за этот период было сделано много запросов связанных с темой диплома и это повлияло на поисковую выдачу. Основная информация для реферата, библиотеки и перечня ссылок была найдена в поисковой системе Google. Это подтверждает равномерное освещение вопросов, связанных с темой работы, в различных языковых пространствах.

На рисунке 3 можно наблюдать, что запрос Среда CMU Sphinx сделанный в различных поисковых системах на трех языка, чаще всего встречается в англоязычной части интернета. Доля англоязычной выдачи по всем четырем поисковикам самая большая и составляет 74%. Доля результатов для запроса на русском языке — 25%. Доля же на украинском для всех поисковиков просто мизерна и составляет 1%.

Диаграмма - Суммарное количество результатов для одного запроса на всех языках в различных поисковых системах

Рисунок 3 — Процентное отношение результатов поиска для одного запроса на 3-х языках в 4-х поисковых системах

Диаграмма на рисунке 3 подтвердила, что распознаванием речи с использованием среды CMU Sphinx больше всего занимаются в англоязычной части интернета.