Отчет об информационном поиске
Представленный отчет позволяет оценить информационную ситуацию по теме магистерской работы. Он является основным документальным подтверждением глубины и полноты информационного поиска, а также служит для фиксации текущей ситуации в исследуемой области.
Поиск выполнен с использованием четырех поисковых систем (Google, Яндекс, Bing, Meta). Результаты сведены в таблицу. Всего произведено 15 запросов, имеющих отношение к магистерской работе. Из них три запроса соответствует названию магистерской работы на трех языках, три запроса с ФИО руководителя, а также девять запросов с ключевыми понятиями по теме магистерской работы.
Ниже приведены две таблицы с отчетами о поиске, которые разделяет временной промежуток в два месяца, а также ряд диаграмм, которые позволяют сравнить основные изменения, произошедшие за этот период.
Отчет о поиске за 07.03.2015 г.
Строка поиска | ||||
На русском языке | ||||
Интеллектуализация ввода-вывода кода программы на основе речевых технологий | 12 600 | ≈1 млн | 2 860 | 69 |
Федяев Олег Иванович, ДонНТУ | 442 | ≈61 тыс. | 12 | 14 |
Распознавание речи | 239 000 | ≈2 млн | 66 400 | 84 800 |
Среда CMU Sphinx | 892 | ≈62 тыс. | 217 | 81 |
Речевые технологии | 595 000 | ≈1 млн | 54 700 | 86 100 |
На украинском языке | ||||
Інтелектуалізація введення-виведення коду програми на основі мовних технологій | 8 870 | ≈108 тыс. | 364 | 62 |
Федяєв Олег Іванович, ДонНТУ | 120 | ≈11 тыс. | 10 | 21 |
Розпізнавання мови | 130 000 | ≈239 тыс. | 31 600 | 26 100 |
Інструментарій CMU Sphinx | 131 | 488 | 0 | 59 |
Мовні технології | 493 000 | ≈1 млн | 31 200 | 67 800 |
На английском языке | ||||
The use of speech technologies for intellectualization of the input-output of the program code | 2 130 | ≈26 тыс. | 29 | 157 |
Oleg Fedyaev, DonNTU | 54 | ≈1 тыс. | 6 | 26 |
Speech recognition | 55 300 000 | ≈2 млн | 32 200 000 | 25 200 000 |
CMU Sphinx toolkit | 29 600 | ≈144 тыс. | 11 700 | 3 500 |
Speech technologies | 25 500 000 | ≈8 млн | 6 450 000 | 14 500 000 |
Отчет о поиске за 10.05.2015 г.
Строка поиска | ||||
На русском языке | ||||
Интеллектуализация ввода-вывода кода программы на основе речевых технологий | 10 800 | ≈1 млн | 2 600 | 81 |
Федяев Олег Иванович, ДонНТУ | 423 | ≈62 тыс. | 15 | 12 |
Распознавание речи | 307 000 | ≈2 млн | 50 900 | 91 900 |
Среда CMU Sphinx | 4 260 | ≈60 тыс. | 37 | 59 |
Речевые технологии | 618 000 | ≈2 млн | 32 700 | 208 000 |
На украинском языке | ||||
Інтелектуалізація введення-виведення коду програми на основі мовних технологій | 8 990 | ≈110 тыс. | 320 | 69 |
Федяєв Олег Іванович, ДонНТУ | 118 | ≈12 тыс. | 10 | 17 |
Розпізнавання мови | 131 000 | ≈247 тыс. | 12 900 | 26 800 |
Інструментарій CMU Sphinx | 9 | 472 | 0 | 57 |
Мовні технології | 431 000 | ≈2 млн | 13 000 | 114 000 |
На английском языке | ||||
The use of speech technologies for intellectualization of the input-output of the program code | 1 880 | ≈26 тыс. | 16 | 153 |
Oleg Fedyaev, DonNTU | 57 | ≈1 тыс. | 7 | 23 |
Speech recognition | 57 700 000 | ≈2 млн | 17 600 000 | 25 100 000 |
CMU Sphinx toolkit | 25 000 | ≈138 тыс. | 13 000 | 3 460 |
Speech technologies | 27 200 000 | ≈8 млн | 5 780 000 | 12 100 000 |
Анализ результатов
Следующие диаграммы демонстрируют динамику изменений в результатах поиска.
Наилучшие результаты в поиске показала система Google. Во всех случаях было найдено достаточное количество документов на всех языках. Кроме запроса Інструментарій CMU Sphinx
в системе Bing. По этому запросу система нашла 0 результатов из чего мы можем сделать вывод, что данная поисковая система больше ориентирована на поиск по англоязычным ресурсам.
Соотношение количества найденных результатов с помощью различных поисковых систем представлено на рисунке 1. Из этого рисунка видно, что по всем трем языкам, которые использовались в поиске, явным лидером является Google. В период с 07.03.2015 по 10.05.2015 доля поисковых результатов увеличилась на 6%. Поисковая система Meta показала свою относительную стабильность, её доля осталась 23%.
Необходимо отметить, что поисковая система Яндекс при большом числе найденных страниц не дает возможности зафиксировать их точное количество. Поэтому в таблице для Яндекса и приведены приблизительные значения, которые предоставляет поисковая система. Поисковая доля Yandex за указанный период увеличилась на 2%. Доля Bing уменьшилась на 8%.
Следует отметить, что для всех ключевых запросов, которые вводились неоднократно в период с 07.03.2015 по 10.05.2015, количество найденных страниц выросло.
Важно помнить, что для поиска научных материалов и исследований помимо классических поисковых систем стоит использовать такие специализированные ресурсы, как Google Scholar, eLibrary, Scopus и т.п.
В разных языковых зонах тема освещена неравномерно. Наибольшее количество источников являются англоязычными. Их доля составляет 94 — 96%. Доля русских источников составляет всего 3 — 4%. Украинская доля практически отсутствует и составляет 1 — 2%.
Из всего выше сказанного можно сделать вывод, что тема распознавания речи гораздо более обсуждаема в англоязычном сегменте интернета. Малые доли русских и украинских источников свидетельствуют о том, что в русском и украинском сегменте крайне мало исследований в данном направлении.
Соотношение количества найденных результатов на разных языках представлено на рисунке 2.
Стоит отметить, что при сравнении результатов в отчетах о поиске, которые разделяеют два месяца, количество найденных страниц для некоторых запросов возросло, а для некоторых понизилось. Это связано с тем, что за этот период было сделано много запросов связанных с темой диплома и это повлияло на поисковую выдачу. Основная информация для реферата, библиотеки и перечня ссылок была найдена в поисковой системе Google. Это подтверждает равномерное освещение вопросов, связанных с темой работы, в различных языковых пространствах.
На рисунке 3 можно наблюдать, что запрос Среда CMU Sphinx
сделанный в различных поисковых системах на трех языка, чаще всего встречается в англоязычной части интернета. Доля англоязычной выдачи по всем четырем поисковикам самая большая и составляет 74%. Доля результатов для запроса на русском языке — 25%. Доля же на украинском для всех поисковиков просто мизерна и составляет 1%.
Диаграмма на рисунке 3 подтвердила, что распознаванием речи с использованием среды CMU Sphinx больше всего занимаются в англоязычной части интернета.