Отчет об информационном поиске
Поиск выполнен с использованием четырех поисковых систем (Google, Яндекс, Bing, Meta). Результаты сведены в таблицу. Всего произведено 15 запросов, имеющих отношение к магистерской работе. Запросы были произведены на русском, украинском и английском языках. Для каждого из языков один запрос соответствует названию магистерской работы, один — ФИО научного руководителя, а также три запроса с ключевыми понятиями по теме магистерской работы. Ниже преведены две таблицы, в которых содержится информация о количестве ссылок на моменты времени, разделенные промежутком в почти три месяца.
Строка поиска | ||||
На русском языке | ||||
Система распознавания устной речи на основе гибридной модели | 38 тыс | 1,85 млн | 30,7 тыс | 110 |
Губенко Наталия Евгеньевна ДонНТУ | 341 | 37 тыс | 2 | 110 |
Распознавание устной речи | 319 тыс | 520 тыс | 599 | 3,2 тыс |
Байесовские сети доверия | 3,65 тыс | 96 тыс | 846 | 142 |
Гибридная нейронная модель | 123 тыс | 96 тыс | 3 | 102 тыс |
На украинском языке | ||||
Система розпізнавання усної мови на основі гібридної моделі | 3,54 тыс | 66 тыс | 1,97 тыс | 6 |
Губенко Наталія Євгенівна ДонНТУ | 102 | 5 тыс | 6 | 0 |
Розпізнавання усної мови | 25,1 тыс | 66 тыс | 54 | 194 |
Байєсівські мережі довіри | 455 тыс | 33 тыс | 14 | 2 |
Гібридна нейронна модель | 6,3 тыс | 32 тыс | 1,05 тыс | 9 |
На английском языке | ||||
Spoken language recognition system based on hybrid model | 950 тыс | 1 млн | 497 тыс | 10 тыс |
Gubenko Natalia DonNTU | 43 | 5 тыс | 2 | 2 |
Spoken language recognition system | 3,17 млн | 4 млн | 10 | 78,4 тыс |
Bayesian belief networks | 1,19 млн | 360 тыс | 35,3 тыс | 8 |
Hybrid neural model | 4,9 млн | 754 тыс | 2,03 тыс | 69 тыс |
Строка поиска | ||||
На русском языке | ||||
Система распознавания устной речи на основе гибридной модели | 24,3 тыс | 2 млн | 30,5 тыс | 113 |
Губенко Наталия Евгеньевна ДонНТУ | 510 | 49 тыс | 2 | 0 |
Распознавание устной речи | 316 тыс | 528 тыс | 538 | 3,3 тыс |
Байесовские сети доверия | 3,35 тыс | 94 тыс | 659 | 134 |
Гибридная нейронная модель | 140 тыс | 156 тыс | 2 | 166 тыс |
На украинском языке | ||||
Система розпізнавання усної мови на основі гібридної моделі | 766 | 75 тыс | 1,3 тыс | 7 |
Губенко Наталія Євгенівна ДонНТУ | 94 | 7 тыс | 5 | 0 |
Розпізнавання усної мови | 23,4 тыс | 85 тыс | 15 | 403 |
Байєсівські мережі довіри | 501 тыс | 34 тыс | 10 | 3 |
Гібридна нейронна модель | 6,2 тыс | 33 тыс | 1.75 тыс | 9 |
На английском языке | ||||
Spoken language recognition system based on hybrid model | 227 тыс | 1 млн | 1,01 млн | 9,3 тыс |
Gubenko Natalia DonNTU | 57 | 5 тыс | 2 | 4 |
Spoken language recognition system | 2,88 млн | 4 млн | 5 | 77,5 тыс |
Bayesian belief networks | 814 тыс | 395 тыс | 32,4 тыс | 16,9 тыс |
Hybrid neural model | 5,09 млн | 839 тыс | 2,1 тыс | 67,8 тыс |
Анализ результатов
Сравнивая результаты запросов по различным поисковым системам, можно прийти к выводу, что наилучшие результаты были показаны системой Google. Поисковые запросы в этой системе дают большое количество результатов, в отличии от Bing и Meta, но при этом их качество на порядок выше результатов поисковой выдачи системы Yandex по аналогичному запросу.
Отдельный интерес представляет анализ поисковой выдачи на разных языках. На рисунке 1 представлено распределение результатов для разных языков. Как видим, абсолютное большинство индексированной информации (около 80% – 91%) находится в англоязычном сегменте. Это свидетельствует о том, что в рамках мирового научного сообщества распознавание устной речи с помощью нейросетевых архитекутр действительно является актуальной задачей. Небольшое количество публикаций на русском (порядка 8% – 17%) и украинском (1% — 3%) языке свидетельствует о том, что в Украине и постсоветском пространстве в целом довольно мало исследований в данном направлении. Также стоит отметить уменьшение доли результатов по англоязычным запросам. Это можно связать с переходом Google на новый алгоритм поиска Hummingbird. Переход произошел полгода назад, но мелкие изменения, которые могли повлиять на индексацию англоязычных источников, все еще продолжаются. Также стоит отметить вклад в количество рускоязычных результатов поисковой выдачи Yandex по запросу "Система распознавания устной речи на основе гибридной модели". Количество результатов по данному запросу за почти три месяца увеличилось на порядок. Причиной этому могут быть открытие новых сайтов и переиндексация страниц.
При сравнении результатов в отчетах о поиске, которые разделяют почти три месяца, необходимо отметить, что для некоторых поисковых запросов количество найденных страниц выросло, а для некоторых упало. Основной вклад изменение количества результатов поисковой выдачи вносят Google и Yandex. Возможные причины такого поведения поисковых систем описаны выше. В основном же следует отметить незначительное уменьшение информации по теме исследования. Это может быть объяснено закрытием некоторых сайтов и изменение политики индексации поисковых систем. Динамика изменения результатов по каждому запросу изображена на рисунке 2.
Завершая отчет о поиске, следует упомянуть, что большинство поисковых систем сообщают лишь примерное число наденных документов по тому или иному запросу, однако, можно положить (при условии неизменности механизма подсчета количества найденных документов поисковыми системами по даннмоу запросу), что данный факт, влияя на абсолютные показатели, оказывает допустимо несущественное влияние на относительные показатели, такие как динамика изменений, что позволяет сделать заключение о справедливости вышеизложенных выводов.