ДонНТУ > Портал магистров ДонНТУ
Ru Ua En
Магистр ДонНТУ Шатохин Николай Андреевич

Шатохин Николай Андреевич

Факультет компьютерных наук и технологий
Кафедра прикладнной математики и информатики
Специальность: програмное обеспечение автоматизированных систем

Тема магистерской работы:
Параллельные методы автоматического распознавания усной речи на вычислительных SIMD-архитектурах

Научный руководитель:
профессор, д.т.н. Фельдман Л.П.

Консультант:
ассистент Бондаренко И.Ю.

Отчет о поиске

На этой странице представлены результаты поиска материалов по теме дипломной работы. Представленный отчет позволяет оценить информационную ситуацию по теме магистерской работы. Он является основным документальным подтверждением глубины и полноты информационного поиска, а также служит для фиксации текущей ситуации в исследуемой области.

Поиск осуществлялся в шести основных поисковых системах: Google, Яндекс, Rambler, Meta, Bing. Поисковая система Yahoo не использовалась, т.к. они перешли на движок Bing и теперь поисковая выдача у обеих систем идентична. Результаты сведены в таблицу. Всего произведено 15 запросов, имеющих отношение к магистерской работе, среди которых 5 на английском языке, 5 на русском и 5 на украинском.

Данные в таблицах представлены в следующем виде: каждый столбец соответствует поисковой системе, каждая строка - запросу, соответственно каждая ячейка – это количество документов, найденных данной системой по данному запросу.

Результаты поиска от 3 марта 2011 г.

Запрос Google Yandex Rambler Meta Bing
распознавание речи 2580000 2000000 3000000 99400 615500
нейронные сети 541000 1000000 2000000 37600 127200
распараллеливание вычислений 131000 106000 100000 1715 12130
пофонемное распознавание 198 682 838 973 107
вычисления на gpu 398000 911000 815000 34500 38600
розпізнавання мови 290000 60000 61000 66500 19324
нейронні мережі 97800 17000 17000 8600 4810
розпаралелювання обчислень 694 1588 3000 519 280
пофонемне розпізнавання 61 66 79 113 2
обчислення на gpu 649 39000 40000 29000 216
speech recognition 156000000 12000000 11000000 11200 93050000
neural networks 48300000 4000000 3000000 63100 8599000
parallelization of computations 14400000 268000 262000 578000 282100
phoneme recognition 1230000 288000 266000 849 491770
calculations on gpu 1740000 2000000 2000000 688000 2429700
Общий итог 225709402 22691336 22564917 1620069 105670739

На рисунке 1 проиллюстрировано общее число найденных документов по теме магистерской работы различными поисковыми системами. Следует отметить, что лидирующие количественные показатели имеет система Google (59,67%), среди отстающих систем - Rambler (5,97%) и Meta (0,43%). Также важно упомянуть, что качество найденных материалов среди систем-лидеров (Google, Bing, Yandex) наивысшее у системы Google и наинизшее у Bing.

Общее количество найденных материалов с помощью поисковых систем 3 марта 2011 г.

Рисунок 1 – Общее количество найденных материалов с помощью поисковых систем 3 марта 2011 г.

Рисунок 2 иллюстрирует абсолютное лидерство англоязычных материалов (95,95%) среди всех найденных документов.

Количество найденных материалов 3 марта 2011 г. на английском, русском и украинском языках

Рисунок 2 – Количество найденных материалов 3 марта 2011 г. на английском, русском и украинском языках

Результаты поиска от 29 апреля 2011 г.

Запрос Google Yandex Rambler Meta Bing
распознавание речи 2590000 2000000 3000000 161000 628000
нейронные сети 543000 1000000 2000000 59500 139000
распараллеливание вычислений 132000 110000 107000 2700 12300
пофонемное распознавание 198 754 810 1500 117
вычисления на gpu 402000 973000 935000 41800 73000
розпізнавання мови 290000 65000 61000 144000 19500
нейронні мережі 97800 19000 20000 16200 8580
розпаралелювання обчислень 693 1843 3000 969 320
пофонемне розпізнавання 61 62 85 218 3
обчислення на gpu 650 41000 43000 33700 234
speech recognition 155000000 13000000 13000000 27900 94700000
neural networks 48200000 5000000 5000000 139000 8770000
parallelization of computations 14400000 268000 245000 935000 294000
phoneme recognition 1230000 304000 289000 1500 499000
calculations on gpu 1730000 2000000 2000000 1019000 2480000
Общий итог 224616402 24782659 26703895 2583987 107624054

На рисунке 3 проиллюстрировано общее число найденных документов по теме магистерской работы различными поисковыми системами. Лидирующие количественные показатели имеет система Google (58,14%), среди отстающих систем - Yandex (6,42%) и Meta (0,67%). Качество же найденных материалов среди систем-лидеров (Google, Bing, Rambler) наивысшее у Google и наинизшее у Bing.

Общее количество найденных материалов с помощью поисковых систем 29 апреля 2011 г.

Рисунок 3 – Общее количество найденных материалов с помощью поисковых систем 29 апреля 2011 г.

Рисунок 4 иллюстрирует абсолютное лидерство англоязычных материалов (95,92%) среди всех найденных документов, на втором месте – русскоязычные материалы с долей 3,86%, украиноязычных материалов по теме практически не было найдено.

Количество найденных материалов 29 апреля 2011 г. на английском, русском и украинском языках

Рисунок 4 – Количество найденных материалов 29 апреля 2011 г. на английском, русском и украинском языках

Анализ результатов

Значения в следующей таблице представляют собой показатели динамики изменений, определяющейся как отношение количества документов, найденных во время последнего поиска, к количеству документов, найденных во время первого поиска.

Запрос Google Yandex Rambler Meta Bing Общий итог
распознавание речи 1,003876 1 1 1,619718 1,020309 1,128781
нейронные сети 1,003697 1 1 1,582447 1,092767 1,135782
распараллеливание вычислений 1,007634 1,037736 1,07 1,574344 1,014015 1,140746
пофонемное распознавание 1 1,105572 0,966587 1,541624 1,093458 1,141448
вычисления на gpu 1,01005 1,068057 1,147239 1,211594 1,891192 1,265627
розпізнавання мови 1 1,083333 1 2,165414 1,009108 1,251571
нейронні мережі 1 1,117647 1,176471 1,883721 1,783784 1,392324
розпаралелювання обчислень 0,998559 1,160579 1 1,867052 1,142857 1,23381
пофонемне розпізнавання 1 0,939394 1,075949 1,929204 1,5 1,288909
обчислення на gpu 1,001541 1,051282 1,075 1,162069 1,083333 1,074645
speech recognition 0,99359 1,083333 1,181818 2,491071 1,017732 1,353509
neural networks 0,99793 1,25 1,666667 2,202853 1,019886 1,427467
parallelization of computations 1 1 0,935115 1,617647 1,042184 1,118989
phoneme recognition 1 1,055556 1,086466 1,766784 1,014702 1,184702
calculations on gpu 0,994253 1 1 1,481105 1,020702 1,099212
Общий итог 0,995157 1,092164 1,183425 1,594986 1,018485 1,176843

На рисунке 5 проиллюстрирована динамика изменения общего числа найденных документов по теме магистерской работы различными поисковыми системами. Лидирующие показатели имеет система Meta (1,59 раз) несмотря на наименьшие количественные показатели среди рассматриваемых систем, среди отстающих систем – Bing (1,018 раз) и Google (0,995 раз), которые имеют наибольшее число найденных документов.

Динамика изменения количества найденных документов, раз

Рисунок 5 – Динамика изменения количества найденных документов, раз

На рисунке 6 показана динамика изменения количества найденных документов в процентном соотношении относительно друг друга.

Динамика изменения количества найденных документов, процентов

Рисунок 6 – Динамика изменения количества найденных документов, процентов

Подводя итог, проанализировав динамику изменений по конкретным запросам (например, «neural networks» или «speech recognition»), можно отметить, что тема распараллеливания нейросетевых алгоритмов для распознавания речи имеет достаточную актуальность, учитывая, что соответствующие запросы показывают прирост количества найденных документов почти в 1,5 раза за примерно 2 месяца в англоязычном пространстве. Немаловажно также отметить, что в украиноязычном пространстве данная тема практически не представлена и эта ситуация имеет низкую динамику изменений, что, с учетом предыдущих выводов, также указывает на актуальность данной работы.

Завершая отчет о поиске, следует упомянуть, что большинство поисковых систем сообщают лишь примерное число наденных документов по тому или иному запросу, однако, можно положить (при условии неизменности механизма подсчета количества найденных документов поисковыми системами по даннмоу запросу), что данный факт, влияя на абсолютные показатели, оказывает допустимо несущественное влияние на относительные показатели, такие как динамика изменений, что позволяет сделать заключение о справедливости вышеизложенных выводов.