Nicholas Shatokhin
Faculty of computer science and technologies
Department of applied mathematics and information technology
Speciality "Software Engineering"
Master's thesis topic:
Parallel methods for automatic speech recognition by computers with SIMD-Architectures
Supervisor:
Professor, Ph.D., L. Feldman
Consultant:
Assistant I. Bondarenko
На этой странице представлены результаты поиска материалов по теме дипломной работы. Представленный отчет позволяет оценить информационную ситуацию по теме магистерской работы. Он является основным документальным подтверждением глубины и полноты информационного поиска, а также служит для фиксации текущей ситуации в исследуемой области.
Поиск осуществлялся в шести основных поисковых системах: Google, Яндекс, Rambler, Meta, Bing. Поисковая система Yahoo не использовалась, т.к. они перешли на движок Bing и теперь поисковая выдача у обеих систем идентична. Результаты сведены в таблицу. Всего произведено 15 запросов, имеющих отношение к магистерской работе, среди которых 5 на английском языке, 5 на русском и 5 на украинском.
Данные в таблицах представлены в следующем виде: каждый столбец соответствует поисковой системе, каждая строка - запросу, соответственно каждая ячейка – это количество документов, найденных данной системой по данному запросу.
Запрос | Google | Yandex | Rambler | Meta | Bing |
распознавание речи | 2580000 | 2000000 | 3000000 | 99400 | 615500 |
нейронные сети | 541000 | 1000000 | 2000000 | 37600 | 127200 |
распараллеливание вычислений | 131000 | 106000 | 100000 | 1715 | 12130 |
пофонемное распознавание | 198 | 682 | 838 | 973 | 107 |
вычисления на gpu | 398000 | 911000 | 815000 | 34500 | 38600 |
розпізнавання мови | 290000 | 60000 | 61000 | 66500 | 19324 |
нейронні мережі | 97800 | 17000 | 17000 | 8600 | 4810 |
розпаралелювання обчислень | 694 | 1588 | 3000 | 519 | 280 |
пофонемне розпізнавання | 61 | 66 | 79 | 113 | 2 |
обчислення на gpu | 649 | 39000 | 40000 | 29000 | 216 |
speech recognition | 156000000 | 12000000 | 11000000 | 11200 | 93050000 |
neural networks | 48300000 | 4000000 | 3000000 | 63100 | 8599000 |
parallelization of computations | 14400000 | 268000 | 262000 | 578000 | 282100 |
phoneme recognition | 1230000 | 288000 | 266000 | 849 | 491770 |
calculations on gpu | 1740000 | 2000000 | 2000000 | 688000 | 2429700 |
Общий итог | 225709402 | 22691336 | 22564917 | 1620069 | 105670739 |
На рисунке 1 проиллюстрировано общее число найденных документов по теме магистерской работы различными поисковыми системами. Следует отметить, что лидирующие количественные показатели имеет система Google (59,67%), среди отстающих систем - Rambler (5,97%) и Meta (0,43%). Также важно упомянуть, что качество найденных материалов среди систем-лидеров (Google, Bing, Yandex) наивысшее у системы Google и наинизшее у Bing.
Рисунок 1 – Общее количество найденных материалов с помощью поисковых систем 3 марта 2011 г.
Рисунок 2 иллюстрирует абсолютное лидерство англоязычных материалов (95,95%) среди всех найденных документов.
Рисунок 2 – Количество найденных материалов 3 марта 2011 г. на английском, русском и украинском языках
Запрос | Google | Yandex | Rambler | Meta | Bing |
распознавание речи | 2590000 | 2000000 | 3000000 | 161000 | 628000 |
нейронные сети | 543000 | 1000000 | 2000000 | 59500 | 139000 |
распараллеливание вычислений | 132000 | 110000 | 107000 | 2700 | 12300 |
пофонемное распознавание | 198 | 754 | 810 | 1500 | 117 |
вычисления на gpu | 402000 | 973000 | 935000 | 41800 | 73000 |
розпізнавання мови | 290000 | 65000 | 61000 | 144000 | 19500 |
нейронні мережі | 97800 | 19000 | 20000 | 16200 | 8580 |
розпаралелювання обчислень | 693 | 1843 | 3000 | 969 | 320 |
пофонемне розпізнавання | 61 | 62 | 85 | 218 | 3 |
обчислення на gpu | 650 | 41000 | 43000 | 33700 | 234 |
speech recognition | 155000000 | 13000000 | 13000000 | 27900 | 94700000 |
neural networks | 48200000 | 5000000 | 5000000 | 139000 | 8770000 |
parallelization of computations | 14400000 | 268000 | 245000 | 935000 | 294000 |
phoneme recognition | 1230000 | 304000 | 289000 | 1500 | 499000 |
calculations on gpu | 1730000 | 2000000 | 2000000 | 1019000 | 2480000 |
Общий итог | 224616402 | 24782659 | 26703895 | 2583987 | 107624054 |
На рисунке 3 проиллюстрировано общее число найденных документов по теме магистерской работы различными поисковыми системами. Лидирующие количественные показатели имеет система Google (58,14%), среди отстающих систем - Yandex (6,42%) и Meta (0,67%). Качество же найденных материалов среди систем-лидеров (Google, Bing, Rambler) наивысшее у Google и наинизшее у Bing.
Рисунок 3 – Общее количество найденных материалов с помощью поисковых систем 29 апреля 2011 г.
Рисунок 4 иллюстрирует абсолютное лидерство англоязычных материалов (95,92%) среди всех найденных документов, на втором месте – русскоязычные материалы с долей 3,86%, украиноязычных материалов по теме практически не было найдено.
Рисунок 4 – Количество найденных материалов 29 апреля 2011 г. на английском, русском и украинском языках
Значения в следующей таблице представляют собой показатели динамики изменений, определяющейся как отношение количества документов, найденных во время последнего поиска, к количеству документов, найденных во время первого поиска.
Запрос | Google | Yandex | Rambler | Meta | Bing | Общий итог |
распознавание речи | 1,003876 | 1 | 1 | 1,619718 | 1,020309 | 1,128781 |
нейронные сети | 1,003697 | 1 | 1 | 1,582447 | 1,092767 | 1,135782 |
распараллеливание вычислений | 1,007634 | 1,037736 | 1,07 | 1,574344 | 1,014015 | 1,140746 |
пофонемное распознавание | 1 | 1,105572 | 0,966587 | 1,541624 | 1,093458 | 1,141448 |
вычисления на gpu | 1,01005 | 1,068057 | 1,147239 | 1,211594 | 1,891192 | 1,265627 |
розпізнавання мови | 1 | 1,083333 | 1 | 2,165414 | 1,009108 | 1,251571 |
нейронні мережі | 1 | 1,117647 | 1,176471 | 1,883721 | 1,783784 | 1,392324 |
розпаралелювання обчислень | 0,998559 | 1,160579 | 1 | 1,867052 | 1,142857 | 1,23381 |
пофонемне розпізнавання | 1 | 0,939394 | 1,075949 | 1,929204 | 1,5 | 1,288909 |
обчислення на gpu | 1,001541 | 1,051282 | 1,075 | 1,162069 | 1,083333 | 1,074645 |
speech recognition | 0,99359 | 1,083333 | 1,181818 | 2,491071 | 1,017732 | 1,353509 |
neural networks | 0,99793 | 1,25 | 1,666667 | 2,202853 | 1,019886 | 1,427467 |
parallelization of computations | 1 | 1 | 0,935115 | 1,617647 | 1,042184 | 1,118989 |
phoneme recognition | 1 | 1,055556 | 1,086466 | 1,766784 | 1,014702 | 1,184702 |
calculations on gpu | 0,994253 | 1 | 1 | 1,481105 | 1,020702 | 1,099212 |
Общий итог | 0,995157 | 1,092164 | 1,183425 | 1,594986 | 1,018485 | 1,176843 |
На рисунке 5 проиллюстрирована динамика изменения общего числа найденных документов по теме магистерской работы различными поисковыми системами. Лидирующие показатели имеет система Meta (1,59 раз) несмотря на наименьшие количественные показатели среди рассматриваемых систем, среди отстающих систем – Bing (1,018 раз) и Google (0,995 раз), которые имеют наибольшее число найденных документов.
Рисунок 5 – Динамика изменения количества найденных документов, раз
На рисунке 6 показана динамика изменения количества найденных документов в процентном соотношении относительно друг друга.
Рисунок 6 – Динамика изменения количества найденных документов, процентов
Подводя итог, проанализировав динамику изменений по конкретным запросам (например, «neural networks» или «speech recognition»), можно отметить, что тема распараллеливания нейросетевых алгоритмов для распознавания речи имеет достаточную актуальность, учитывая, что соответствующие запросы показывают прирост количества найденных документов почти в 1,5 раза за примерно 2 месяца в англоязычном пространстве. Немаловажно также отметить, что в украиноязычном пространстве данная тема практически не представлена и эта ситуация имеет низкую динамику изменений, что, с учетом предыдущих выводов, также указывает на актуальность данной работы.
Завершая отчет о поиске, следует упомянуть, что большинство поисковых систем сообщают лишь примерное число наденных документов по тому или иному запросу, однако, можно положить (при условии неизменности механизма подсчета количества найденных документов поисковыми системами по даннмоу запросу), что данный факт, влияя на абсолютные показатели, оказывает допустимо несущественное влияние на относительные показатели, такие как динамика изменений, что позволяет сделать заключение о справедливости вышеизложенных выводов.