Б. Шоу
Цель и процедура исследования
Целью данного исследования является поиск, оценка и анализ информации по теме магистерской работы в мультиязычной Web-среде, а также определение эффективности наиболее популярных поисковых систем Интернет в задачах тематического научного обзора.
Ход выполнения исследования:
- Формулирование на основе тематической терминологической базы поисковых запросов и представление их на трех языках: русском, украинском и английском.
- Проведение двух отстоящих во времени процедур поиска по множеству разработанных запросов при помощи следующих поисковых систем: Google (google.com.ua), Yandex (yandex.ua), Rambler (rambler.ru), Yahoo (yahoo.com), Meta (meta.ua), Bing (msn.com), Google Академия (scholar.google.com).
- Анализ полученных данных на однородность, определение наиболее успешных запросов, оценка совокупных языковых результатов.
- Определение абсолютного и относительного отклонения в полученных данных, выявление запросов с существенно изменившимся количеством результатов, поиск аномалий.
Анализ результатов поиска от 22.04.2011
В табл. 1 показаны результаты тематического поиска, проведенного 22 апреля 2011 года. Для каждой из указанных поисковых систем осуществлено 27 запросов: по 7 на английском, русском и украинском языках.
Таблица 1 – Результаты Интернет-поиска (22.04.2011)
Запрос | Количество найденных ресурсов | ||||||
Yandex | Rambler | Yahoo | Meta | Bing | Google Академия |
||
Разработка и исследование подхода к унификации синтеза автоматов Мура в базисе FPGA | 34 | 28000 | 0 | 12 | 0 | 0 | 1 |
Розробка та дослідження підходу до уніфікації синтезу автоматів Мура в базисі FPGA | 7 | 252 | 0 | 0 | 0 | 0 | 0 |
Development and research an approach to the unification of synthesis of Moore FSM on FPGA | 510 | 51000 | 0 | 6160 | 0 | 449 | 28 |
Конечный автомат Мура | 49800 | 196000 | 19000 | 13700 | 4800 | 32200 | 765 |
Кінцевий автомат Мура | 1090 | 2743 | 155 | 17 | 135 | 64 | 20 |
Moore FSM | 837000 | 46000 | 2000 | 106000 | 134 | 102000 | 6430 |
Минимизация состояний конечного автомата | 17800 | 213000 | 15000 | 12600 | 2100 | 31500 | 1580 |
Мінімізація станів кінцевого автомата | 2220 | 2743 | 240 | 5 | 179 | 5 | 61 |
State reduction of FSM | 1480000 | 84000 | 1194 | 73000 | 70 | 69300 | 20300 |
Кодирование состояний конечного автомата | 16600 | 170000 | 21000 | 16800 | 2200 | 46900 | 1350 |
Кодування станів кінцевого автомата | 3670 | 3473 | 244 | 10 | 139 | 11 | 108 |
State assignment of FSM | 1270000 | 67000 | 1196 | 9520 | 65 | 47700 | 10700 |
Реализация автомата Мура на FPGA | 8260 | 800 | 268 | 1750 | 62 | 259 | 82 |
Реалізація автомата Мура на FPGA | 2180 | 78 | 19 | 111 | 18 | 5 | 82 |
Implementation of Moore FSM on FPGA | 121000 | 5078 | 11 | 6540 | 4 | 6350 | 1060 |
Реализация автомата Мура на ПЗУ | 35400 | 1716 | 482 | 271 | 75 | 481 | 62 |
Реалізація автомата Мура на ПЗП | 6710 | 79 | 21 | 6 | 4 | 6 | 62 |
Implementation of Moore FSM on ROM | 121000 | 7966 | 3 | 5220 | 1 | 7880 | 644 |
Оптимизация автомата Мура | 102000 | 35000 | 1953 | 3130 | 1800 | 7560 | 231 |
Оптимізація автомата Мура | 70200 | 1285 | 148 | 47 | 107 | 97 | 224 |
Optimization of Moore FSM | 297000 | 10000 | 51 | 16500 | 13 | 28100 | 2250 |
Описание конечного автомата на Verilog | 1400 | 2090 | 1441 | 2610 | 77 | 736 | 72 |
Опис кінцевого автомата на Verilog | 176 | 525 | 27 | 125 | 11 | 1 | 3 |
Describing of FSM in Verilog | 78500 | 14000 | 68 | 4630 | 7 | 5200 | 4050 |
Синтез с использованием Verilog и FPGA | 42200 | 2240 | 2000 | 1800 | 118 | 828 | 113 |
Синтез з використанням Verilog та FPGA | 155 | 365 | 24 | 53 | 20 | 10 | 11 |
Synthesis using Verilog and FPGA | 391000 | 70000 | 1672 | 127000 | 55 | 147000 | 10200 |
Всего | 4955912 | 1015433 | 68217 | 407617 | 12194 | 534642 | 60489 |
На рис. 1 показаны результаты анализа эффективности поисковых систем. Видно, что наибольшее количество ресурсов было найдено с использованием Google (70,25%), Yandex (14,39%) и Bing (7,58%). Из остальных систем только Yahoo (5,78%) смогла превысить однопроцентный барьер. Крайне низкие результаты поиска показали системы общего назначения Rambler (0,97%) и Meta (0,17%), ориентированные, соответственно, на русскоязычный и украиноязычный контент. Узкоспециализированная Google Академия (0,86%) смогла опередить Meta и вплотную приблизиться к Rambler, несмотря на свою научно-исследовательскую направленность.
Рисунок 1 – Анализ эффективности поисковых систем (22.04.2011)
С точки зрения языковой принадлежности (рис. 2), наиболее информативными оказались запросы, сформулированные на английском языке (81,96%). Эффективность русскоязычных (16,62%) и украиноязычных (1,43%) запросов существенно ниже. Очевидно, таким языковым распределением информации и объясняются крайне низкие результаты Rambler и Meta, а также лидирующие позиции Google, Bing, Yahoo.
Рисунок 2 – Анализ эффективности запросов по языковой принадлежности (22.04.2011)
Табл. 2 показывает минимальное, максимальное и среднее количество результатов, найденных с помощью каждой поисковой системы. Как и ожидалось, наилучшие средние результаты показала система Google (183552 результата), в 4,88 раза опередившая Yandex (37609 результатов). Вновь обращают на себя внимание низкие результаты Rambler (2527 результатов) и Meta (452 результата). Показатель Google Академии (2240 результатов) свидетельствует о широком научном интересе к тематике магистерской работы, значительном количестве специализированных книг, монографий, статей, материалов.
Таблица 2 – Анализ количества ресурсов, найденных с помощью поисковых систем (22.04.2011)
Параметр | Количество найденных ресурсов | ||||||
Yandex | Rambler | Yahoo | Meta | Bing | Google Академия |
||
Минимальное количество | 7 | 78 | 0 | 0 | 0 | 0 | 0 |
Максимальное количество | 1480000 | 213000 | 21000 | 127000 | 4800 | 147000 | 20300 |
Среднее количество | 183552 | 37609 | 2527 | 15097 | 452 | 19802 | 2240 |
Наибольшее количество результатов среди запросов на английском языке дал запрос «State reduction of FSM» (1480000 результатов, Google), на русском языке – «Минимизация состояний конечного автомата» (213000 результатов, Yandex), на украинском языке – «Оптимізація автомата Мура» (70200 результатов, Google).
Анализ результатов поиска от 25.05.2011
В табл. 3 показаны результаты тематического поиска, проведенного 25 мая 2011 года. Как и ранее, для каждой из поисковых систем осуществлено 27 запросов: по 7 на английском, русском и украинском языках.
Таблица 3 – Результаты Интернет-поиска (25.05.2011)
Запрос | Количество найденных ресурсов | ||||||
Yandex | Rambler | Yahoo | Meta | Bing | Google Академия |
||
Разработка и исследование подхода к унификации синтеза автоматов Мура в базисе FPGA | 25 | 12000 | 0 | 12 | 0 | 0 | 1 |
Розробка та дослідження підходу до уніфікації синтезу автоматів Мура в базисі FPGA | 6 | 259 | 0 | 0 | 0 | 0 | 0 |
Development and research an approach to the unification of synthesis of Moore FSM on FPGA | 1100 | 61000 | 0 | 6550 | 0 | 458 | 29 |
Конечный автомат Мура | 56000 | 173000 | 18000 | 15100 | 4900 | 33200 | 793 |
Кінцевий автомат Мура | 1190 | 2836 | 173 | 17 | 128 | 58 | 21 |
Moore FSM | 551000 | 58000 | 1990 | 101000 | 127 | 101000 | 6540 |
Минимизация состояний конечного автомата | 27500 | 220000 | 15000 | 13400 | 2000 | 35500 | 1630 |
Мінімізація станів кінцевого автомата | 2710 | 2550 | 255 | 34 | 175 | 325 | 64 |
State reduction of FSM | 1450000 | 90000 | 1184 | 75900 | 67 | 72300 | 20200 |
Кодирование состояний конечного автомата | 26500 | 172000 | 20000 | 17600 | 2300 | 59400 | 1390 |
Кодування станів кінцевого автомата | 4410 | 3073 | 251 | 115 | 149 | 474 | 121 |
State assignment of FSM | 1220000 | 72000 | 1151 | 10000 | 638 | 60400 | 10800 |
Реализация автомата Мура на FPGA | 6570 | 1121 | 225 | 1790 | 72 | 255 | 84 |
Реалізація автомата Мура на FPGA | 985 | 234 | 17 | 204 | 18 | 5 | 84 |
Implementation of Moore FSM on FPGA | 114000 | 7391 | 14 | 7440 | 4 | 6720 | 1090 |
Реализация автомата Мура на ПЗУ | 17300 | 3308 | 454 | 265 | 73 | 479 | 67 |
Реалізація автомата Мура на ПЗП | 2610 | 90 | 21 | 6 | 6 | 6 | 67 |
Implementation of Moore FSM on ROM | 113000 | 9212 | 3 | 5620 | 0 | 8020 | 647 |
Оптимизация автомата Мура | 82400 | 32000 | 1809 | 3830 | 2900 | 9700 | 236 |
Оптимізація автомата Мура | 57100 | 1396 | 143 | 47 | 108 | 95 | 228 |
Optimization of Moore FSM | 277000 | 11000 | 52 | 17800 | 20 | 28100 | 2300 |
Описание конечного автомата на Verilog | 5200 | 2272 | 1131 | 6590 | 78 | 722 | 72 |
Опис кінцевого автомата на Verilog | 108 | 582 | 22 | 101 | 11 | 1 | 3 |
Describing of FSM in Verilog | 95400 | 13000 | 85 | 5210 | 9 | 5040 | 4120 |
Синтез с использованием Verilog и FPGA | 48300 | 6557 | 1816 | 1840 | 126 | 532 | 112 |
Синтез з використанням Verilog та FPGA | 124 | 1947 | 21 | 57 | 22 | 10 | 12 |
Synthesis using Verilog and FPGA | 467000 | 68000 | 1563 | 217000 | 55 | 172000 | 10400 |
Всего | 4627538 | 1024828 | 65380 | 507528 | 13986 | 594800 | 61111 |
На рис. 3 показаны результаты анализа эффективности поисковых систем. Вновь наибольшее количество результатов было получено с помощью Google (67,11%), Yandex (14,86%) и Bing (8,63%). Как и в предыдущем поиске, из остальных систем только Yahoo (7,36%) смогла превысить показатель в 1%. Обращает на себя внимание, что, по сравнению с поиском от 22.04.11, эффективность Google уменьшилась на 3,14%, Yandex – осталась практически неизменной (+0,47%), Bing – возросла на 1,05%, Yahoo – возросла на 1,58% (лучший результат).
Рисунок 3 – Анализ эффективности поисковых систем (25.05.2011)
В целом, наиболее эффективной поисковой системой оказалась Google, которая опередила Yandex в 4,88 раза (22.04.11) и 4,52 раза (25.05.11). Именно Google, а также Yandex и Bing позволили провести наиболее успешный, всесторонний мультиязычный поиск.
Языковое распределение результатов осталось практически неизменным (рис. 4). Наиболее результативными оказались англоязычные запросы (81,82%). Показатели русскоязычных (16,93%) и украиноязычных (1,25%) запросов существенно ниже.
Рисунок 4 – Анализ эффективности запросов по языковой принадлежности (25.05.2011)
Табл. 4 показывает минимальное, максимальное и среднее количество результатов, найденных с помощью каждой поисковой системы. Неожиданно, средний показатель Google уменьшился на 12162 результата, в то время как Yandex (+348 результатов) сохранил свои позиции, а Bing (+2228 результатов) и Yahoo (+3700 результатов) значительно улучшили свои характеристики. Среднее количество ресурсов, полученных с использованием Google Академии (+23 результата), осталось практически неизменным, что объясняется значительно меньшей динамикой обновления научно-образовательных ресурсов по сравнению с другими Web-источниками.
Таблица 4 – Анализ количества ресурсов, найденных с помощью поисковых систем (25.05.2011)
Параметр | Количество найденных ресурсов | ||||||
Yandex | Rambler | Yahoo | Meta | Bing | Google Академия |
||
Минимальное количество | 6 | 90 | 0 | 0 | 0 | 0 | 0 |
Максимальное количество | 1450000 | 220000 | 20000 | 217000 | 4900 | 172000 | 20200 |
Среднее количество | 171390 | 37957 | 2421 | 18797 | 518 | 22030 | 2263 |
Наиболее популярные языковые запросы полностью совпали между собой: англоязычный запрос «State reduction of FSM» (1450000 результатов, Google), русскоязычный запрос «Минимизация состояний конечного автомата» (220000 результатов, Yandex) и украиноязычный запрос «Оптимізація автомата Мура» (57100 результатов, Google).
Сравнительный анализ результатов поиска
В табл. 5 показаны результаты абсолютного изменения в количестве полученных результатов. Видно, что результаты распределились неравномерно: количество ресурсов по одним запросам практически не изменилось, в то время как для других изменилось на сотни тысяч.
Таблица 5 – Абсолютное изменение количества полученных результатов
Запрос | Количество найденных ресурсов | ||||||
Yandex | Rambler | Yahoo | Meta | Bing | Google Академия |
||
Разработка и исследование подхода к унификации синтеза автоматов Мура в базисе FPGA | –9 | –16000 | 0 | 0 | 0 | 0 | 0 |
Розробка та дослідження підходу до уніфікації синтезу автоматів Мура в базисі FPGA | –1 | 7 | 0 | 0 | 0 | 0 | 0 |
Development and research an approach to the unification of synthesis of Moore FSM on FPGA | 590 | 10000 | 0 | 390 | 0 | 9 | 1 |
Конечный автомат Мура | 6200 | –23000 | –1000 | 1400 | 100 | 1000 | 28 |
Кінцевий автомат Мура | 100 | 93 | 18 | 0 | –7 | –6 | 1 |
Moore FSM | –286000 | 12000 | –10 | –5000 | –7 | –1000 | 110 |
Минимизация состояний конечного автомата | 9700 | 7000 | 0 | 800 | –100 | 4000 | 50 |
Мінімізація станів кінцевого автомата | 490 | –193 | 15 | 29 | –4 | 320 | 3 |
State reduction of FSM | –30000 | 6000 | –10 | 2900 | –3 | 3000 | –100 |
Кодирование состояний конечного автомата | 9900 | 2000 | –1000 | 800 | 100 | 12500 | 40 |
Кодування станів кінцевого автомата | 740 | –400 | 7 | 105 | 10 | 463 | 13 |
State assignment of FSM | –50000 | 5000 | –45 | 480 | 573 | 12700 | 100 |
Реализация автомата Мура на FPGA | –1690 | 321 | –43 | 40 | 10 | –4 | 2 |
Реалізація автомата Мура на FPGA | –1195 | 156 | –2 | 93 | 0 | 0 | 2 |
Implementation of Moore FSM on FPGA | –7000 | 2313 | 3 | 900 | 0 | 370 | 30 |
Реализация автомата Мура на ПЗУ | –18100 | 1592 | –28 | –6 | –2 | –2 | 5 |
Реалізація автомата Мура на ПЗП | –4100 | 11 | 0 | 0 | 2 | 0 | 5 |
Implementation of Moore FSM on ROM | –8000 | 1246 | 0 | 400 | –1 | 140 | 3 |
Оптимизация автомата Мура | –19600 | –3000 | –144 | 700 | 1100 | 2140 | 5 |
Оптимізація автомата Мура | –13100 | 111 | –5 | 0 | 1 | –2 | 4 |
Optimization of Moore FSM | –20000 | 1000 | 1 | 1300 | 7 | 0 | 50 |
Описание конечного автомата на Verilog | 3800 | 182 | –310 | 3980 | 1 | –14 | 0 |
Опис кінцевого автомата на Verilog | –68 | 57 | –5 | –24 | 0 | 0 | 0 |
Describing of FSM in Verilog | 16900 | –1000 | 17 | 580 | 2 | –160 | 70 |
Синтез с использованием Verilog и FPGA | 6100 | 4317 | –184 | 40 | 8 | –296 | –1 |
Синтез з використанням Verilog та FPGA | –31 | 1582 | –3 | 4 | 2 | 0 | 1 |
Synthesis using Verilog and FPGA | 76000 | –2000 | –109 | 90000 | 0 | 25000 | 200 |
Всего | –328374 | 9395 | –2837 | 99911 | 1792 | 60158 | 622 |
На рис. 5 показаны результаты суммарного абсолютного количественного изменения полученных результатов для каждой поисковой системы. Видно, что наибольший показатель изменений принадлежит Google, которая уменьшила суммарное количество найденных результатов на 328374, что является наихудшим результатом среди всех поисковых систем. Максимально увеличила количество найденных ресурсов система Yahoo, чей показатель вырос на 99911. На втором месте по приросту количества результатов находится система Bing, которая увеличила свою характеристику на 60158. Менее всего, ожидаемо, изменились результаты поиска на Google Академии (+622 ресурса).
Рисунок 5 – Суммарное изменение количества полученных результатов
В табл. 6 показаны результаты относительного изменения в количестве найденных ресурсов. В среднем, каждый запрос изменился на 0,84%, а в максимальной степени изменились результаты в запросе «Мінімізація станів кінцевого автомата» при поиске в системе Bing (6400%), что вызвано крайне низким результатов при поиске от 22.04.11 (5 результатов).
Таблица 6 – Относительное изменение количества полученных результатов
Запрос | Количество найденных ресурсов | ||||||
Yandex | Rambler | Yahoo | Meta | Bing | Google Академия |
||
Разработка и исследование подхода к унификации синтеза автоматов Мура в базисе FPGA | –0,26 | –0,57 | 0,00 | 0,00 | 0,00 | 0,00 | 0,00 |
Розробка та дослідження підходу до уніфікації синтезу автоматів Мура в базисі FPGA | –0,14 | 0,03 | 0,00 | 0,00 | 0,00 | 0,00 | 0,00 |
Development and research an approach to the unification of synthesis of Moore FSM on FPGA | 1,16 | 0,20 | 0,00 | 0,06 | 0,00 | 0,02 | 0,04 |
Конечный автомат Мура | 0,12 | –0,12 | –0,05 | 0,10 | 0,02 | 0,03 | 0,04 |
Кінцевий автомат Мура | 0,09 | 0,03 | 0,12 | 0,00 | –0,05 | –0,09 | 0,05 |
Moore FSM | –0,34 | 0,26 | –0,01 | –0,05 | –0,05 | –0,01 | 0,02 |
Минимизация состояний конечного автомата | 0,54 | 0,03 | 0,00 | 0,06 | –0,05 | 0,13 | 0,03 |
Мінімізація станів кінцевого автомата | 0,22 | –0,07 | 0,06 | 5,80 | –0,02 | 64,00 | 0,05 |
State reduction of FSM | –0,02 | 0,07 | –0,01 | 0,04 | –0,04 | 0,04 | 0,00 |
Кодирование состояний конечного автомата | 0,60 | 0,01 | –0,05 | 0,05 | 0,05 | 0,27 | 0,03 |
Кодування станів кінцевого автомата | 0,20 | –0,12 | 0,03 | 10,50 | 0,07 | 42,09 | 0,12 |
State assignment of FSM | –0,04 | 0,07 | –0,04 | 0,05 | 8,82 | 0,27 | 0,01 |
Реализация автомата Мура на FPGA | –0,20 | 0,40 | –0,16 | 0,02 | 0,16 | –0,02 | 0,02 |
Реалізація автомата Мура на FPGA | –0,55 | 2,00 | –0,11 | 0,84 | 0,00 | 0,00 | 0,02 |
Implementation of Moore FSM on FPGA | –0,06 | 0,46 | 0,27 | 0,14 | 0,00 | 0,06 | 0,03 |
Реализация автомата Мура на ПЗУ | –0,51 | 0,93 | –0,06 | –0,02 | –0,03 | 0,00 | 0,08 |
Реалізація автомата Мура на ПЗП | –0,61 | 0,14 | 0,00 | 0,00 | 0,50 | 0,00 | 0,08 |
Implementation of Moore FSM on ROM | –0,07 | 0,16 | 0,00 | 0,08 | –1,00 | 0,02 | 0,00 |
Оптимизация автомата Мура | –0,19 | –0,09 | –0,07 | 0,22 | 0,61 | 0,28 | 0,02 |
Оптимізація автомата Мура | –0,19 | 0,09 | –0,03 | 0,00 | 0,01 | –0,02 | 0,02 |
Optimization of Moore FSM | –0,07 | 0,10 | 0,02 | 0,08 | 0,54 | 0,00 | 0,02 |
Описание конечного автомата на Verilog | 2,71 | 0,09 | –0,22 | 1,52 | 0,01 | –0,02 | 0,00 |
Опис кінцевого автомата на Verilog | –0,39 | 0,11 | –0,19 | –0,19 | 0,00 | 0,00 | 0,00 |
Describing of FSM in Verilog | 0,22 | –0,07 | 0,25 | 0,13 | 0,29 | –0,03 | 0,02 |
Синтез с использованием Verilog и FPGA | 0,14 | 1,93 | –0,09 | 0,02 | 0,07 | –0,36 | –0,01 |
Синтез з використанням Verilog та FPGA | –0,20 | 4,33 | –0,13 | 0,08 | 0,10 | 0,00 | 0,09 |
Synthesis using Verilog and FPGA | 0,19 | –0,03 | –0,07 | 0,71 | 0,00 | 0,17 | 0,02 |
Всего | 2,36 | 10,37 | –0,52 | 20,24 | 10,00 | 106,82 | 0,80 |
Заключение
Проведенный анализ информационной ситуации в тематической области магистерской работы показал явное преимущество поисковой системы Google и англоязычных ресурсов. Подавляющее большинство результатов были получены именно на английском языке, при этом процент украиноязычных материалов крайне низок и составляет до 2%. Другими эффективными средствами поиска информации оказались Yandex, Bing и Yahoo. Система Google Академия проявила себя с позиции нахождения научно-исследовательских книг, монографий и статей, став ценным источником всевозможных публикаций.