|
Фёдоров Антон
Васильевич
Факультет: Компьютерных наук и технологий
Специальность: Программное обеспечение автоматизированных систем
Тема выпускной работы:
«Исследование методов контурной
сегментации для построения системы оптического распознавания символов»
Руководитель: к.т.н., доцент кафедры ПМиИ Федяев
О.И.
|
Отчет о поиске
|
Биография
Реферат
Библиотека
Ссылки
Отчет о поиске
Индивидуальный раздел
|
Отчет о поиске ресурсов Интернет проводится с целью фиксации информационной ситуации по теме: «Исследование методов контурной сегментации для построения системы оптического распознавания символов», выявления поисковых систем, генерирующих на сегодняшний день наиболее релевантные результаты, а также анализа динамики развития информационной базы по исследуемому направлению. Результаты поиска приведены в таблицах. Результаты поиска следует воспринимать как [количество страниц], которые выдает поисковая система на определенный запрос.
После того как был произведен поиск по ключевым фразам, был сформирован отчет, в нем представлены результаты поиска электронных материалов по теме магистерской работы в сети Интернет. Во время поиска использовались следующие поисковые
системы: Google, Yandex, Rambler, Yahoo, Meta. Из них Google –
международная поисковая система, Yahoo – американская, Yandex и
Rambler – русские, Meta – украинская поисковая системы. Поиск осуществлялся по
ключевым фразам на 3-х языках – русском, украинском и английском. С целью проведения
анализа развития динамики изменения количества ресурсов по теме магистерской работы
поиск выполнялся два раза: 28.03.10 и 03.05.10.
В табл. 1 представлены результаты поиска на 28.03.10 (верхняя ячейка) и на
03.05.10. (нижняя ячейка).
Отчет о поиске за 28.03.2010/03.05.2010:
Ключевые фразы |
Поисковые системы |
Google |
Yandex |
Rambler |
Meta Ukraine |
Yahoo |
Запросы на русском языке |
Исследование методов контурной сегментации для построения системы оптического распознавания символов
|
235 |
4 814 |
0 |
0 |
0 |
336 |
4 636 |
0 |
14 |
0 |
Системы оптического распознавания
|
495 000 |
1 000 000 |
861 000 |
127 000 |
483 |
668 000 |
1 000 000 |
861 000 |
201 000 |
278 000 |
Методы контурной сегментации
|
1 440 |
26 000 |
747 |
371 |
87 |
1 930 |
28 000 |
738 |
126 |
94 |
Нейронные сети
|
6 330 000 |
537 000 |
674 000 |
49 400 |
458 000 |
5 700 000 |
509 000 |
744 000 |
30 600 |
442 000 |
Фёдоров Антон Васильевич
|
92 700 |
190 000 |
183 000 |
9 500 |
29 200 |
222 000 |
224 000 |
182 000 |
15 500 |
35 800 |
Федяев Олег Иванович
|
3 870 |
8 670 |
4 000 |
28 200 |
2 260 |
14 400 |
14 000 |
5 000 |
163 |
1 780 |
Запросы на украинском языке |
Дослідження методів контурної сегментації будування системи оптичного розпізнавання символів
|
7 |
48 |
0 |
0 |
0 |
11 |
44 |
0 |
0 |
0 |
Системи оптичного розпізнавання
|
16 700 |
7 033 |
942 |
24 000 |
1 270 |
7 550 |
6 675 |
9 000 |
5 200 |
1 180 |
Методи контурної сегментації
|
1 170 |
139 |
82 |
129 |
10 |
1 590 |
123 |
85 |
83 |
10 |
Нейронні мережі
|
36 800 |
2 692 |
14 000 |
5 100 |
1 380 |
31 300 |
2 515 |
14 000 |
5 900 |
1 420 |
Федоров Антон Васильович
|
7 630 |
4 080 |
1 713 |
74 |
564 |
9 200 |
3 779 |
1 676 |
3 000 |
894 |
Федяєв Олег Іванович
|
2 390 |
90 |
156 |
26 000 |
68 |
2 440 |
70 |
161 |
112 |
68 |
Запросы на английском языке |
Investigation of contour segmentation methods for constructing optical character recognition system
|
18 600 |
96 000 |
1 |
0 |
17 700 |
11 500 |
95 000 |
1 |
0 |
19 400 |
Optical recognition system
|
9 630 000 |
930 000 |
32 000 |
885 |
14 100 000 |
8 710 000 |
895 000 |
33 000 |
3 700 |
15 300 000 |
Contour segmentation methods
|
526 000 |
83 000 |
1 288 |
19 900 |
1 210 000 |
587 000 |
85 000 |
1 309 |
45 |
1 320 000 |
Neural network
|
8 720 000 |
1 000 000 |
321 000 |
9 400 |
24 900 000 |
8 250 000 |
1 000 000 |
330 000 |
9 500 |
26 700 000 |
Fedorov Anton
|
113 000 |
2 000 000 |
32 000 |
6 900 |
254 000 |
298 000 |
1 000 000 |
33 000 |
5 700 |
275 000 |
Fedyaev Oleg Ivanovitch
|
19 700 |
68 |
0 |
77 |
31 |
20 800 |
71 |
0 |
1 |
29 |
|
::Анализ полученных результатов::
В процессе исследования полученных результатов было определенно, что запросы с
кавычками являются эффективными, но в тех случаях, когда они все-таки дают результаты, то они оказались более точными.
Поэтому кавычками выделялись те запросы которые возвращали какие-нибудь результаты.
Для наглядного представления и анализа результатов поиска были построены диаграммы, на которых отражены осредненные результаты, сгруппированные по поисковым системам и разделенные на 3 группы: русскоязычные документы (рис. 1, 2), украиноязычные (рис. 3, 4) и англоязычные (рис. 5, 6) на 28.03.10 и 03.05.10. соответственно.
Рисунок 1 – Количество найденных русскоязычных документов на 28.03.10
Рисунок 2 – Количество найденных русскоязычных документов на 03.05.10
Рисунок 3 – Количество найденных украиноязычных документов на 28.03.10
Рисунок 4 – Количество найденных украиноязычных документов на 03.05.10
Рисунок 5 – Количество найденных англоязычных документов на 28.03.10
Рисунок 6 – Количество найденных англоязычных документов на 03.05.10
- В данной тематической области преобладают англоязычные источники. Это можно объяснить тем, что материалы по данной теме хорошо изучены и представлены англоязычными исследователями. Для поиска по англоязычным ключевым словам лучше применять англоязычные поисковые системы, при этом наибольшее количество материалов позволяют находить Yahoo и Google. Google выдает меньшее количество результатов, чем поисковая система Yahoo, но они бывают релевантнее.
- В русскоязычном и украиноязычном пространстве материалов по данной теме гораздо меньше, однако наблюдается хотя и незначительное, но увеличение количества материалов, что можно объяснить ростом интереса отечественных исследователей к данной теме.
- Наилучшие результаты на русскоязычные запросы показала система Google. Количество результатов, выдаваемых системой Google, гораздо првысило все остальные поисковые системы.
- На украиноязычные запросы наибольшее количество результатов выдали системы Google и Meta Ukraine. При этом объем доступных украиноязычных материалов небольшой, что свидетельствует о невысоком уровне изученности данной темы.
- В среднем наибольшее количество результатов выдают поисковые системы Yahoo и Google. Если говорить о таких поисковых системах, как Meta и Rambler, то они значительно проигрывают в количестве найденных материалов остальным системам, хотя и прослеживается некоторый рост количества результатов поиска.
- Из сравнительных таблиц можно сделать ошибочный вывод о том, что наилучшей системой является та, что выдаёт наибольшее количество результатов по введенному поисковому запросу. В общем случае, это не так. Конечно, количество результатов играет немаловажную роль, однако какая разница для пользователя, выдано ему 100 тысяч результатов, или 100 миллионов? Всё равно редкий человек посещает более двадцати первых. Поэтому наиболее показательными критериями качества поисковой системы я считаю релевантность результатов, скорость работы, стабильность, удобство использования. Лично для меня по этим критериям лидером является Google.
|