ДонНТУ | Портал магистров ДонНТУ

Магистр ДонНТУ Фёдоров Антон Васильевич

Фёдоров Антон Васильевич

Факультет: Компьютерных наук и технологий
Специальность: Программное обеспечение автоматизированных систем
Тема выпускной работы:

«Исследование методов контурной сегментации для построения системы оптического распознавания символов»

Руководитель: к.т.н., доцент кафедры ПМиИ Федяев О.И.

Отчет о поиске

Биография

Реферат

Библиотека

Ссылки

Отчет о поиске

Индивидуальный раздел

Отчет о поиске ресурсов Интернет проводится с целью фиксации информационной ситуации по теме: «Исследование методов контурной сегментации для построения системы оптического распознавания символов», выявления поисковых систем, генерирующих на сегодняшний день наиболее релевантные результаты, а также анализа динамики развития информационной базы по исследуемому направлению. Результаты поиска приведены в таблицах. Результаты поиска следует воспринимать как [количество страниц], которые выдает поисковая система на определенный запрос.

После того как был произведен поиск по ключевым фразам, был сформирован отчет, в нем представлены результаты поиска электронных материалов по теме магистерской работы в сети Интернет. Во время поиска использовались следующие поисковые системы: Google, Yandex, Rambler, Yahoo, Meta. Из них Google – международная поисковая система, Yahoo – американская, Yandex и Rambler – русские, Meta – украинская поисковая системы. Поиск осуществлялся по ключевым фразам на 3-х языках – русском, украинском и английском. С целью проведения анализа развития динамики изменения количества ресурсов по теме магистерской работы поиск выполнялся два раза: 28.03.10 и 03.05.10.

В табл. 1 представлены результаты поиска на 28.03.10 (верхняя ячейка) и на 03.05.10. (нижняя ячейка).


Отчет о поиске за 28.03.2010/03.05.2010:

Ключевые фразы Поисковые системы
Google Yandex Rambler Meta Ukraine Yahoo
Запросы на русском языке
Исследование методов контурной сегментации для построения системы оптического распознавания символов 235 4 814 0 0 0
336 4 636 0 14 0
Системы оптического распознавания 495 000 1 000 000 861 000 127 000 483
668 000 1 000 000 861 000 201 000 278 000
Методы контурной сегментации 1 440 26 000 747 371 87
1 930 28 000 738 126 94
Нейронные сети 6 330 000 537 000 674 000 49 400 458 000
5 700 000 509 000 744 000 30 600 442 000
Фёдоров Антон Васильевич 92 700 190 000 183 000 9 500 29 200
222 000 224 000 182 000 15 500 35 800
Федяев Олег Иванович 3 870 8 670 4 000 28 200 2 260
14 400 14 000 5 000 163 1 780
Запросы на украинском языке
Дослідження методів контурної сегментації будування системи оптичного розпізнавання символів 7 48 0 0 0
11 44 0 0 0
Системи оптичного розпізнавання 16 700 7 033 942 24 000 1 270
7 550 6 675 9 000 5 200 1 180
Методи контурної сегментації 1 170 139 82 129 10
1 590 123 85 83 10
Нейронні мережі 36 800 2 692 14 000 5 100 1 380
31 300 2 515 14 000 5 900 1 420
Федоров Антон Васильович 7 630 4 080 1 713 74 564
9 200 3 779 1 676 3 000 894
Федяєв Олег Іванович 2 390 90 156 26 000 68
2 440 70 161 112 68
Запросы на английском языке
Investigation of contour segmentation methods for constructing optical character recognition system 18 600 96 000 1 0 17 700
11 500 95 000 1 0 19 400
Optical recognition system 9 630 000 930 000 32 000 885 14 100 000
8 710 000 895 000 33 000 3 700 15 300 000
Contour segmentation methods 526 000 83 000 1 288 19 900 1 210 000
587 000 85 000 1 309 45 1 320 000
Neural network 8 720 000 1 000 000 321 000 9 400 24 900 000
8 250 000 1 000 000 330 000 9 500 26 700 000
Fedorov Anton 113 000 2 000 000 32 000 6 900 254 000
298 000 1 000 000 33 000 5 700 275 000
Fedyaev Oleg Ivanovitch 19 700 68 0 77 31
20 800 71 0 1 29

::Анализ полученных результатов::


В процессе исследования полученных результатов было определенно, что запросы с кавычками являются эффективными, но в тех случаях, когда они все-таки дают результаты, то они оказались более точными. Поэтому кавычками выделялись те запросы которые возвращали какие-нибудь результаты.

Для наглядного представления и анализа результатов поиска были построены диаграммы, на которых отражены осредненные результаты, сгруппированные по поисковым системам и разделенные на 3 группы: русскоязычные документы (рис. 1, 2), украиноязычные (рис. 3, 4) и англоязычные (рис. 5, 6) на 28.03.10 и 03.05.10. соответственно.

Количество найденных русскоязычных документов на 28.03.10
Рисунок 1 – Количество найденных русскоязычных документов на 28.03.10

Количество найденных русскоязычных документов на 03.05.10
Рисунок 2 – Количество найденных русскоязычных документов на 03.05.10

Количество найденных украиноязычных документов на 28.03.10
Рисунок 3 – Количество найденных украиноязычных документов на 28.03.10

Количество найденных украиноязычных документов на 03.05.10
Рисунок 4 – Количество найденных украиноязычных документов на 03.05.10

Количество найденных англоязычных документов на 28.03.10
Рисунок 5 – Количество найденных англоязычных документов на 28.03.10

Количество найденных англоязычных документов на 03.05.10
Рисунок 6 – Количество найденных англоязычных документов на 03.05.10
  1. В данной тематической области преобладают англоязычные источники. Это можно объяснить тем, что материалы по данной теме хорошо изучены и представлены англоязычными исследователями. Для поиска по англоязычным ключевым словам лучше применять англоязычные поисковые системы, при этом наибольшее количество материалов позволяют находить Yahoo и Google. Google выдает меньшее количество результатов, чем поисковая система Yahoo, но они бывают релевантнее.
  2. В русскоязычном и украиноязычном пространстве материалов по данной теме гораздо меньше, однако наблюдается хотя и незначительное, но увеличение количества материалов, что можно объяснить ростом интереса отечественных исследователей к данной теме.
  3. Наилучшие результаты на русскоязычные запросы показала система Google. Количество результатов, выдаваемых системой Google, гораздо првысило все остальные поисковые системы.
  4. На украиноязычные запросы наибольшее количество результатов выдали системы Google и Meta Ukraine. При этом объем доступных украиноязычных материалов небольшой, что свидетельствует о невысоком уровне изученности данной темы.
  5. В среднем наибольшее количество результатов выдают поисковые системы Yahoo и Google. Если говорить о таких поисковых системах, как Meta и Rambler, то они значительно проигрывают в количестве найденных материалов остальным системам, хотя и прослеживается некоторый рост количества результатов поиска.
  6. Из сравнительных таблиц можно сделать ошибочный вывод о том, что наилучшей системой является та, что выдаёт наибольшее количество результатов по введенному поисковому запросу. В общем случае, это не так. Конечно, количество результатов играет немаловажную роль, однако какая разница для пользователя, выдано ему 100 тысяч результатов, или 100 миллионов? Всё равно редкий человек посещает более двадцати первых. Поэтому наиболее показательными критериями качества поисковой системы я считаю релевантность результатов, скорость работы, стабильность, удобство использования. Лично для меня по этим критериям лидером является Google.

Биография | Реферат | Библиотека | Ссылки | Отчет о поиске | Индивидуальный раздел