Макогон Сергей Александрович

Факультет компьютерных наук и технологий

Кафедра Программной инженерии

Специальность: Программная инженерия

Тема магистерской работы: Разработка и оптимизация алгоритмов оптического распознавания символов и их программная кроссплатформенная реализация с использованием OpenCV

Научный руководитель: д.т.н., проф. Зори Сергей Анатольевич

Отчёт об информационном поиске

Представленный отчёт позволяет оценить информационную ситуацию по теме магистерской работы. Он является основным документальным подтверждением глубины и полноты информационного поиска, а также служит для фиксации текущей ситуации в исследуемой области.

Поиск выполнен с использованием четырёх поисковых систем (Google, Яндекс, Bing, Meta). Результаты сведены в таблицу. Всего произведено 15 запросов, имеющих отношение к магистерской работе. Из них 3 запроса соответствует названию магистерской работы на трёх языках, 3 запроса с ФИО руководителя, а также 9 запросов с ключевыми понятиями по теме магистерской работы.

Ниже приведены таблицы с отчётами о поиске, а также сравнительный анализ результатов поиска в разные периоды времени.

Отчёт о поиске за сентябрь 2018

Поисковый запрос http://www.google.com.ua http://www.yandex.ua http://www.bing.com http://www.meta.ua
На русском языке
Разработка и оптимизация алгоритмов оптического распознавания символов и их программная кроссплатформенная реализация с использованием OpenCV 3370 ≈ 117 млн. 4 725
Зори Сергей Анатольевич, ДонНТУ 4249 ≈ 576 тыс. 20 454
Алгоритмы оптического распознавания символов 227600 ≈ 30 млн. 4320 125000
Библиотека OpenCV 38100 ≈ 90 млн. 35700 43500
Кроссплатформенные приложения 626000 ≈ 17 млн. 6587 220000
На украинском языке
Розробка і оптимізація алгоритмів оптичного розпізнавання символів і їх програмна кроссплатформова реалізація з використанням OpenCV 2 ≈ 136 млн. 1 2
Зорі Сергій Анатолійович, ДонНТУ 2236 ≈ 15 тыс. 38 425
Алгоритми оптичного розпізнавання символів 113000 ≈ 25 млн. 432 65200
Бібліотека OpenCV 3070000 ≈ 19 млн. 84 2580000
Кросплатформові додатки 548 ≈ 12 млн. 3 237
На английском языке
Development and optimization of optical character recognition algorithms and their cross-platform software implementation using OpenCV 124900 ≈ 224 млн. 3870 84600
Zory Sergey Anatolyevich, DonNTU 230 ≈ 12 тыс. 1 8
Optical character recognition algorithms 5480000 ≈ 50 млн. 150000 4125000
OpenCV library 8900000 ≈ 62 млн. 1420000 3750000
Cross platform applications 321000000 55000000 7250000 357000000

Отчёт о поиске за декабрь 2018

Поисковый запрос http://www.google.com.ua http://www.yandex.ua http://www.bing.com http://www.meta.ua
На русском языке
Разработка и оптимизация алгоритмов оптического распознавания символов и их программная кроссплатформенная реализация с использованием OpenCV 3960 ≈ 177 млн. 5 1070
Зори Сергей Анатольевич, ДонНТУ 5440 ≈ 476 тыс. 24 446
Алгоритмы оптического распознавания символов 255000 ≈ 37 млн. 4870 128000
Библиотека OpenCV 50500 ≈ 95 млн. 39400 41800
Кроссплатформенные приложения 573000 ≈ 22 млн. 6480 253000
На украинском языке
Розробка і оптимізація алгоритмів оптичного розпізнавання символів і їх програмна кроссплатформова реалізація з використанням OpenCV 6 ≈ 123 млн. 1 2
Зорі Сергій Анатолійович, ДонНТУ 3790 ≈ 19 тыс. 35 433
Алгоритми оптичного розпізнавання символів 129000 ≈ 22 млн. 453 62600
Бібліотека OpenCV 5770000 ≈ 17 млн. 73 2940000
Кросплатформові додатки 494 ≈ 10 млн. 3 223
На английском языке
Development and optimization of optical character recognition algorithms and their cross-platform software implementation using OpenCV 201000 ≈ 226 млн. 4620 88100
Zory Sergey Anatolyevich, DonNTU 152 ≈ 10 тыс. 1 10
Optical character recognition algorithms 7630000 ≈ 42 млн. 153000 4860000
OpenCV library 8600000 ≈ 66 млн. 1680000 3830000
Cross platform applications 319000000 ≈ 59 млн. 7480000 357000000

Анализ результатов поиска

Исходя из полученной информации, можно утверждать, что наилучшие показатели показала поисковая система Google. Несмотря на наличие большого количества найденных страниц в Яндексе, Google отличается большей релевантностью и актуальностью ссылок.

Неточности, которые были получены в процессе поиска в системе Яндекс обоснованы тем, что при наличии большого количества найденной информации поисковая система не предоставляет пользователю точную информацию о количестве найденных страниц.

Малое количество найденных страниц в поисковых системах META и Bing можно объяснить с помощью таких факторов:

  • меньшие вычислительные мощности (по сравнению с Google и Яндекс)
  • иные поисковые алгоритмы

При сравнении и анализе результатов, полученных при поиске информации, важно отметить изменения количества найденных страниц. Динамика количества выдаваемых по запросам страниц изображена на диаграммах ниже.

Процент изменения результатов выдачи по запросам на русском языке

Процент изменения результатов выдачи по запросам на русском языке

Процент изменения результатов выдачи по запросам на украинском языке

Процент изменения результатов выдачи по запросам на украинском языке

Процент изменения результатов выдачи по запросам на английском языке

Процент изменения результатов выдачи по запросам на английском языке

Согласно диаграммам, максимальный рост поисковой выдачи составил 300% (объясняется малым количеством найденных страниц по запросу Розробка і оптимізація алгоритмів оптичного розпізнавання символів і їх програмна кроссплатформова реалізація з використанням OpenCV), а максимальное снижение не превышает 34%.

На динамику запросов могли оказать влияние следующие факторы:

  • естесственное изменение количества результатов (переиндексация, появление новых сайтов-зеркал, недоступность старых, блокировка сайтов);
  • появление новых страниц по теме запроса.