ДонНТУ   |   
ФКНТ   |   
ПМИ   |   
Портал магистров ДонНТУ
Алейкин Владислав Валерьевич
Специальность: Программное обеспечение автоматизированных систем
Тема выпускной работы: Распределенная система распознавания текстовой информации
Руководитель: доцент, к.т.н. Ладыженский Юрий Валентинович
Отчет о поиске
На данной странице предоставлен отчет о поиске по теме магистерской работы. Данный отчет достаточно полно отражает информационную ситуацию по теме магистерской работы.
При составлении отчета, выполнялся поиск информации в Интернет с использованием шести поисковых систем:
- www.google.com;
- www.rambler.ru;
- www.yandex.ru;
- www.yahoo.com;
- www.meta.ua;
- www.msn.com.
В результате поиска были сформированы две поисковые таблицы: табл. 1 от 05.03.2010г. и табл. 2 от 30.05.2010г.
Таблица 1 - Отчет о поиске от 05.03.2010г.
Поисковый запрос | Yandex | Rambler | Yahoo | Meta | MSN | |
Программная реализация распределенной системы распознавания текстовой информации | 5900 | 1000 | 2000 | 237 | 2900 | 4430 |
Програмна реалізація розподіленої системи розпізнавання текстової інформації | 868 | 449 | 405 | 4 | 334 | 5 |
Software implementation of a distributed system of recognition of textual information | 1070000 | 1000 | 776 | 906000 | 320 | 489000 |
Распознавание текстовой информации | 57800 | 1000 | 384000 | 30900 | 4200 | 99400 |
Recognition of textual information | 22100000 | 316000 | 2000 | 3060000 | 587 | 1270000 |
Распределенная система | 307000 | 24000000 | 445000 | 378000 | 458000 | 428000 |
Distributed system | 27700000 | 24000000 | 1000000 | 632000 | 264000 | 56700000 |
Распознавание текста | 450000 | 11000000 | 2000000 | 994000 | 269000 | 466000 |
Text recognition | 25600000 | 4000000 | 252000 | 90200000 | 57500 | 32200000 |
Распознавние образов | 381000 | 5000000 | 1000000 | 243000 | 200000 | 353000 |
Pattern Recognition | 5660000 | 4000000 | 142000 | 37400000 | 10900 | 22400000 |
Розпізнавання образів | 54600 | 12000 | 77000 | 8620 | 19300 | 1880 |
Параллельное программирование | 250000 | 2000000 | 26000 | 460 | 4300 | 1430 |
Concurrent programming | 1050000 | 2000000 | 411000 | 9400000 | 6200 | 2790000 |
Паралельне програмування | 20500 | 14000 | 22000 | 1120 | 6700 | 223 |
Таблица 2 - Отчет о поиске от 30.05.2010г.
Поисковый запрос | Yandex | Rambler | Yahoo | Meta | MSN | |
Программная реализация распределенной системы распознавания текстовой информации | 6200 | 1128 | 1029 | 195 | 1600 | 1590 |
Програмна реалізація розподіленої системи розпізнавання текстової інформації | 713 | 1414 | 137 | 4 | 236 | 10 |
Software implementation of a distributed system of recognition of textual information | 88700 | 1307 | 185 | 574000 | 193 | 223000 |
Распознавание текстовой информации | 48000 | 1058 | 401000 | 31200 | 4500 | 115000 |
Recognition of textual information | 35500000 | 309000 | 2000 | 3360014 | 108 | 1320000 |
Распределенная система | 341000 | 24000000 | 461000 | 399000 | 380000 | 516000 |
Distributed system | 14700000 | 9000000 | 1000000 | 693000 | 200000 | 64300000 |
Распознавание текста | 453000 | 4000000 | 2000000 | 680017 | 990000 | 573000 |
Text recognition | 18200000 | 5000000 | 285000 | 99200000 | 118000 | 39500000 |
Распознавние образов | 179000 | 2000000 | 1000000 | 249000 | 228000 | 479000 |
Pattern Recognition | 6550000 | 4000000 | 157000 | 41700000 | 13600 | 24600000 |
Розпізнавання образів | 42600 | 12000 | 81000 | 11600 | 10200 | 2510 |
Параллельное программирование | 144000 | 2000000 | 1000000 | 135000 | 5300 | 460000 |
Concurrent programming | 1120000 | 2000000 | 430000 | 10500000 | 9000 | 3590 |
Паралельне програмування | 27300 | 15000 | 15000 | 1150 | 7700 | 280 |
Сравнивая результаты запросов по различным поисковым системам, можно прийти к выводу, что наилучшие результаты показала система Google. Практически при всех запросах данная поисковая система выдавала наибольшее количество результатов.
Такие системы, как Yahoo и MSN показали примерно одинаковое количество результатов поиска. Данные системы выдавали большое количество страниц на англоязычные запросы.
В запросах на украинском языке было найдено минимальное количество страниц. По украиноязычным запросам хорошие результаты показали системы Google и Meta.
Поисковые системы Yandex и Rambler выдавали не совсем правдивые результаты. При запросах данные системы выдавали количество от 2 млн. до 5 млн. результатов. Другие системы выдавали около 5 тыс. результатов на тех же запросах. Системы Yandex и Rambler пытаются найти различные сочетания входных слов запроса и выдают результат даже при совпадении одного слова из запроса. С этим и связан такой большой разброс количества результатов в разных системах.
Наихудший результат показала поисковая система Meta. Это связано с тем, что на территории Украины небольшое количество разработок по теме магистерской работы.
Темпы роста количества найденных документов по поисковым системам составляют:
www.google.com - 23.2%
www.yandex.ru - 21.4%
www.rambler.ru - 7.11%
www.yahoo.com - 15.24%
www.meta.ua - -23.51%
www.msn.com - 13.15%
Украиноязычное пространство информации в большей степени охватывают поисковые системы GOOGLE и YANDEX, для которых зафиксированы высокие темпы роста.