RUS | UKR | ENG | ДонНТУ > Портал магистров ДонНТУ

Магистр ДонНТУ Кошелева Виктория Андреевна

Кошелева Виктория Андреевна

Факультет: Вычислительной техники и информатики
Специальность: Программное обеспечение автоматизированных систем
Кафедра: Прикладной математики и информатики
Тема выпускной работы: «Анализ методов автоматического извлечения знаний из реляционных баз данных»
Руководитель: доцент, к.т.н. Федяев Олег Иванович


Материалы по теме выпускной работы: Реферат | Библиотека | Ссылки | Отчет о поиске | Индивидуальное задание
Отчет о поиске
по теме «Анализ методов автоматического извлечения знаний из реляционных баз данных»



В таблицах приведен поиск по ключевым фразам магистерской работы от 27.02.2008г. и 16.05.2008г. Данный отчёт является основным документальным подтверждением глубины и полноты охвата информационных ресурсов в процессе поиска, а также служит для фиксации текущей ситуации в исследуемой области.


Поиск проводился на пяти поисковых системах – google.com, yandex.ru, rambler.ru, yahoo.com, meta.ua, aport.ru, по 10 ключевым фразам (6 – на русском, 1 – на украинском, 3 – на английском языках).


Отчёт о поиске от 27.02.2008г.
Ключевые фразы по теме магистрской работы www.google.com www.yandex.ru www.rambler.ru www.yahoo.com www.meta.ua www.aport.ru
извлечение знаний 1 180 000 56 403 37 291 258 000 11 077 16 536
data mining 17 300 000 197 791 194 113 104 000 000 19 857 12 347
knowledge extraction 2 330 000 2 839 2 491 45 200 000 605 6 368
реляционные базы данных 65 400 332 682 277 874 134 000 9 890 10 000
кластеризация 20 300 95 489 72 230 119 000 2 208 14 868
clustering problem 2 080 000 23 979 21 457 56 800 000 4 808 956
кластеризація 20 900 94 965 694 321 316 16
дерево решений 2 560 000 115 167 430 139 1 110 000 160 134 1 645
обработка знаний 2 140 000 230 667 357 563 1 030 000 111 445 9 068
классификация знаний 716 000 84 114 118 487 833 000 40 921 15 290



Отчёт о поиске от 16.05.2008г.
Ключевые фразы по теме магистрской работы www.google.com www.yandex.ru www.rambler.ru www.yahoo.com www.meta.ua www.aport.ru
извлечение знаний 263 000 597 529 32 957 278 000 13 377 15 547
data mining 13 200 000 3 473 525 212 945 109 000 000 32 752 13 821
knowledge extraction 1 340 000 280 105 2 530 46 400 000 498 6 730
реляционные базы данных 86 600 421 900 279 824 251 000 13 012 9 649
кластеризация 105 000 111 270 76 574 126 000 2 383 15 175
clustering problem 311 000 1 198 238 22 192 56 300 000 4 499 942
кластеризація 106 000 111 263 739 373 276 16
дерево решений 666 000 8 353 183 374 048 1 330 000 208 098 1 549
обработка знаний 407 000 4 359 807 348 214 1 330 000 123 355 7 985
классификация знаний 1 090 000 1 930 007 191 233 1 050 000 41 362 17 947
Анализ методов автоматического извлечения знаний из реляционных баз данных 0 0 0 0 0 4
Анализ методов автоматического извлечения знаний из реляционных баз данных 17 300 4 908 1 749 309 327 12
Автоматическое извлечение знаний из баз данных 203 000 69 663 5 770 2 390 2 726 273



Как видно из приведенных таблиц, по англоязычной информации поисковые сайты находят намного больше документов, чем по русскоязычной и тем более украиноязычной информации. Это связано в первую очередь с тем, что английский язык является более популярным в мире, чем русский и украинский. Второй причиной является то, что исследования, связанные с темой магистерской работы, были начаты в англоязычном мире раньше, чем в России и Украине.


По поиску информации на английском языке несомненным лидером является поисковая система yahoo.com, что не являлось ожидаемым результатом, т.к. на современном этапе мировым лидером среди поисковых систем является google.com. Это может быть связано с тем, что google.com ставит более жёсткие требования при отборе документов по запросам.


Лидером в поиске русскоязычной информации лидерами является google.com, на втором месте – yandex.ru. Это было вполне ожидаемым результатом, т.к. yandex.ru считается самой мощной российской поисковой системой.


По украинскому запросу практически все системы выдают наименьшее количество ссылок, что связано с наименьшим освещением темы магистерской работы на украинском языке. Следует отметить, что украинская поисковая система meta.ua по данному запросу находится на предпоследнем месте по количеству найденных документов. Данная поисковая система является молодой, поэтому такой результат не удивителен. Аномально то, что системы google.com и yandex.ru находят намного больше ссылок по украиноязычному запросу, чем остальные. Причина этого явления заключается в том, что по этому запросу они выдают не только украиноязычные документы, но и русскоязычные.


Динамика поиска (изменение количества результатов по запросам)
Ключевые фразы по теме магистрской работы www.google.com www.yandex.ru www.rambler.ru www.yahoo.com www.meta.ua www.aport.ru
извлечение знаний -917 000 541 126 -4 334 20 000 2 300 -989
data mining -4 100 000 3 275 734 18 832 5 000 000 12 895 1 474
knowledge extraction -990 000 277 266 39 1 200 000 -107 362
реляционные базы данных 21 200 89 218 1 950 117 000 3 122 -351
кластеризация 84 700 15 781 4 344 7 000 175 307
clustering problem -1 769 000 1 174 259 735 -500 000 -3095 -14
кластеризація 85 100 16 298 45 52 -40 0
дерево решений -1 894 000 8 238 016 -56 091 220 000 47 964 -96
обработка знаний -1 733 000 4 129 140 -9 349 200 000 11 910 -1 083
классификация знаний 374 000 1 845 893 72 746 217 000 441 2 657



Из данной таблицы видно, что по большинству запросов значительно упало количество ссылок для google.com, что может быть связано с чисткой баз данных этой поисковой системы. Остальные поисковые системы в основном имеют рост количества выдаваемых документов по большинству запросов, что свидетельствует об актуальности темы магистерской работы и пополнении количества электронной информации по теме в сети Internet.


В следующей таблице приведены результаты поиска схожих ключевых фраз магистров 2006 и 2007 гг.


Отчёт о поиске магистров Чернова И.А. и Кравченко Е.А.
Магистр Ключевые фразы по теме магистрской работы www.google.com www.yandex.ru www.rambler.ru www.yahoo.com www.meta.ua
Чернов Datamining 65 500 000 2844 7481 735000 39
Чернов Извлечение знаний 1 040 000 18 688 36 660 32 300 4 457
Чернов Деревья решений 6 300 000 52 991 203 735 76 900 62 266
Кравченко Data Mining 82 700 000 157 935 152 844 33 200 000 7 813



Из данной таблицы можно сделать вывод об общей тенденции роста количества найденных документов по запросам, связанным с темой магистерской работы, хотя по некоторым запросам, например, на google.com количество ссылок уменьшилось. Вероятно, проводились чистки баз данных данной поисковой системы, а также ужесточились требования отбора.


Материалы по теме выпускной работы: Реферат | Библиотека | Ссылки | Отчет о поиске | Индивидуальное задание