Кисниченко Екатерина Александровна
Факультет компьютерных наук и технологий
Кафедра систем искусственного интеллекта
Специальность «Системы искусственного интеллекта»
Разработка и исследование алгоритма формирования семантического ядра веб–сайта на основе методов Data Mining
Научный руководитель: д.ф.–м.н., проф. Шелепов Владислав Юрьевич
Отчет об информационном поиске по теме выпускной работы
Представленный отчет позволяет оценить информационную ситуацию по теме магистерской работы. Он является основным документальным подтверждением глубины и полноты информационного поиска, а также служит для фиксации текущей ситуации в исследуемой области.
Поиск выполнен с использованием четырех поисковых систем (Google, Яндекс, Bing, Meta). Результаты сведены в таблицу. Всего произведено 15 запросов, имеющих отношение к магистерской работе. Из них три запроса соответствует названию магистерской работы на трех языках, три запроса с ФИО руководителя, а также девять запросов с ключевыми понятиями по теме магистерской работы.
Ниже приведены две таблицы с отчетами о поиске, которые разделяет временной промежуток в два месяца, а также ряд диаграмм, которые позволяют сравнить основные изменения, произошедшие за этот период.
Отчет о поиске за 8.02.2014 г.
Строка поиска | ||||
На русском языке | ||||
Разработка и исследование алгоритма формирования семантического ядра веб–сайта на основе методов Data Mining | 17 000 | ≈ 132 000 | 1 220 | 162 |
Шелепов Владислав Юрьевич, ДонНТУ | 204 | 20 000 | 13 | 30 |
Алгоритм формирования семантического ядра | 255 000 | ≈ 170 000 | 35 500 | 7 460 |
Ядро веб–сайта | 920 000 000 | ≈ 3 000 000 | 231 000 | 222 000 000 |
Методы Data Mining | 80 800 | ≈ 350 000 | 33 500 | 25 000 |
На украинском языке | ||||
Розробка і дослідження алгоритму формування семантичного ядра веб–сайту на основі методів Data Mining | 1 770 | ≈ 73 000 | 21 | 15 |
Шелепов Владислав Юрійович, ДонНТУ | 37 | 5 000 | 2 | 10 |
Алгоритм формування семантичного ядра | 200 400 | ≈ 120 | 270 | 222 |
Ядро веб–сайту | 312 000 | ≈ 140 000 | 34 000 | 164 000 000 |
Методи Data Mining | 29 000 | ≈ 92 000 | 5 300 | 2 100 |
На английском языке | ||||
Development and research of algorithm of forming of semantic kernel of web site on the basis of methods of Data Mining | 5 000 000 | ≈ 2 000 000 | 1 100 | 20 000 |
Vladislav Shelepov, DonNTU | 168 | 807 | 2 | 102 |
Algorithm of forming of semantic kernel | 1 800 000 | ≈ 402 000 | 1 020 000 | 284 300 |
Kernel of web site | 21 150 000 | ≈ 4 000 000 | ≈ 10 000 000 | 2 800 000 |
Data Mining Methods | 42 000 000 | ≈ 4 000 000 | 8 000 000 | 11 400 |
Отчет о поиске за 10.05.2014 г.
Строка поиска | ||||
На русском языке | ||||
Разработка и исследование алгоритма формирования семантического ядра веб–сайта на основе методов Data Mining | 2 970 | ≈ 132 000 | 1 160 | 178 |
Шелепов Владислав Юрьевич, ДонНТУ | 228 | 362 | 12 | 55 |
Алгоритм формирования семантического ядра | 45 300 | ≈ 1 000 | 5 830 | 7 730 |
Ядро веб–сайта | 737 000 000 | ≈ 148 000 | 44 000 | 230 000 000 |
Методы Data Mining | 123 000 | ≈ 445 000 | 31 900 | 30 300 |
На украинском языке | ||||
Розробка і дослідження алгоритму формування семантичного ядра веб–сайту на основі методів Data Mining | 932 | ≈ 73 000 | 24 | 35 |
Шелепов Владислав Юрійович, ДонНТУ | 291 | 12 000 | 4 | 1 |
Алгоритм формування семантичного ядра | 228 000 | ≈ 125 | 286 | 193 |
Ядро веб–сайту | 378 000 | ≈ 7 000 000 | 34 800 | 227 000 000 |
Методи Data Mining | 301 000 | ≈ 490 000 | 5 040 | 1 800 |
На английском языке | ||||
Development and research of algorithm of forming of semantic kernel of web site on the basis of methods of Data Mining | 5 370 000 | ≈ 2 000 000 | 1 160 | 27 000 |
Vladislav Shelepov, DonNTU | 173 | 886 | 2 | 134 |
Algorithm of forming of semantic kernel | 1 960 000 | ≈ 437 000 | 1 340 000 | 380 000 |
Kernel of web site | 21 200 000 | ≈ 4 000 000 | 9 730 000 | 2 550 000 |
Data Mining Methods | 31 000 000 | ≈ 4 000 000 | 8 260 000 | 12 000 |
Анализ результатов поиска
В процессе поиска наилучшие результаты показали поисковые системы Google и Уandex. В большинстве случаев было найдено достаточное количество документов на всех языках. Однако не все найденные ссылки соответствовали тематике запроса.
Сравнивая результаты запросов на различных языка, можно сделать вывод, что наиболее эффективными являются результаты поисковых систем Google и Уandex.
Если сравнивать равномерность освещения вопросов, связанных с темой магистерской работы, в различных языковых пространствах, то можно отметить, что абсолютное большинство запросов было найдено на английском языке. Это объясняется тем, что темой семантикой стали интересоваться сравнительно недавно, и еще не накопилось достаточного количества русскоязычных и украиноязычных информационных ресурсов в этой области. Наибольшую сложность для поисковых систем составили запросы на украинском языке.
Анализируя результаты поиска спустя три месяца невозможно сделать однозначные выводы об изменении количества ресурсов по теме магистерской работы. Для русскоязычных запросов количество полезных ссылок по соответствующим запросам в поисковых системах Google и Уandex заметно уменьшилось. Количество найденных ссылок для половины запросов на украинском языке уменьшилось в 5 раз, особенно в поисковых системах Google, Yandex и Bing. Для англоязычных запросов количество результатов в большинстве случаев увеличилось почти в 10 раз. Для запросов «Development and research of algorithm of forming of semantic kernel of web site on the basis of methods of Data Mining», и «Data Mining Methods» количество результатов в поисковой системе Bing возросло в 2 раза. Количество ссылок на запросы «Разработка и исследование алгоритма формирования семантического ядра веб-сайта на основе методов Data Mining», «Алгоритм формирования семантического ядра» в Google уменьшилось почти на 80 процентов.
Уменьшение количества ссылок для большого количества запросов можно объяснить отключением некоторых серверов, прекращением существования документов или переиндексацией информационной базы поисковой системы.
Процент изменения для каждого запроса в каждой из поисковых систем приведен на диаграммах ниже.
Процент изменения результатов поисковой выдачи в отчетах о поиске на для запросов на русском языке
Процент изменения результатов поисковой выдачи в отчетах о поиске на для запросов на украинском языке
Процент изменения результатов поисковой выдачи в отчетах о поиске на для запросов на английском языке