Кисниченко Екатерина Александровна

Факультет компьютерных наук и технологий

Кафедра систем искусственного интеллекта

Специальность «Системы искусственного интеллекта»

Разработка и исследование алгоритма формирования семантического ядра веб–сайта на основе методов Data Mining

Научный руководитель: д.ф.–м.н., проф. Шелепов Владислав Юрьевич



Отчет об информационном поиске по теме выпускной работы

Представленный отчет позволяет оценить информационную ситуацию по теме магистерской работы. Он является основным документальным подтверждением глубины и полноты информационного поиска, а также служит для фиксации текущей ситуации в исследуемой области.

Поиск выполнен с использованием четырех поисковых систем (Google, Яндекс, Bing, Meta). Результаты сведены в таблицу. Всего произведено 15 запросов, имеющих отношение к магистерской работе. Из них три запроса соответствует названию магистерской работы на трех языках, три запроса с ФИО руководителя, а также девять запросов с ключевыми понятиями по теме магистерской работы.

Ниже приведены две таблицы с отчетами о поиске, которые разделяет временной промежуток в два месяца, а также ряд диаграмм, которые позволяют сравнить основные изменения, произошедшие за этот период.

Отчет о поиске за 8.02.2014 г.

Отчет о поиске за 10.05.2014 г.

Анализ результатов поиска

В процессе поиска наилучшие результаты показали поисковые системы Google и Уandex. В большинстве случаев было найдено достаточное количество документов на всех языках. Однако не все найденные ссылки соответствовали тематике запроса.

Сравнивая результаты запросов на различных языка, можно сделать вывод, что наиболее эффективными являются результаты поисковых систем Google и Уandex.

Если сравнивать равномерность освещения вопросов, связанных с темой магистерской работы, в различных языковых пространствах, то можно отметить, что абсолютное большинство запросов было найдено на английском языке. Это объясняется тем, что темой семантикой стали интересоваться сравнительно недавно, и еще не накопилось достаточного количества русскоязычных и украиноязычных информационных ресурсов в этой области. Наибольшую сложность для поисковых систем составили запросы на украинском языке.

Анализируя результаты поиска спустя три месяца невозможно сделать однозначные выводы об изменении количества ресурсов по теме магистерской работы. Для русскоязычных запросов количество полезных ссылок по соответствующим запросам в поисковых системах Google и Уandex заметно уменьшилось. Количество найденных ссылок для половины запросов на украинском языке уменьшилось в 5 раз, особенно в поисковых системах Google, Yandex и Bing. Для англоязычных запросов количество результатов в большинстве случаев увеличилось почти в 10 раз. Для запросов «Development and research of algorithm of forming of semantic kernel of web site on the basis of methods of Data Mining», и «Data Mining Methods» количество результатов в поисковой системе Bing возросло в 2 раза. Количество ссылок на запросы «Разработка и исследование алгоритма формирования семантического ядра веб-сайта на основе методов Data Mining», «Алгоритм формирования семантического ядра» в Google уменьшилось почти на 80 процентов.

Уменьшение количества ссылок для большого количества запросов можно объяснить отключением некоторых серверов, прекращением существования документов или переиндексацией информационной базы поисковой системы.

Процент изменения для каждого запроса в каждой из поисковых систем приведен на диаграммах ниже.


Процент изменения результатов поисковой выдачи в отчетах о поиске на для запросов на русском языке


Процент изменения результатов поисковой выдачи в отчетах о поиске на для запросов на украинском языке


Процент изменения результатов поисковой выдачи в отчетах о поиске на для запросов на английском языке