Изображение магистра

Медгаус Сергей Владимирович

Факультет компьютерных наук и технологий
Кафедра программной инженерии
Специальность Программная инженерия

Архитектура и функционирование программных агентов в имитационной модели трудоустройства выпускников вуза многоагентного типа

Научный руководитель: к.т.н., доц. Федяев Олег Иванович

Отчёт об информационном поиске

Представленный отчёт позволяет оценить информационную ситуацию по теме магистерской работы. Он является основным документальным подтверждением глубины и полноты информационного поиска, а также фиксирует текущую ситуацию в исследуемой области.

Поиск выполнен с использованием шести поисковых систем (Google, Yandex, Yahoo, Bing, Meta, Rambler). Всего сформулировано 18 поисковых запросов, по 6 на каждом языке (русский, украинский, английский):

  • тема магистерской работы;
  • ФИО научного руководителя;
  • 4 ключевые фразы, касающиеся темы работы.

Для каждого из языков использовались 3 популярные поисковые системы, использование которых гарантировало хорошие результаты на всех языках – Google, Yahoo, Yandex. Также для каждого из языков по отдельности была использована дополнительная поисковая система, которая подразумевала хорошие результаты для конкретного языка: для русского языка – Rambler, для украинского языка – Meta и для английского – Bing.

Ниже приведены две таблицы с отчётами о поиске, которые разделяет временной промежуток в два месяца, а также ряд диаграмм, которые позволяют сравнить основные изменения, произошедшие за этот период.

Отчёт о поиске (20.09.2017)

Поисковый запрос Поисковая система
На русском языке Yandex Google Yahoo Rambler
Архитектура и функционирование программных агентов в имитационной модели трудоустройства выпускников вуза многоагентного типа 137 млн. 110 42 135 млн.
Федяев Олег Иванович ДонНТУ 27 тыс. 460 3 тыс. 28 тыс.
Агентная система 64 млн. 11 тыс. 1,6 тыс. 65 млн.
Интеллектуальные агенты 23 млн. 687 тыс. 46 тыс. 24 млн.
Нечёткая нейронная модель 44 млн. 54,6 тыс. 29,8 тыс. 45 млн.
Процесс обучения и трудоустройства студентов 63 млн. 457 тыс. 1,6 млн. 65 млн.
На украинском языке Yandex Google Yahoo Meta
Архітектура і функціонування програмних агентів в імітаційної моделі працевлаштування випускників вузу багатоагентного типу 114 млн. 4 4 1
Федяєв Олег Іванович ДонНТУ 8 тыс. 129 1,7 тыс. 16
Агентна система 52 млн. 180 3 тыс. 2,9 тыс.
Інтелектуальні агенти 18 млн. 74,2 тыс. 3,6 тыс. 15 тыс.
Нечітка нейронна модель 18 млн. 8 тыс. 5,9 тыс. 245
Процес навчання та працевлаштування студентів 92 млн. 69,2 тыс. 205 тыс. 38 тыс.
На английском языке Yandex Google Yahoo Bing
Program agents architecture and functioning in the multi-agent simulation model of graduates' employment 248 млн. 245 тыс. 295 тыс. 54
Fedyaev Oleg DonNTU 2 тыс. 88 9,15 млн. 12
Agent system 49 млн. 35,4 млн. 94,6 млн. 172 млн.
Intelligent agents 39 млн. 11,7 млн. 107 млн. 18,9 млн.
Fuzzy neural model 71 млн. 1,1 млн. 13,5 млн. 6 млн.
Process of students' training and employment 103 млн. 488 млн. 106 млн. 53,5 млн.

Отчёт о поиске (20.11.2017)

Поисковый запрос Поисковая система
На русском языке Yandex Google Yahoo Rambler
Архитектура и функционирование программных агентов в имитационной модели трудоустройства выпускников вуза многоагентного типа 197 млн. 316 63 207 млн.
Федяев Олег Иванович ДонНТУ 37 тыс. 499 3,1 тыс. 39 тыс.
Агентная система 67 млн. 27,8 тыс. 4 тыс. 70 млн.
Интеллектуальные агенты 35 млн. 508 тыс. 116 тыс. 35 млн.
Нечёткая нейронная модель 48 млн. 69,8 тыс. 31,2 тыс. 48 млн.
Процесс обучения и трудоустройства студентов 88 млн. 309 тыс. 4,1 млн. 92 млн.
На украинском языке Yandex Google Yahoo Meta
Архітектура і функціонування програмних агентів в імітаційної моделі працевлаштування випускників вузу багатоагентного типу 131 млн. 5 5 1
Федяєв Олег Іванович ДонНТУ 8 тыс. 129 3,6 тыс. 15
Агентна система 55 млн. 172 1,1 тыс. 2,9 тыс.
Інтелектуальні агенти 30 млн. 74,2 тыс. 4 тыс. 12,8 тыс.
Нечітка нейронна модель 13 млн. 9,1 тыс. 5,5 тыс. 236
Процес навчання та працевлаштування студентів 119 млн. 102 тыс. 307 тыс. 40,7 тыс.
На английском языке Yandex Google Yahoo Bing
Program agents architecture and functioning in the multi-agent simulation model of graduates' employment 129 млн. 286 тыс. 736 тыс. 56
Fedyaev Oleg DonNTU 2 тыс. 80 8,8 млн. 17
Agent system 17 млн. 927 млн. 252 млн. 86,1 млн.
Intelligent agents 15 млн. 14 млн. 277 млн. 16,4 млн.
Fuzzy neural model 23 млн. 78,9 млн. 22,1 млн. 4,8 млн.
Process of students' training and employment 29 млн. 621 млн. 319 млн. 49,6 млн.

Анализ результатов

Для получения полной картины результатов поиска, отображающих изменение количества информации по теме дипломной работы, необходимо оценить результаты по нескольким критериям:

  • количество результатов исходя из языка поиска;
  • количество результатов каждой поисковой системы;
  • количественные изменения результатов поиска за период 20.09.2017 – 20.11.2017.

Критерий: по языку поиска

На рисунках 1 – 2 представлено процентное соотношение результатов поиска за 20.09.2017 и 20.11.2017 на разных языках.

Рисунок 1
Рисунок 1 – 20.09.2017
Рисунок 1
Рисунок 2 – 20.11.2017

Как видно из рисунка 1, в поисковых результатах преобладают англоязычные ресурсы (63%), на втором месте идёт русский язык (26%) и на последнем украинский (11%). Это можно объяснить тем, что английский язык является международным языком, и учёные всего мира публикуют статьи и материалы на английском языке для общего доступа. Следовательно, тема магистерской работы на английском языке освещена лучше всего.

На рисунке 2 видно примерно то же процентное соотношение результатов поиска по языкам: английский преобладает (70%), на втором идёт русский язык и на третьем месте украинский язык с 22% и 8% соответственно. Однако, следует отметить, что процентная доля англоязычных результатов поиска увеличилась на 7%. Это можно объяснить тем, что за прошедшее время могло появиться больше сайтов на английском языке по данным запросам, чем на других языках.

Критерий: по поисковой системе

Результаты оценки по второму критерию представлены на рисунках 3 – 4. На них отображено количество полученных результатов поиска в различных поисковых системах.

Как видно из рисунка 3, больше всего результатов предоставила система Yandex (44%), причём показала хорошее количество результатов на всех трёх языках, в среднем – 21 млн на запрос. На втором и третьем местах, общих для трёх языков, стоят Google и Yahoo соответственно. На русском и украинском языках они показали примерно одинаковые результаты, как по качеству, так и по количеству (10 млн. и 6 млн. на запрос соответственно). На английском языке Google вырвалась в лидеры и показала максимальное количество результатов для этого языка (536 млн. суммарно по всем запросам). Yahoo же может занять почётное третье место, показав результатов в 1.6 раз меньше суммарно. Однако, необходимо отметить, что на суммарный результат Google сильно повлиял запрос о Процессе обучения и трудоустройства студентов. Количество результатов по этому запросу составляет 91% от суммы результатов по языку от Google. В остальных запросах лидирует Yahoo, что, как я думаю, справедливо ставит его на второе место вместе с Google.

Рисунок 3
Рисунок 3 – 20.09.2017

Что же касается поисковых систем, ориентированных в основном на один язык, то ситуация неоднозначная. Rambler для русского языка показал даже немного больше результатов, чем Yandex (на 3 млн.), и при этом качество результатов поиска не хуже. Meta для украинского языка показала результатов значительно меньше, чем все остальные системы (всего 56 тыс. результатов суммарно). Bing же для английского языка поработал на уровне и не уступает сильно остальным поисковым системам по результатам.

На рисунке 4 представлены результаты информационного поиска за 20.11.2017 г. На рисунке чётко видно, что в русском сегменте лидируют Yandex и Rambler, в украинском – только Yandex, а в английском сегменте соотношение между поисковыми системами остались те же, но при этом Google и Yahoo далеко оторвались от Yandex и Bing.

Рисунок 3
Рисунок 4 – 20.11.2017

Критерий: количественные изменения

Ниже приведена таблица с количественными изменениями, то есть во сколько раз больше результатов было найдено за 20.11.2017, чем за 20.09.2017. Зелёным цветом представлены коэффициенты, значение которых больше 1 и, соответственно, красным цветом представлены коэффициенты, значение которых меньше 1.

Поисковый запрос Поисковая система
На русском языке Yandex Google Yahoo Rambler
Архитектура и функционирование программных агентов в имитационной модели трудоустройства выпускников вуза многоагентного типа 1,44 2,87 1,5 1,53
Федяев Олег Иванович ДонНТУ 1,37 1,08 1,02 1,39
Агентная система 1,05 2,53 2,46 1,08
Интеллектуальные агенты 1,52 0,74 2,52 1,46
Нечёткая нейронная модель 1,09 1,28 1,05 1,07
Процесс обучения и трудоустройства студентов 1,4 0,68 2,63 1,42
На украинском языке Yandex Google Yahoo Meta
Архітектура і функціонування програмних агентів в імітаційної моделі працевлаштування випускників вузу багатоагентного типу 1,15 1,25 1,25 1
Федяєв Олег Іванович ДонНТУ 1 1 2,09 0,94
Агентна система 1,06 0,96 0,38 1,01
Інтелектуальні агенти 1,67 1 1,12 0,85
Нечітка нейронна модель 0,72 1,14 0,95 0,96
Процес навчання та працевлаштування студентів 1,29 1,47 1,5 1,07
На английском языке Yandex Google Yahoo Bing
Program agents architecture and functioning in the multi-agent simulation model of graduates' employment 0,52 1,17 2,49 1,04
Fedyaev Oleg DonNTU 1 0,91 0,97 1,42
Agent system 0,35 26,19 2,66 0,5
Intelligent agents 0,38 1,2 2,59 0,87
Fuzzy neural model 0,32 71,08 1,64 0,8
Process of students' training and employment 0,28 1,27 3,01 0,93

Во-первых, необходимо заметить, что суммарное количество результатов по запросам на всех языках увеличилось в 1.6 раза (с 2.6 млрд. до 4.1 млрд.), что говорит о возросшем интересе к теме работы, а также к её предметной области.

Во-вторых, если говорить о каждом языке в отдельности, то количество результатов поиска источниках на русском языке возросло в 1,3 раза, на украинском языке – в 1,18 раза, а на английском языке – в 1,77 раза.

В-третьих, что же касается каждой из поисковых систем, то Yandex показал уменьшение результатов в 1,14 раза, Googleувеличение в 3,05 раза, Yahoooувеличение в 2,66 раза, Ramblerувеличение в 1,35 раза, Meta – незначительное увеличение на 1% и Bingуменьшение в 1,6 раза.

Можно также сказать, что на всех языках и во всех поисковых системах присутствует положительная динамика от 10% до 50% в результатах поиска по теме выпускной работы. На русском языке присутствует прирост количества результатов почти по всем запросам во всех поисковых системах (20% – 100%). На украинском языке количество результатов имеет либо положительную динамику (до 30%), либо небольшую отрицательную (до 10%).

Результаты поиска на английском языке имеют противоречивые изменения и аномальные увеличения количества до 70 раз и уменьшения до 4 раз. На английском языке Yandex проявил уменьшение количества результатов в среднем в 2,1 раза и этой же поисковой системе принадлежит максимальное уменьшение количества результатов 3,5 раз по сравнению с результатами за 20.09.2017. Такое резкое уменьшение количества результатов скорее всего спровоцировано изменением алгоритма отбора релевантных страниц, так как снижение количества реальных страниц по темам привело бы к снижению результатов максимум в 1,2 раза. Такую же тенденцию снижения показала и поисковая система Bing. Yahoo и Google при этом увеличили количество результатов на английском языке в среднем в 9,6 раз. Максимальное увеличение количества результатов принадлежит поисковой системе Google71,08 раз и 26,19 раз. Эта аномалия также может объяснена обновлением алгоритма отбора релевантных страниц, а также индексацией новых страниц в Интернете. Повышение интереса к этим темам в интернете тоже могло стать причиной увеличения количества результатов.

Анализ многолетних данных о результатах поиска

Для получения полной картины информационного состояния темы выпускной работы, были проанализированы результаты информационного поиска прошлых лет. На рисунке 5 представлены количественные изменения результатов поиска по запросу Федяев Олег Иванович ДонНТУ – ФИО моего научного руководителя и на рисунке 6 представлены количественные изменения результатов поиска по запросу Агентная система – единственный общий поисковый запрос с некоторыми магистрами прошлых лет.

Для анализа были взяты две поисковые системы – Google и Yandex, как наиболее популярные среди магистрантов.

Рисунок 5
Рисунок 5 – Результаты поискового запроса Федяев Олег Иванович ДонНТУ на 3-х языках

Как видно из рисунка 5, по началу, в 2008 году количество результатов довольно маленькое, но постепенно начинает расти и уже к 2010 году как в Google так и в Yandex на русском языке количество результатов достигает 15-ти тысяч. К 2015 году присутствует плавное увеличение результатов от обеих поисковых систем, при чём за этот промежуток времени растут и показатели на украинском и английском языках. Потом в 2016 году происходит резкий скачок у Yandex по количеству результатов, а у Google резкий спад. Это можно объяснить возможной сменой алгоритма поиска и точностью отбора страниц-результатов. Yandex в этой динамике показал себя лучше, так как примерно в 2 раза больше находил результатов, чем Google на всех языках.

Рисунок 6
Рисунок 6 – Результаты поискового запроса Агентная система на 3-х языках

Не трудно заметить по рисунку 6, что с 2009 года по 2011 год среди поисковых систем лидировал Google, при чём результаты были в основном только на английском языке. 2014 год стал переломным, и в игру вступил Yandex и с этого года он начинает находить больше результатов по данному поисковому запросу. Уже в 2015 году Yandex находит почти в 2 раза больше результатов, чем Google. При этом можно заметить небольшой спад в количестве результатов к 2017 году, а также тот факт, что результатов на украинском языке почти нет.

Выводы

Проанализировав результаты информационного поиска по теме выпускной работы, можно сделать вывод, что в русскоязычном и украиноязычном сегментах лучше всего показала себя поисковая система Yandex, имея хорошие показатели по запросам за весь период анализа. Rambler также показала хороший результат в русскоязычном сегменте. Meta, к сожалению, не оправдала надежд и не показывает сколько-нибудь хороший результат по её профильному украинскому языку.

Google и Yahoo показали себя с хорошей стороны в англоязычном поиске, вырвавшись там в лидеры, особенно в конце анализируемого периода.

Общая динамика положительная, а это значит, что интерес к теме возрастает и появляется всё больше сайтов, на которых есть информация об агентных системах. Что же касается многолетней статистики, то тут можно сказать, что количество результатов плавно увеличивалось к 2016-му году, а к 2017-му произошёл небольшой спад. Я думаю, что это результат изменений алгоритма отбора веб-документов и соответствующее ему увеличение качества и уменьшение количества найденных документов.