Сайт ДонНТУ | Портал Магистров ДонНТУ |
|
|
Фазульянов Сергей ВалерьевичФакультет:
компьютерных информационных технологий и
автоматики (КИТА)
|
Тема магистерской
работы:
|
Отчет о поискеПредставленный отчет о поиске предназначен для анализа информационной ситуации в области исследований по теме магистерской работы. Поиск проводился на трех языках с помощью следующих поисковых систем: - Google (eng, rus, ukr), Yahoo, MSN, AltaVista -
международные
поисковые системы; Для возможности анализа результатов поиска он выполнен дважды с интервалом 1,5 месяца, и его итоги сведены в таблицах 1-3. В таблицах представлены результаты поиска по указанным запросам в каждой из поисковых систем. Всего произведено по 20 запросов, имеющих отношение к магистерской работе, на каждом языке в каждой из поисковых систем. Из них 3 запроса соответствует названию дипломной работы, имени магистранта и научного руководителя. Числовые значения являются числом найденных по запросу документов (верхний ряд чисел строки запроса содержит результаты за 10.04.2010 г., а нижний - за 27.05.2010 г.). Таблица 1 - Запросы на русском языке
Таблица 2 - Запросы на украинском языке
Таблица 3 - Запросы на английском языке
Перед проведением анализа результатов, полученных в результате поисковой работы, следует отметить, что поисковая система MSN некоректно обрабатывает запрос точной фразы, что приводит к тому что на русском и украинском языках показатели количества найденных страниц по простому запросу и запросу точной фразы одинаковы, а в английском языке зачастую результаты для запроса точной фразы превышают результаты для простого запроса. Для получения более наглядного представления о результатах поисковой работы были составлены круговые диаграммы иллюстрирующие соотношение количества найденных страниц в разных поисковых системах для каждого из языков:русского (рисунки 1-2), украинского (рисунки 3-4) и английского (рисунки 5-6). Рисунок 1. Соотношение результатов поиска в различных поисковых системах на русском языке от 10.04.2010 Рисунок 2. Соотношение результатов поиска в различных поисковых системах на русском языке от 27.05.2010 Рисунок 3. Соотношение результатов поиска в различных поисковых системах наукраинском языке от 10.04.2010 Рисунок 4. Соотношение результатов поиска в различных поисковых системах на украинском языке от 27.05.2010 Рисунок 5. Соотношение результатов поиска в различных поисковых системах на английском языке от 10.04.2010 Рисунок 6. Соотношение результатов поиска в различных поисковых системах на английском языке от 27.05.2010 При выполнении поиска в русскоязычном сегменте Интернета наилучший результат по количеству найденных статей показала система Yandex. На втором и третьем месте по количеству страниц расположились поисковые системы Google.com и, благодаря некоректной обработке запроса по точной фразе, MSN.com. По качеству найденного материала лучше всех сея зарекомендовал поисовый механизм представленный компанией Google. Это связанно с математическим аппаратом, заложенным в алгоритм индексации страниц поисковой системой. Общее количество страниц найденных всеми поисковиками на русском языке составило 30 672 092 для первого этапа поиска (10.04.2010) и 18 192 112 для второго этапа (27.05.2010). Такое значительное снижение количества найденных страниц может быть обусловленно усовершенствованием поисковых механизмов и выбраковкой "битых" и некачественных ссылок. Такая же тенденция на снижение наблюдается в целом и по двум другим языкам, на которых производился поиск. Результаты украиноязычного поиска выделили двух лидеров по количеству найденных страниц - Yandex и Google, третье место с значительно более скромным результатом заняла поисковая система Rambler. Даже несмотря на особенности обработки запросов, поисковая система MSN показала очень скромный результат по количеству найденных украиноязычных документов. В целом также наблюдается тенденция к снижению количества найденных страниц. На 10.04.2010 было найденно 7 629 946, а на 27.05.2010 уже почти на 300 тысяч страниц меньше - 7 331 152 страниц. По сравнению с первым этапом поиска несколько увеличилась доля страниц найденных Google.com по отношению к общему чиу страниц. За счет особенностей обработки запросов, поисковая система MSN.com в англоязычном сегменте заняла первоеместо. При этом зачастую запрос «точной фразы» давал количественные результаты по найденным страницам, которые превышали результаты по поисковому запросу не предусматиривающему поиск точного совпадения. Таким образом в английском сегменте Интернет первое место занимает MSN.com, второе и третье с примерно равными результатами делят между собой поисковые системы altavista и yahoo. Для англоязычного информационного пространства, как и для русского и украинского сегментов, характерно снижение количества найденных страниц по теме магистерской работы. Общее количество найденных страниц по всем поисковым запросам во всех поисковых системах составило 1 377 198 252 страниц на первом этапе поиска (10.04.2010) и 1 364 593 751 страниц на втором этапе (27.05.2010). Графики, составленные по усредненным значениям количества найденных поисковыми системами страниц(рисунки 7-8), иллюстрируют соотношение количества англо-, русско- и украиноязычных докуентов по теме магистерской работы. Рисунок 7. Усредненные данные о количестве нацденных страниц на трех языках от 10.04.2010
Рисунок 8. Усредненные данные о количестве нацденных страниц на трех языках от 27.05.2010 Усредненные данные для двух этапов поисков, разнесенных по времени на более чем полтора месяца, дают возможность оценить соотношение объема информации в трех, интересующих нас языковых сегментах. Процентное соотношения объемов англо-, русско- и украиноязычной информации за время между двумя этапами поисковой работы практически не изменилось. Это связано с примерно пропорциональным уменьшением количества найденных документов во всех языковых сегментах Интеренет. При этом следует отметить, что по запросу, включающему в себя полное название магистерской работы, наблюдается прирост количества найденных страниц почти во всех поисковых системах, что может говорить об актуальности выполняемой магистерской работы. Отдельно хотелось бы привести графики по соотношению объемов информации в различных языковых сегментах Интернет полученных при работе с Google.com, так как при поиске во всех сегментах поисковая система показала высокие качественные показатели, независимо от ее количественных характеристик. Рисунок 9. Общее количество статей, найденных на различных языках в поисковой системе google.com от 10.04.2010 Рисунок 10. Общее количество статей, найденных на различных языках в поисковой системе google.com от 27.05.2010 Количество документов, найденных поисковой системой google.com, в русско- и англоязычном информационном сегменте также снизилось как и в целом по всем системам, но для украинского сегмента наблюдается значительный прирост объема информации. Это может быть обусловленно высоким спросом отечественного рынка телекоммуникаций на системы управления трафиком мультисервисных сетей и обеспечения показателей QoS, который присутствует в Украине благодаря активному обсуждению, разработке и внедрению мультисервисных телекоммуникационных сетей и сетей мобильной связи следующих поколений. |
Автобиография | Реферат | Библиотека | Отчет о поиске | Генеалогия | Ссылки |