Отчет об информационном поиске по теме выпускной работы
Представленный отчет позволяет оценить информационную ситуацию по теме магистерской работы. Он является основным документальным подтверждением глубины и полноты информационного поиска, а также служит для фиксации текущей ситуации в исследуемой области.
Поиск выполнен с использованием шести поисковых систем (Google (ru), Google (ua), Yandex, Yahoo!, META, Bing). Результаты сведены в таблицу. Всего произведено 18 запросов, имеющих отношение к магистерской работе. Из них 3 запроса соответствует названию магистерской работы на трех языках, 3 запроса с ФИО руководителя, а также 12 запросов с ключевыми понятиями по теме магистерской работы.
Ниже приведены две таблицы с отчетами о поиске, которые разделяет временной промежуток в два месяца, а также ряд диаграмм, которые позволяют сравнить основные изменения, произошедшие за этот период.
Отчет о поиске за 20.02.2012
Запрос | Google (ru) | Google (ua) | Yandex | Yahoo! | META | Bing |
На русском языке |
||||||
Анализ моделей и методов интеграции данных на основе онтологического подхода | 637000 | 636000 | 2000000 | 52100 | 221000 | 58300 |
Егошина Анна Анатольевна | 11300 | 11300 | 44000 | 7410 | 98000 | 7460 |
Интеграция данных | 13200000 | 15800000 | 27000000 | 2730000 | 1388000 | 2660000 |
Построение онтологии | 297000 | 297000 | 698000 | 61500 | 14400 | 72500 |
Семантическая интеграция | 243000 | 257000 | 700000 | 42400 | 8700 | 102000 |
Тезаурус | 1220000 | 1320000 | 2000000 | 157000 | 18400 | 217000 |
На украинском языке |
||||||
Аналіз моделей і методів інтеграції даних на основі онтологічного підходу | 44500 | 29700 | 252000 | 168 | 15800 | 144 |
Єгошина Анна Анатоліївна | 60 | 1650 | 350 | 12 | 99200 | 12 |
Інтеграція даних | 1650000 | 14300000 | 2000000 | 42600 | 815000 | 37200 |
Побудова онтології | 153000 | 202000 | 220000 | 12100 | 2 900 | 12000 |
Семантична інтеграція | 163000 | 175000 | 1000000 | 28600 | 4200 | 8300 |
Тезаурус | 1220000 | 1320000 | 2000000 | 157000 | 18400 | 217000 |
На английском языке |
||||||
Analysis of the models and methods of data integration on the basis of the ontological approach | 2390000 | 2390000 | 66000000 | 10700000 | 65600 | 206000 |
Egoshina Anna | 22400 | 272000 | 753 | 13400 | 114000 | 12700 |
Data Integration | 168000000 | 168000000 | 118000000 | 186000000 | 500000 | 65500000 |
Building an ontology | 7510000 | 7170000 | 2000000 | 1860000 | 509000 | 1520000 |
Semantic integration | 18600000 | 18800000 | 8000000 | 3420000 | 8200 | 1790000 |
Thesaurus | 75800000 | 16200000 | 18000000 | 35800000 | 5800 | 7860000 |
Отчет о поиске за 20.04.2012
Запрос | Google (ru) | Google (ua) | Yandex | Yahoo! | META | Bing |
На русском языке |
||||||
Анализ моделей и методов интеграции данных на основе онтологического подхода | 73200 | 75300 | 6000000 | 195000 | 248000 | 42100 |
Егошина Анна Анатольевна | 13800 | 13800 | 42000 | 10900 | 121000 | 8990 |
Интеграция данных | 15500000 | 16800000 | 25000000 | 1180000 | 1406000 | 2860000 |
Построение онтологии | 164000 | 165000 | 745000 | 34200 | 14100 | 79600 |
Семантическая интеграция | 141000 | 156000 | 1000000 | 23400 | 10000 | 111000 |
Тезаурус | 989000 | 1250000 | 2000000 | 135000 | 23200 | 228000 |
На украинском языке |
||||||
Аналіз моделей і методів інтеграції даних на основі онтологічного підходу | 9390 | 7660 | 631000 | 1200 | 16100 | 152 |
Єгошина Анна Анатоліївна | 76 | 1070 | 184 | 10 | 125000 | 12 |
Інтеграція даних | 1990000 | 14400000 | 2000000 | 71200 | 881000 | 45600 |
Побудова онтології | 38100 | 38100 | 64000 | 23100 | 3100 | 12000 |
Семантична інтеграція | 98600 | 106000 | 2000000 | 16500 | 3700 | 9820 |
Тезаурус | 989000 | 1250000 | 2000000 | 135000 | 23200 | 228000 |
На английском языке |
||||||
Analysis of the models and methods of data integration on the basis of the ontological approach | 2210000 | 2270000 | 70000000 | 10200000 | 73700 | 119000 |
Egoshina Anna | 37400 | 39400 | 5400 | 7410 | 131000 | 6610 |
Data Integration | 73900000 | 97900000 | 104000000 | 173000000 | 515000 | 67100000 |
Building an ontology | 6970000 | 6850000 | 2000000 | 1780000 | 497000 | 1440000 |
Semantic integration | 13700000 | 14600000 | 6000000 | 4280000 | 8000 | 1740000 |
Thesaurus | 80200000 | 19000000 | 20000000 | 40700000 | 7000 | 6900000 |
Анализ результатов
Анализируя результаты поиска, можно сделать вывод, что из представленных поисковых систем, максимально эффективными на данный момент являются гугл и яндекс. Яндекс выдает максимальное кол-во результатов практически по всем запросам, однако качество поиска при этом, заметно снижается.
Сравнивая результаты в отчетах о поиске, которые разделяют два месяца, следует заметить, что количество найденных документов во всех поисковых системах как возрасло, так и снизилось. Это наглядно видно на диаграммах 1,2,3. На диаграмме 1 представлена разница в процентном соотношении для русского языка, на диаграмме 2 - для украинского, на диаграмме 3 - для английского.
Диграмма 1 - Процент изменения результатов
поисковой выдачи в отчетах о поиске для русского языка
Диграмма 2 - Процент изменения результатов
поисковой выдачи в отчетах о поиске для украинского языка
Диграмма 3 - Процент изменения результатов
поисковой выдачи в отчетах о поиске для английского языка
На диаграммах наглядно представлено, что разница найденных документов для большинства запросов не превышает 50%. Однако присутствуют пиковые моменты, разница которых превышает даже 100%. Но стоит заметить, что эту границу превышают только запросы, количество результатов которых возросло. Например, по запросу "Egoshina Anna" в Yandex, количество документов увеличилось на 4 647, что составило целых 617%. А запрос "Thesaurus" лидирует в изменении количества найденных документов в Yahoo! - 4 900 000. Однако учитывая общее количество документов по этому запросу, а именно 35 800 000 в феврале и 40 700 000 в апреле, изменение в процентном соотношении составило всего лишь 14%.
Что касается запросов, количество результатов которых снизилось, удивил Google с выбранным для поиска языком: русский. Так для запроса "Data Integration" количество документов уменьшилось на 94 100 000, что составило 56%. Так же эта поисковая система является лидирующей и в изменении результатов в процентном соотношении: для запроса «Анализ моделей и методов интеграции данных на основе онтологического подхода» количество результатов снизилось на 89%. Но даже этот показатель не превышает 100%, из чего можно сделать вывод, о локальном характере снижения найденных результатов и всеобщей тенденции возрастания количества документов, которые можно найти в интернете.
Анализируя отчет о поиске по языковому принципу, следует сделать вывод, что все поисковые системы более направлены на англоязычные запросы, так как именно для них было найдено максимальное количество документов. С украиноязычными запросами хорошо показала себя поисковая система META. Yahoo! больше подходит для англоязычных запросов, как и Bing. Yandex нашел достаточное количество документов на всех языках, однако их точность далека от желаемого. Google проявил себя во всех запросах, и для меня является максимально эффективной поисковой системой на данный момент.