ДонНТУ Магистры Главная Автореферат Ссылки Библиотека Инд. задание
Фото Капустина Екатерина Александровна
infinity2004@list.ru
Донецкий национальный технический университет
Факультет компьютерных информационных технологий и автоматики
Тема магистерской работы:

«Разработка автоматизированной системы оценки состояния печени на основании результатов морфологических исследований»

Научный руководитель: доцент, к.т.н. Привалов М.В.

В таблицах представлены результаты поиска в Internet по тематике магистерской работы в самых распространеннных на сегодняшний день поисковых системах. Поиск производился по ключевым словам и по ключевым фразам на 3–х языках: русском, украинском и английском. Для русскоязычных ключевых слов и фраз поиск производился во всех предложенных поисковых системах. Поиск по англоязычным ключевым словам и фразам производился только в поисковых системах Google™ и Yahoo!®. Поиск по украиноязычным ключевым словам и фразам производился только в поисковых системах TOPPING и <META>®. Для оценки динамики работы поисковых систем поиск производился дважды: 26.02.2005 и 26.04.2005. Результаты поисков представлены в таблицах 1 и 2 соответственно.

Принятые обозначения:  — поиск не производился; серв. — серверов; док. — документов.

Отчет о результатах поиска в Internet

Таблица 1 — Статистика поисковых систем на 26.02.2005
Ключевые слова / фразы Google,
страниц
Rambler,
сайтов
Yandex,
страниц
Aport,
сайтов
Meta,
серв./док.
Topping,
сайтов
Yahoo!,
страниц
Поиск по ключевым словам
диагностика 1 170 000 102 540 3 697 861 3 002 6 263/70 902 226 2 220 000
гепатология 8 210 1 356 27 589 435 66/233 1 4 250
гистологический 973 6 091 56 615 1 508 338/515 0 2 080
система 15 200 000 494 507 81 574 172 4 557 30 394/1 871 980 2 429 25 700 000
экспертные 151 000 68 969 2 084 792 1 779 4 270/36 884 55 253 000
діагностика 2 283/15 064 2
експертні 2 827/27 902 0
гістологічний 176/557 0
diagnostics 13 700 000 953 000
expert 114 000 000 160 000 000
histologic 706 000 439 000
Поиск по ключевым фразам
разработка автоматизированной системы оценки состояния печени на основании результатов морфологических исследований 12 0 118 0 0 4 613 0
компьютерная диагностика состояния печени 794 2 018 893 361 167/365 0 1 640
морфологические исследования 21 300 16 516 22 470 3 272 549/2 266 168 31 100
гистологический анализатор 31 162 556 103 26/42 21 49
экспертные системы в медицине 882 5 727 3 025 612 562/1 381 2 730 1 300
розробка автоматизованої системи оцінки стану печінки на основі результатів морфологічних досліджень 1/1 980
комп'ютерна діагностика стану печінки 81/128 47
морфологічні дослідження 344/1 170 24
гістологічний аналізатор 14/20 0
експертні системи в медицині 454/1 163 1 088
Development of the automated system of the liver state estimation on the basis of morphological researches' results 177 17
expert systems in medicine 3 980 000 3 680 000
computer diagnostics of a liver condition 24 700 23 700
morphological researches 39 600 28 900
the histologic analyzer 12 800 6
artificial intelligence in medicine 1 220 000 953 000


Таблица 2 — Статистика поисковых систем на 26.04.2005
Ключевые слова / фразы Google,
страниц
Rambler,
сайтов
Yandex,
страниц
Aport,
сайтов
Meta,
серв./док.
Topping,
сайтов
Yahoo!,
страниц
Поиск по ключевым словам
диагностика 649 000 147 820 4 752 882 3 104 5 911/75 244 246 1 610 000
гепатология 3 990 140 38 560 448 73/259 1 21 500
гистологический 678 6 350 73 168 1 435 317/1698 0 1 970
система 3 700 000 557 547 104 614 143 4 442 24 387/2 266 538 2 563 19 600 000
экспертные 162 000 18 257 2 500 508 1 885 4 046/38 248 59 58 000
діагностика 1 097/8 755 2
експертні 1 446/16 914 0
гістологічний 93/287 0
diagnostics 13 860 000 9 760 000
expert 117 000 000 169 000 000
histologic 737 000 452 000
Поиск по ключевым фразам
разработка автоматизированной системы оценки состояния печени на основании результатов морфологических исследований 14 0 128 0 0 4 687 2
компьютерная диагностика состояния печени 797 2 188 947 314 174/452 1926 1 090
морфологические исследования 22 000 16 318 25 560 3 233 553/2 460 176 17 000
гистологический анализатор 31 68 572 109 24/40 22 590
экспертные системы в медицине 922 6 138 6 164 632 536/1 271 2 884 1 890
розробка автоматизованої системи оцінки стану печінки на основі результатів морфологічних досліджень 0/0 995
комп'ютерна діагностика стану печінки 42/67 60
морфологічні дослідження 186/583 25
гістологічний аналізатор 7/10 0
експертні системи в медицині 235/654 1 835
Development of the automated system of the liver state estimation on the basis of morphological researches' results 334 19
expert systems in medicine 6 320 000 3 870 000
computer diagnostics of a liver condition 302 000 23 800
morphological researches 40 300 29 800
the histologic analyzer 16 200 1100
artificial intelligence in medicine 4 990 000 962 000


Анализ результатов поиска

Одна из основных возможностей, предоставляемых Internet — возможность быстрого поиска интересующей пользователей информации, причем информации самой разнообразной. Немало времени (около 70%) уделяется поиску нужной информации в Internet и при выполнении магистерской работы. Поэтому было бы интересно отследить, какие возможности по поиску тех или иных сведений, связанных с тематикой моей работы, предоставляют различные поисковые системы, и проанализировать качество и быстроту нахождения требуемой информации, в том числе и на других языках. С этой целью данные о результатах поиска по самым распространенным на сегодняшний день поисковым системам для удобства анализа сведены в таблицы 1 и 2.

Результаты поиска говорят о том, что информация в Internet по данной тематике представлена довольно обширно. Поиск производился дважды: 26.02.2005 и 26.04.2005 с целью выяснения динамики работы поисковых систем во времени.

При поиске русскоязычной информации наибольшее количество ссылок предоставляют Yandex® и Rambler®. Особенно хорошие результаты были получены c использованием расширенного поиска в Yandex по ключевым фразам. В отличие от системы Rambler, которая на запрос по теме магистреской работы с использованием расширенного поиска не обнаружила ни одной ссылки, в Yandex в феврале было получено 118, а в апреле — 128 ссылок, хотя некоторые из найденных ссылок и не несли полезной информации. Также при русскоязычном поиске хорошо зарекомендовала себя поисковая система Google™, которая выгодно отличается от других поисковых систем большим количеством и релевантностью найденных ссылок, а также меньшим временем, затрачиваемым на поискХудшие результаты по русскоязычному поиску были продемонстрированы русской поисковой системой Aport. Это обусловлено тем, что Aport — относительно "молодой" поисковый сервер.

Поиск украиноязычных источников в Internet производился в поисковых системах TOPPING и <META>®. Лучшие результаты показала META. TOPPING в двух случаях поиска по ключевым словам и в одном случае поиска по ключевой фразе не обнаружила ни одной ссылки. При запросе по теме магистерской работы лучшие результаты были получены в TOPPING, хотя большинство из предложенных ссылок были не по существу и носили рекламный характер. Преимущество META перед TOPPING заключается в возможностях расширенного поиска и настройки формирования поискового запроса, поэтому META выгодно отличается от TOPPING релевантностью найденных ссылок, хотя их может быть получено меньше, чем в TOPPING.

Англоязычный поиск производился в Google™ и Yahoo!®. Обе поисковые системы продемонстрировали хорошие результаты англоязычного поиска. По каждому из запросов (и по ключевым словам, и по ключевым фразам) было найдено множество ссылок, причем ссылки, представленные в первой 20–ке, ссылались на содержательные страницы и были, в основном, по существу. Это объясняется тем, что Google и Yahoo — одни из самых старых и мощных серверов, которые имеют содержательные, отсортированные и хорошо проиндексированные каталоги, что позволяет достаточно быстро выводить ссылки на полезную информацию. Что касается количества найденных ссылок, то за редким исключением лидерство здесь принадлежит Google. Также среди преимуществ Google перед Yahoo! следует отметить меньшее время поиска.

Таким образом, по результатам поиска можно сделать вывод, что для русскоязычного поиска лучше всего подходит поисковая система Yandex, для украиноязычного — META, для англоязычного — Google.

Результаты, представленные в таблицах 1 и 2, свидетельствуют о том, что во всех поисковых системах со временем количество выводимых ссылок по одним и тем же запросам меняется. Это обусловлено динамичностью процессов, происходящих в глобальной сети Internet. Казалось бы, поскольку паутина Internet все время разрастается, объемы информации на серверах увеличиваются, то и количество ссылок должно увеличиваться. Однако время от времени происходят "аномалии", и при поиске через некоторое время по тому же запросу может быть выведено меньше ссылок, чем раньше. Такая ситуация наблюдается и по результатам поиска по моей магистерской теме.

Например, данные в таблицах 1 и 2 свидетельствуют о том, что при поиске по ключевым словам "диагностика", "гепатология", "гистологический", "система" в поисковой системе Google количество возвращаемых ссылок по состоянию на 26.04.2005 уменьшилось вдвое или даже втрое по сравнению с 26.02.2005, в то время как при запросах по ключевым фразам количество ссылок возрасло в некотрых случаях даже вчетверо. Возрасло и число ссылок, возвращаемых другими поисковыми системами (за редкими исключениями, где количество ссылок не изменилось, или незначительно уменьшилось; это может быть объяснено тем, что некоторые сервера, на которые раньше ссылались системы, прекратили свое существование). Возможно, такое положение обусловлено сбоем в работе поисковой системы на момент, когда производился поиск, или отказом некоторых серверов.

Еще одна "аномалия" наблюдалась в поисковой системе TOPPING. При поиске по ключевому слову "експертні" не было обнаружено ни одной ссылки как 26.02.2005, так и 26.04.2005, а по запросу "експертні системи в медицині", включающему в себя слово "експертні", 26.02.2005 было выведено 1088 ссылок, а 26.04.2005 — 1835 ссылок, хотя практика показывает, что уточнение ключевой фразы обычно приводит к сокращению числа обнаруживаемых ссылок. Однако такая ситуация может быть объяснена спецификой формирования поискового запроса в TOPPING.

На рисунке 1 представлен график, демонстрирующий изменение со временем количества найденных ссылок по запросу "computer diagnostics of a liver condition" и сравнение результатов, полученных в поисковых системах Google и Yahoo!:

сравнительный график поисковых систем Google и Yahoo!
Рисунок 1 — Cравнительный график поисковых систем Google и Yahoo!
(поиск по запросу "computer diagnostics of a liver condition")

На рисунке 2 представлен график, демонстрирующий сравнительную динамику изменения количества обнаруживаемых ссылок по запросам "диагностика" и "экспертные" в поисковых системах Yandex и Rambler:

сравнительный график поисковых систем Yandex и Rambler (поиск по ключевым словам)
Рисунок 2 — Cравнительный график поисковых систем Yandex и Rambler (поиск по ключевым словам)

На рисунке 3 представлен график, демонстрирующий сравнительную динамику изменения количества обнаруживаемых ссылок при поиске по ключевым фразам в поисковых системах Yandex и Rambler:

сравнительный график поисковых систем Yandex и Rambler (поиск по ключевым фразам)
Рисунок 3 — Cравнительный график поисковых систем Yandex и Rambler (поиск по ключевым фразам)

Рисунок 1 свидетельствует, что за истекшие 2 месяца количество ссылок, возвращаемых поисковой системой Google на запрос "computer diagnostics of a liver condition", возрасло более чем в 10 раз. В то же время число ссылок, обнаруживаемых Yahoo! по этому же запросу, практически не изменилось. По рисунку 2 можно судить, что при поиске по ключевым словам "диагностика" и "экспертные" большее число ссылок находит поисковая система Yandex. Кроме того, по прошествии двух месяцев это количество в Yandex увеличилось в несколько раз, в то время как в Rambler практически не изменилось. Из рисунка 3 видно, что при поиске по ключевым фразам в поисковых системах Yandex и Rambler количество ссылок изменилось незначительно.

ДонНТУ Магистры Главная Автореферат Ссылки Библиотека Инд. задание
© 2005 ДонНТУ
© 2005 Капустина Е.А.