Раздел посвящен анализу проведенной поисковой работы и представляет собой углубленный
мультиязычный поиск информации в интернет по теме магистерской работы. Поиск проводился в
период работы над сайтом, в два этапа: 2.05.2009 и 5.06.2009. Для поиска были
использованы самые популярные поисковые системы: Google, Yandex, Rambler, Yahoo, Meta, MSN и Altavista.
Результаты сведены в таблицы, представленные ниже. Каждая таблица, для наглядности,
разбивается на 3 блока: запросы на русском, украинском и английском языках. Строка
с каждой ключевой фразой разбивается на две подстроки, что соответствует количеству
найденных документов на первом и втором этапах поиска.
Таблица 1 – Результаты поиска по ключевым фразам
Запросы на русском языке |
Алгоритмы и инструментальные средства поиска дактилоскопических образов в информационной базе данных |
94 |
3 595 |
0 |
0 |
7 |
2 |
0 |
95 |
3 624 |
0 |
0 |
11 |
2 |
0 |
Метод поиска отпечатка пальца |
21 500 |
494 000 |
744 |
913 |
7 100 |
23 700 |
913 |
29 900 |
488 000 |
221 000 |
829 |
8 700 |
11 300 |
831 |
Метод индексирования отпечатка пальца |
415 |
8 454 |
0 |
4 |
39 |
119 |
4 |
451 |
8 804 |
893 |
3 |
41 |
80 |
3 |
Особые точки отпечатка пальца |
18 000 |
569 000 |
633 |
441 |
13 400 |
22 000 |
436 |
23 100 |
553 000 |
250 000 |
428 |
16 400 |
18 400 |
435 |
Обобщенные деревья поиска |
18 700 |
576 000 |
105 |
949 |
6 800 |
13 100 |
949 |
24 700 |
546 000 |
21 000 |
892 |
7 600 |
8 930 |
890 |
Расширение PostgreSQL |
25 000 |
237 000 |
4 000 |
81 500 |
2 600 |
24 900 |
81 500 |
41 600 |
229 000 |
81 000 |
79 500 |
2 800 |
28 200 |
79 600 |
Сравнение формы многоугольников |
7 430 |
48 000 |
1 149 |
1 080 |
1 100 |
5 650 |
1 080 |
59 500 |
46 000 |
11 000 |
1 080 |
1 200 |
2 600 |
1 080 |
Сравнение дисперсий |
34 200 |
218 000 |
2 000 |
6 470 |
801 |
40 600 |
6 430 |
38 800 |
216 000 |
28 000 |
6 130 |
758 |
39 400 |
6 190 |
Запросы на украинском языке |
Алгоритми та інструментальні засоби пошуку дактилоскопічних образів у інформаційній базі даних |
3 |
72 |
0 |
0 |
1 |
0 |
0 |
4 |
91 |
0 |
0 |
2 |
0 |
0 |
Метод пошуку відбитку пальця |
1 190 |
3 230 |
0 |
4 |
298 |
8 |
4 |
1 490 |
3 083 |
443 |
3 |
284 |
8 |
3 |
Метод індексування відбитку пальця |
92 |
13 |
0 |
0 |
1 |
0 |
0 |
106 |
11 |
0 |
0 |
0 |
0 |
0 |
Особливі точки відбитку пальця |
448 |
3 387 |
0 |
3 |
408 |
17 |
3 |
638 |
4 003 |
1 939 |
3 |
439 |
19 |
3 |
Узагальнені дерева пошуку |
4 430 |
10 000 |
15 |
67 |
1 700 |
155 |
67 |
29 800 |
8 405 |
788 |
68 |
1 800 |
163 |
68 |
Розширення PostgreSQL |
871 |
262 |
15 |
221 |
57 |
44 |
221 |
564 |
278 |
418 |
217 |
225 |
45 |
217 |
Порівняння форми багатокутників |
401 |
4 |
0 |
23 |
178 |
8 |
23 |
440 |
2 |
442 |
21 |
168 |
6 |
21 |
Порівняння дисперсій |
4 730 |
3 704 |
325 |
159 |
1 800 |
37 |
158 |
5 620 |
3 564 |
2 000 |
149 |
1 700 |
45 |
149 |
Запросы на английском языке |
Algorithms and Tools for Fingerprint Search in Informational Database |
262 000 |
5 467 |
0 |
16 300 |
8 |
7 380 |
16 400 |
54 400 |
1 121 |
0 |
17 500 |
8 |
24 000 |
17 500 |
Fingerprint search method |
322 000 |
254 000 |
88 |
4 830 000 |
483 |
931 000 |
4 830 000 |
21 000 000 |
318 000 |
4 000 |
4 870 000 |
488 |
19 100 000 |
4 880 000 |
Fingerprint indexing method |
247 000 |
146 000 |
16 |
2 910 000 |
308 |
127 000 |
2 920 000 |
741 000 |
164 000 |
4 000 |
2 910 000 |
303 |
112 000 |
2 910 000 |
Minutiae points of fingerprint |
36 700 |
4 078 |
35 |
78 700 |
14 |
13 800 |
78 700 |
65 600 |
4 910 |
156 |
82 200 |
15 |
35 600 |
82 100 |
Generalized search trees |
1 220 000 |
247 000 |
643 |
2 350 000 |
635 |
1 510 000 |
2 350 000 |
1 260 000 |
355 000 |
14 000 |
2 390 000 |
607 |
1 270 000 |
2 270 000 |
Extending PostgreSQL |
189 000 |
110 000 |
3 000 |
7 630 000 |
1 100 |
175 000 |
7 630 000 |
228 000 |
33 000 |
29 000 |
9 060 000 |
1 200 |
242 000 |
9 060 000 |
Polygon comparison |
983 000 |
8 289 |
181 |
2 330 000 |
185 |
363 000 |
2 330 000 |
1 750 000 |
76 000 |
8 000 |
2 420 000 |
193 |
536 000 |
2 420 000 |
Comparison of dispersions |
340 000 |
238 000 |
649 |
446 000 |
516 |
111 000 |
520 000 |
343 000 |
272 000 |
17 000 |
462 000 |
434 |
1 240 000 |
545 000 |
Таблица 2 – Результаты поиска по ключевым фразам в кавычках
Запросы на русском языке |
"Алгоритмы и инструментальные средства поиска дактилоскопических образов в информационной базе данных" |
0 |
0 |
0 |
0 |
0 |
2 |
0 |
0 |
0 |
0 |
0 |
0 |
2 |
0 |
"Метод поиска отпечатка пальца" |
0 |
0 |
0 |
0 |
0 |
24 100 |
0 |
0 |
0 |
0 |
0 |
0 |
10 800 |
0 |
"Метод индексирования отпечатка пальца" |
0 |
0 |
0 |
0 |
0 |
119 |
0 |
0 |
0 |
0 |
0 |
0 |
80 |
0 |
"Особые точки отпечатка пальца" |
0 |
0 |
0 |
0 |
0 |
22 000 |
0 |
0 |
0 |
0 |
0 |
0 |
19 000 |
0 |
"Обобщенные деревья поиска" |
3 |
8 |
6 |
2 |
0 |
13 100 |
2 |
3 |
8 |
6 |
2 |
0 |
8 930 |
2 |
"Расширение PostgreSQL" |
211 |
183 |
195 |
87 |
13 |
24 100 |
87 |
213 |
185 |
202 |
67 |
13 |
24 700 |
66 |
"Сравнение формы многоугольников" |
2 |
27 |
57 |
8 |
0 |
5 880 |
9 |
2 |
26 |
51 |
4 |
0 |
2 620 |
4 |
"Сравнение дисперсий" |
332 |
811 |
487 |
286 |
5 |
40 600 |
286 |
320 |
779 |
509 |
303 |
5 |
39 600 |
303 |
Запросы на украинском языке |
"Алгоритми та інструментальні засоби пошуку дактилоскопічних образів у інформаційній базі даних" |
0 |
22 000 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
"Метод пошуку відбитку пальця" |
0 |
0 |
0 |
0 |
0 |
8 |
0 |
0 |
0 |
0 |
0 |
0 |
8 |
0 |
"Метод індексування відбитку пальця" |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
"Особливі точки відбитку пальця" |
0 |
0 |
0 |
0 |
0 |
17 |
0 |
0 |
0 |
0 |
0 |
0 |
19 |
0 |
"Узагальнені дерева пошуку" |
0 |
0 |
0 |
0 |
0 |
155 |
0 |
0 |
0 |
0 |
0 |
0 |
163 |
0 |
"Розширення PostgreSQL" |
1 |
1 |
0 |
2 |
0 |
0 |
2 |
1 |
1 |
0 |
2 |
0 |
0 |
2 |
"Порівняння форми багатокутників" |
0 |
0 |
0 |
0 |
0 |
8 |
0 |
0 |
0 |
0 |
0 |
0 |
6 |
0 |
"Порівняння дисперсій" |
68 |
35 |
38 |
15 |
11 |
5 |
15 |
54 |
37 |
44 |
13 |
11 |
9 |
13 |
Запросы на английском языке |
"Algorithms and Tools for Fingerprint Search in Informational Database" |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
"Fingerprint search method" |
4 |
0 |
0 |
4 |
0 |
5 |
4 |
3 |
0 |
0 |
4 |
0 |
4 |
4 |
"Fingerprint indexing method" |
7 |
0 |
0 |
8 |
0 |
7 |
8 |
5 |
1 |
0 |
7 |
0 |
9 |
7 |
"Minutiae points of fingerprint" |
0 |
1 |
0 |
3 |
0 |
3 |
3 |
1 |
0 |
0 |
2 |
0 |
2 |
2 |
"Generalized search trees" |
3 210 |
567 |
124 |
2 720 |
5 |
5 850 000 |
2 720 |
3 390 |
530 |
126 |
3 020 |
6 |
5 320 000 |
3 020 |
"Extending PostgreSQL" |
1 340 |
352 |
136 |
1 050 |
2 |
192 |
1 050 |
2 260 |
361 |
131 |
969 |
2 |
590 |
974 |
"Polygon comparison" |
496 |
59 |
14 |
352 |
0 |
363 000 |
354 |
496 |
43 |
15 |
370 |
0 |
125 |
370 |
"Comparison of dispersions" |
235 |
6 |
0 |
56 |
0 |
39 |
56 |
228 |
4 |
0 |
57 |
0 |
38 |
57 |
Динамику изменения информационной ситуации и эффективность поисковых систем,
можно проиллюстрировать удобными для сравнения диаграммами, представленными ниже.
Рисунок 1 – Статистика результатов поиска по русскоязычным запросам
Анализируя результаты поиска по русскоязычным запросам можно сделать вывод,
что лидирующую позицию занимает поисковая система Yandex (около 2 200 000 документов),
однако ее существенным недостатком является то, что большинством являются
ссылки на малоинформативные статьи.
Рисунок 2 – Статистика результатов поиска по украиноязычным запросам
Анализ статистики украиноязычных запросов показал, что наиболее эффективными
можно считать поисковые системы Google, Yandex, и Meta.
Рисунок 3 – Статистика результатов поиска по англоязычным запросам
Проанализировав количество найденных документов на английском языке,
можно с уверенностью сказать, что безоговорочное первенство за поисковыми системами Yahoo и
Altavista (более 22 000 000 документов).
Удельный же вес поисковиков Rambler и Meta настолько низок, что даже не был отображен на диаграмме,
ввиду небольшого количества найденных документов (не более 80 000).
И все же следует очередной раз обратить внимание на тот факт, что за большим количеством
найденных документов скрывается "большой минус" – низкая информационная
насыщенность найденной информации, в большинстве случаев это реклама, либо ресурсы,
за использование которых необходимо внести определенную плату.
Полученные результаты могут отличаться в силу того, что: во-первых, поисковые программы
используют разные процедуры индексации текста документов (например, ряд программ
не индексируют весь текст, другие отличаются способом учета грамматических
особенностей языка и т.д.); во-вторых, результат поиска представляется в виде
списка найденных документов. Этот список может быть столь большим, что просмотреть
его за конечный промежуток времени невозможно и результат поиска, таким образом,
зависит от порядка, в котором расположены документы.