Бажанова Алена Игоревна

Факультет: Компьютерных наук и технологий (ФКНТ)
Кафедра: Автоматизированных систем управления (АСУ)
Специальность: Информационные управляющие системы (ИУС)
Тема выпускной работы: Разработка онтологической модели для семантического поиска информации в электронной библиотеке
Научный руководитель: Мартыненко Татьяна Владимировна

   
   
   
Отчет о поиске
 

Представленный отчет о поиске позволяет оценить информационную ситуацию по теме магистерской работы. Он является основным документальным подтверждением глубины и полноты информационного поиска, а также служит для фиксации текущей ситуации в исследуемой области.

Поиск выполнен с использованием девяти поисковых систем (AltaVista, Aport, Google, Yandex, Rambler, Yahoo, Meta, Bing, Nigma). Результаты сведены в таблицу. Всего произведено 29 запросов, имеющих отношение к магистерской работе. Из них 4 запроса соответствует названию дипломной работы на трех языках. Среди поисковых запросов 8 на английском языке, 13 на русском и 8 на украинском.

Отчет за 12.04.11

 

AltaVista

Aport

Google

Yandex

Rambler

Yahoo

Meta

Bing

Nigma

Разработка онтологической модели для семантического поиска информации в электронной библиотеке

33

0

12 200

274 000

70

10

132

639

140 000

Розробка онтологічної моделі для семантичного пошуку інформації в електронній бібліотеці

13

0

555

11 000

2

1

39

0

3 600

Development of ontologic model for semantic information search in electronic library

664000

0

805 000

801 000

1

16 400

5

267 000

400 000

Бажанова Алена Игоревна

1360

129

3 620

10 000

390

666

22

4 000

5 600.

Бажанова Альона Ігорівна

14

2

167

184

7

27

44

14

42

Alyona Bazhanova

36

0

26 600

964

13

38

0

117

530

Мартыненко Татьяна Владимировна

44000

5 371

403 000

142 000

20 000

32 100

1 800

231 000

122 000

Мартиненко Тетяна Володимірівна

47

0

56 800

306

17

42

65

127

184

Tatyana Martinenko

301

1

17 000

2561

423

195

23

399

1 600

Семантический поиск информации

75 300

657

162 000

2 000 000

336 000

105 000

34 100

88 900

1 300 000

Семантичний пошук інформації

2,210

14

54 300

69 000

17 000

1020

5 800

3 540

47 000

Semantic information search

6 610 000

861

5 010 000

7 000 000

88 000

24 600 000

2 600

7 250 000

4 600 000

Семантические поисковые системы

13 700

6 796

162 000

631 000

329 000

13 800

12 500

25 700

511 000

Семантичні пошукові системи

273

11

41 900

70 000

18 000

495

7 500

383

45 000

Semantic search systems

5 050 000

282

4 980 000

5 000 000

65 000

14 500 000

2 500

6 810 000

3 500 000

Онтологические модели

56600

5 446

188 000

1 000 000

895 000

41 700

737 000

101 000

1 200 000

Онтологічні моделі

948

18

115 000

31 000

34 000

740

4 200

1 440

39 000

Ontologic models

1470000

3

2 920 000

791 000

8 000

14 600

22

1 530 000

11 000

Онтологии и тезаурусы

2990

1 450

15 300

76 000

9 000

875

3 500

5 580

38 000

Лингвистический анализ текста

115000

10 000

447 000

3 000 000

375 000

160 000

40 400

163 000

1 700 000

Лінгвістичний аналіз тексту

5600

271

105 000

91 000

18 000

2 310

18 900

8 190

56 000

linguistic analysis of the text

4740000

640

3 490 000

3 000 000

15 000

9 840 000

0

4 750 000

2 100 000

Применение онтологических моделей для семантического поиска

1420

2

68 600

110 000

1 366

225

900

3 740

56 000

Вживання онтологічних моделей для семантичного пошуку

30

0

2 320

3240

17

11

182

101

1700

Use of ontologic models for semantic search

1 450 000

1

1 250 000

2612

4

717

11

606 000

1 500

Языки проектирования онтологий

19300

74

109 000

454 000

2 000

622

399

106 000

254 000

Инструменты инженерии онтологий

3130

190

142 000

46 000

582

236

134

7 640

23 000

"Применение онтологических моделей для семантического поиска"

1420

0

0

0

0

0

0

3 740

0

"Разработка онтологической модели для семантического поиска информации в электронной библиотеке"

167

0

0

0

0

0

0

639

0

Отчет за 20.05.11

 

AltaVista

Aport

Google

Yandex

Rambler

Yahoo

Meta

Bing

Nigma

Разработка онтологической модели для семантического поиска информации в электронной библиотеке

262

0

12 100

222 000

124

9

0

753

222 000

Розробка онтологічної моделі для семантичного пошуку інформації в електронній бібліотеці

14

0

517

10 000

2

1

40

0

10 000

Development of ontologic model for semantic information search in electronic library

686 000

0

70 700

439 000

0

336

6

107000

439 000

Бажанова Алена Игоревна

1 380

200

3 390

1 976

392

665

293

4160

2.5 000

Бажанова Альона Ігорівна

14

2

159

93

7

27

46

14

48

Alyona Bazhanova

36

0

23 400

141

12

37

0

131

200

Мартыненко Татьяна Владимировна

45 700

5 438

88 800

70 000

18 000

31100

1 700

260 000

132 000

Мартиненко Тетяна Володимірівна

50

0

56 300

159

17

 

40

68

196

Tatyana Martinenko

303

0

14 100

865

427

261

0

415

1 100

Семантический поиск информации

74 900

1 045

211 000

1 000 000

327 000

101 000

34 100

108000

1 200 000

Семантичний пошук інформації

2 220

13

54 900

36 000

18 000

1 050

6 100

3 650

50 000

Semantic information search

6 780 000

860

7 850 000

4 000 000

75 000

25 500 000

2 600

7 230 000

3 800 000

Семантические поисковые системы

14 400

6 031

115 000

339 000

329 000

15 400

12 200

27 900

538 000

Семантичні пошукові системи

287

11

42 300

37 000

20 000

462

8 500

405

49 000

Semantic search systems

4 620 000

289

7 820 000

3 000 000

61 000

14 700 000

2 700

7 090 000

2 900 000

Онтологические модели

60 500

5619

182 000

498 000

896 000

60 000

796 000

104 000

1 200 000

Онтологічні моделі

993

18

129 000

15 000

33 000

880

4 400

1 620

32 000

Ontologic models

1 520 000

2901

1 050 000

4 537

9 000

1 450 000

21

1 560 000

12 000

Онтологии и тезаурусы

3 270

1272

15 700

46 000

9 000

3 300

3 500

5 980

39 000

Лингвистический анализ текста

138 000

17037

416 000

2 000 000

367 000

188 000

2 700

175 000

1 800 000

Лінгвістичний аналіз тексту

5 640

235

127 000

47 000

17 000

6 000

1 300

8 920

58 000

linguistic analysis of the text

5 770 000

638

6 630 000

1 000 000

15 000

10 010 000

9 200

5 760 000

1 500 000

Применение онтологических моделей для семантического поиска

1 720

2

64 000

106 000

1 389

1 540

878

3 900

107 000

Вживання онтологічних моделей для семантичного пошуку

41

0

6 150

4 093

21

34

278

138

4 100

Use of ontologic models for semantic search

1 520 000

1

2 690 000

2 949

14

1 580 000

806

628 000

3 100

Языки проектирования онтологий

35 500

65

315 000

192 000

2 000

1 200

385

124 000

144 000

Инструменты инженерии онтологий

3 370

160

132 000

20 000

594

315

149

8 400

22 000

"Применение онтологических моделей для семантического поиска"

1 540

0

0

0

0

0

0

3 900

0

"Разработка онтологической модели для семантического поиска информации в электронной библиотеке"

188

0

0

0

0

0

0

754

0

Анализ результатов поиска

Сравнивая результаты запросов по различным поисковым системам, можно прийти к выводу, что наилучшие результаты показала система Yahoo. Во всех случаях было найденно достаточное количество документов. Лишь в запросе, соответствующем теме магистерской работы на украинском языке, было найдено минимальное количество страниц. В целом по украиноязычным запросам хорошие результаты показали системы Yandex и Nigma. Во всех украиноязычных запросах эти 2 поисковые системы были наилучшими по количеству найденных сайтов после Google. Эти же поисковые системы показали хороший результат в русскоязычных запросах, выдав документов в 3-4 раза больше соответсвенно, чем остальные системы. Довольно высокие результаты по поиску показал Yahoo, во многом превосходя Google и другие поисковые системы по запросам на английском языке, показав результат на 50% лучше остальных систем. Так на запрос 'Semantic information search' Yahoo выдал количество страниц почти в 5 раз больше, чем Google. Однако, анализируя результаты выдаваемых запросов, можно прийти к выводу, что их релевантность довольно низкая. Третье место заняла система Yandex, также выдав на все запросы результаты. Одной из полезных особенностей поисковой системы Rambler является отображение числа новых сайтов. Система MSN выдавала большое количество страниц по англоязычным запросам, уступая Yahoo и Google, но сильно опережая Yandex и Nigma. Однако по более точным запросам по теме на других языках это значение ниже. На рисунках 1-4 приведены сравнительные гистограммы результатов поиска в различных поисковых системах.


Рисунок 1 – Статистика результатов поиска на всех языках




Рисунок 2 – Статистика результатов поиска по русскоязычным запросам




Рисунок 3 – Статистика результатов поиска по украиноязычным запросам




Рисунок 4 – Статистика результатов поиска по англоязычным запросам


Было замечено, что системы Aport и Bing не нашли ни одного результата по запросам, соответствующим теме магистерской работы на русском и украинском языке, что объясняется большей направленностью данных поисковых систем на англоязычный контент. Напротив, Rambler нашел лишь 1 страницу по аналогичному запросу на английском языке. Для анализа более точных результатов был произведен точный запрос "Semantic search systems". При этом Aport нашел 282 страниц, Meta в 10 раз больше, а остальные ситемы выдавали больше 100000 страниц. Системы показали хорошие результаты, из них Yahoo выдал наибольшее число документов. Во многом данная аномалия объясняется специфичностью темы и еще недостаточным количеством информационных ресурсов в этой области. Можно сделать вывод, что с более точными запросами лучше справляется Google и Yahoo.

По результатам поиска через месяц можно заметить, что в целом количество документов по соответсвующим запросам увеличилось, в большей степени по запросам на английском языке. В некоторых случаях поисковые системы Yandex и Google на русскоязычные запросы выдавали результаты ниже, чем месяц назад, что может объясняться закрытием некоторых сайтов. По запросу "Семантичний пошук інформації" почти в 2 раза уменьшилось количество выдаваемых страниц в Yandex, хотя почти все другие рассматриваемые поисковые системы свои предыдущие значения по данному запросу увеличили. Результаты по точному запросу 'Semantic search systems' сильно не изменелись и максимально увеличились лишь на 4% в поисковой системе Yahoo.

Поисковые системы дали хорошие результаты по ключевым фразам выпускной работы, однако при задании точных запросов количество выдаваемых страниц было весьма небольшим, что свидетельствует о новизне исследуемой работы.


 
   
  Автобиография | Резюме | Реферат | Библиотека | Перечень ссылок | Инд. раздел
ДонНТУ - Портал магистров