ДонНТУ> Портал магістрів

ДОНЕЦЬКИЙ НАЦІОНАЛЬНИЙ ТЕХНІЧНИЙ УНІВЕРСИТЕТ
ГІРНИЧО-ГЕОЛОГІЧНИЙ ФАКУЛЬТЕТ

ЗВІТ ПРО РЕЗУЛЬТАТИ ПОШУКУ В ІНТЕРНЕТІ
За темою магістерської роботи - "ГЕНЕТИЧНІ ФАКТОРИ ФОРМУВАННЯ ПРОМИСЛОВИХ РОДОВИЩ ВОГНЕТРИВКИХ ГЛИН"
Виконала:Отришко Олена Валентинівна
Керівник д.г.н.,проф. Волкова Тетяна Петрівна


На головну | Бібліотека | Посилання | Реферат | Індивідуальне завдання

      " Відшукай всьому почало, і ти багато зрозумієш"
Кузьма Прутков

      Основна мета користувача при роботі з мережею Internet – це отримання інформації, оскільки в першу чергу Internet є гігантським інформаційним ресурсом.

      Завдання пошуку інформації в умовах стрімкого розвитку і постійної зміни мережі і її інформаційного наповнення є нетривіальним!

      Випадково знайти потрібну адресу в мережі можна різними способами: просто подорожуючи по вузлах, дізнатися у знайомих, побачити в рекламі і т.д. Цілеспрямований пошук явно або неявно вимагає формулювання мети пошуку, розуміння того, що є об'єктом пошуку, обгрунтованого вибору засобу пошуку і ефективної методики.

      Мета визначає характеристики об'єктів пошуку, об'єм і терміни виконання роботи, перелік засобів пошуку і способи їх застосування.

      Як об'єкт пошуку може розглядатися будь-яка інформація, якщо є можливість представлення її в Internet, що стосується заданої теми.

      Як ключові слова в запиті використовувалися якомога точніші слова або словосполучення, які найповніше характеризують об'єкт пошуку.

      Запит виконувався за 7 ключовими словами і 8 словосполученням двома мовами (російська й англійська) в два етапи (березень 2006 р. і травень 2006 р.) в 5 найбільш поширених пошукових системах: Rambler, Yandex, Meta, Yahoo, Google. У травні також був проведений пошук з використанням пошукової машини ДОННТУ. Результати пошуку наведені в таблицях (- запит не проводився, 0-документів не знайдено).

Результати пошуку в Інтернет
(Березень 2006)



Запит RAMBLER YANDEX META YAHOO GOOGLE DonNTU
каолинит 4106/1086 3931/975 49/30 725/- 15600/- -/-
монотермит 8/6 21/8 1/1 3/- 16/- -/-
огнеупорность 10325/2678 8478/1436 369/128 2350/- 23900/- -/-
пластичность 189213/28039 166563/1737 4087/1128 140000/- 441000/- -/-
керамика 2487271/78966 1935658/2042 21666/2873 1210000/- 2250000/- -/-
chamotte 924/249 0/- 52/23 0/- 64600/- -/-
refractoriness 793/200 615/218 17/11 165000/- 229000 -/-
Часов-Ярское месторождение огнеупорных глин 81/15 4/2 3/3 15/- 46/- -/-
"мультипликативный показатель" 35/5 12/8 128/74 12/- 814/- -/-
селективная отработка 255/114 4035/1435 43/23 6/- 566/- -/-
технологическое картирование 141/41 117/70 3/2 41/- 82/- -/-
Бахмутская котловина 180/29 483/91 9/6 3/- 78 -/-
technological mapping 26/14 0 0 117/- 193/- -/-
Часов-Ярский огнеупорный комбинат 84/32 68/22 12/8 27/- 46/- -/-
Chasov-Yar Refractory Works 55/13 40/5 51/3 62/- 316/- -/-

Результати пошуку в Інтернеті
( Травень 2006 )



Запит RAMBLER YANDEX META YAHOO GOOGLE DonNTU
каолинит 6655/1178 4111/1060 73/42 746/- 13600/- 9/-
монотермит 26/8 25/13 4/3 6/- 21/- 0/-
огнеупорность 14293/3364 11526/1534 564/207 11000/- 20100/- -/-
пластичность 223434/31408 186656/1496 6156/1748 72000/- 394000/- 2/-
керамика 2877246/87167 2261140/2157 35740/4389 803000/- 1870000/- 25/-
chamotte 1040/270 768/305 76/31 28000/- 130000/- 2/-
refractoriness 974/235 675/232 51/19 92500/- 405000/- 0/-
Часов-Ярское месторождение огнеупорных глин 108/19 9829/1207 4/4 25/- 76/- -/-
"мультипликативный показатель" - 22/7 2/2 7/- 16/- 4/-
селективная отработка 288/135 4104/1516 68/46 52/- 551/- 0/-
технологическое картирование 1597/819 416/205 128/80 118/- 16600/- 0/-
Бахмутская котловина 124/26 555/88 8/7 5/- 21/- 0/-
technological mapping 236/82 26/15 - - - 0/-
Часов-Ярский огнеупорный комбинат 125/37 - 38/26 65/- 461/- 1/-
Chasov-Yar Refractory Works 46/11 10221/1466 65/8 69 140 0/-


Характеристика пошукової системи Rambler


       Rambler (у перекладі з англ. – мандрівник, подорожній, мандруючий) - одна з наймолодших пошукових машин (осінь 1996 г), автори якої врахували досвід і помилки попередніх спроб створити пошукову машину. На сьогодні це наймогутніша і найпопулярніша пошукова машина в російській частині Internet. Об'єм її індексу - більше 2 мільйонів сторінок, щодня додається і оновлюється більше 10 тисяч нових документів і статей з безкоштовних груп Relcom. Rambler підтримує всі кодування російської мови, володіє високою швидкодією, крім того, останнім часом система функціонує постійно і працює дуже стабільно, що для російських систем такого типа поки є досягненням а не нормою. На Rambler функціонує також рейтингова система Rambler's Top 100 (http://www.rambler.ru/top100), в якій можна знайти найбільш відвідувані сайти з певної тематики. Можливо, це коли-небудь стане повноцінним каталогом. Інтерфейс у Рамблера простій і зрозумілий - в центрі екрану знаходиться поле введення і дві великі кнопки - "Go" і "Advanced" (чомусь не перекладені російською мовою), з їх допомогою можна почати пошук за запитом і перейти до розширеного пошуку. Зліва декілька посилань дозволяють перейти до довідкової інформації, посилання вверху сторінки дозволяють змінити кодування для російського тексту. Запитів на природній мові Рамблер не підтримує, тому треба вводити ключові слова, бажано без закінчень. До послуг користувача введення масок (?- будь-яка буква * - будь-яке закінчення слова). На сторінці результатів пошуку Рамблер виводить вичерпну інформацію по кожному результату - посилання, назва сторінки, розмір сторінки, кодування, контекст в якому зустрічається слово і відсоток релевантности. Крім того, виводиться кількість результатів для всіх часткових пошуків (збіг 1 слова), натиснувши на відповідне посилання ці результати можна переглянути. На жаль, релєвантність результатів для простого пошуку на Rambler залишає бажати кращого. Засоби для складного пошуку на Rambler досить багатообразні - Rambler є кращим кандидатом на звання "Російська Альтавіста". Крім стандартних логічних операцій над термінами, пропонуються такі засоби як призначення вагових коефіцієнтів словам (для цього перед словом потрібно поставити декілька плюсів - дуже бажана присутність слова - або мінусів - слово небажано), пошук тільки в певній частині документа, пошук по URL.



Характеристика пошукової системи Google


      У 1998 році два студенти Стендфордського університету Сергій Брін і Ларрі Пейдж, яка вже одержала визнання. PageRank використовувана в Google в основному заснована на link popularity. Тобто при обчисленні релевантности сторінки найбільший внесок має кількість і якість посилань на сторінки з інших сторінок. Зараз link popularity використовується у всіх основних пошукових системах миру (у тому або іншому ступені). До речі, в російськомовних пошукових системах також використовується цей параметр, наприклад, в Яндекс, цей параметр називається індекс цитування. Google добився успіху завдяки цій технології. Його трафік стійко збільшується за останні 2 роки. У червні 2000 р., такий Інтернет-гігант, як Yahoo!, вибрав Google, як додаткового постачальника результатів, замість Inktomi. Google недавно почав використовувати додатково результати від Open Directory Project, ця програма носить назву AdWords.

      Назву пошукової системи Google було утворено в результаті гри букв в слові "googol". Цим компанія хоче підкреслити їх намір індексувати і обробляти великі об'єми інформації.

      За заявою Google, на даний момент їх база даних налічує більше 1,346,966,000 проіндексованих сторінок.

      Можна шукати в Google на 10 різних мовах. Ви також можете набудувати інтерфейс на потрібну вам мову. Наприклад, якщо ви шукайте німецький сайт, то ви можете вводити запит на німецькій мові, і всі допоміжні написи інтерфейсу будуть на німецькій мові.

      Відмітні особливості. Дуже зручною функцією є "cache" . Завдяки цією функцією користувач може проглянути проіндексовану сторінку навіть якщо ця сторінка видалена або сервер, на якому розташована сторінка недоступний. Ви також можете використовувати цю функцію для дослідження ваших конкурентів, це також допомагає краще зрозуміти принцип індексування сторінки пошуковим павуком (роботом). За допомогою Google можна знайти сторінки, які не міститися в його базі даних. Це можливо тому що пошуковий павук індексує текст посилань із сторінок.

      Результати пошуку за допомогою Google беруться з наступних джерел: Google's index (власна БД), Open Directory Project (каталог ODP), RealNames

      Велика частина результатів береться з власної бази даних Google і ранжирується в соответсвии з їх алгоритмом. Проте у користувачів також є можливість проглядати результати від ODP.

      Т.ч., Google володіє такими відмітними особливостями:

      1)     найбільша в світі база даних (близько 10 млрд. документів);

      2)     система обслуговується наймогутнішою і найбільшою в світі обчислювальною системою;

      3)     найшвидша система в світі;

      4)     точність і якість ранжирування результатів (page rank –pr-учитывает кількість цих посилань і їх питома вага; підхід індексу цитирования- ИЦ);

      5)     найвикористовуваніша система в світі (60% користувачів застосовують її), включає до 32 видів пошуку;

      6)    &nbsр найбагатомовніша система.

Характеристика пошукової системи Yandex


      Російськомовна пошукова система. На сьогодні має найбільшу базу даних, яка має кластерну структуру і розміщена на декількох серверах. Популярність цієї пошукової системи за останні місяці серйозно збільшилася. Yandex включає елементи каталога, наприклад, рубрикацію даних. Володіє розгорненою системою формування запиту. Наприклад, допускається введення завдання для пошуку на природній мові; в цьому випадку всі необхідні розширення проводяться автоматично. Є режим "Розширений пошук", в якому застосовується система багатоступінчатих меню. Є, також, крім можливості реєстрації, і можливість видалення зареєстрованих сторінок. Список результатів може мінятися залежно від завантаженості серверів. Оскільки база даних має кластерну структуру і рознесла на декілька серверів.

      У формулу обчислення релевантности включений Індекс Цитування (кількість посилань на сайт). Чим більше - тим краще.

      Розроблена технологія визначення спама, але поки вона є украй не ефективною. Часто зустрічаються спамерские сторінки. Але команда розробників працює над цим.

Характеристика пошукової системи Yahoo


      Дивно, але ця неймовірно популярна система, обслуговуюча мільйони запитів ежеденевно, зародилася як проста колекція закладок, яку поповнювали всього 2 людини - Девід Філо і Джері Янг. На сьогодні Yahoo, це вже не просто каталог, це ціла група різноманітних сервісів, серед яких такі як каталог Yahooligans - Yahoo для дітей, система персональых каналів My Yahoo, безкоштовний E-mail сервіс, система "Shop with Yahoo" (купуйте з Yahoo), сумісний з MTV проект MTV unfURLed і багато що інше. Серед всіх розглянутих систем, Yahoo - єдина чисто каталоговая, на Yahoo немає власної пошукової машини. Зате список категорій на Yahoo є якнайповнішим і простішим - на відміну від інших каталогів, на Yahoo завжди легко визначити, в якому розділі знаходиться потрібна інформація. Заголовна сторіночка Yahoo вантажиться дуже швидко - хоча на ній дуже багато посилань, але всі вони текстові. Центральна частина сторінки, звичайно, зайнята вікном пошуку і списком категорій. Посилання вверху сторінки (графічні) забезпечують доступ до такої інформації, як "що нового", "що хорошого", "More Yahoos". Останнє посилання рекомендується відвідати - вона приводить на сторінку з огормным кількістю посилань на різноманітні Yahoo-каталоги і сервіси. У нижній частині основної сторінки Yahoo розташовано велику кількість посилань на найбільш популярні розділи Yahoo. При введенні ключових слів з основної сторінки Yahoo, запит обробляється по методу "Intelligent default", тобто Yahoo шукає найбільш відповідні результати в таких областях: у категоріях Yahoo; у Web-сайтах, зареєстрованих на Yahoo; на Altavista (запит передається за відсутності результатів); у новинах. Такий інтелектуальний пошук займає досить багато часу. При завданні критеріїв пошуку для Yahoo потрібно пам'ятати, що Yahoo шукає ці слова тільки в назві і описі сторінки, оскільки повнотекстового індексу на Yahoo немає. Тому не слід указувати при пошуку дуже багато терміни або синоніми - кількість результатів з Yahoo знизиться або навіть буде нульовим. При введенні ключових слів із сторінки каталога, потрібно вибрати область пошуку - весь каталог Yahoo або тільки його поточний розділ. Це робиться за допомогою радіокнопок під полем введення. На сторінці з результатами пошуку виводяться що спочатку задовольняють критерію пошуку категорії, а потім сайти. Біля кожної категорії в дужках стоїть число - це кількість сайтів в даній категорії. У випадку якщо на Yahoo немає результатів, відразу виводяться результати з Altavista. Вгорі і внизу сторінки виводиться маленька табличка, за допомогою якої можна одним натисненням кнопки миші провести пошук в категоріях Yahoo, на Altavista, в новинах і подіях.

      Кількість результатів пошуку на Yahoo, природно, невелика, зате більшість з них є релевантною. Можлива проблема з відсутніми сторінками, оскільки вебмастера звичайно забувають видалити свої сайти з пошукових систем, а на Yahoo немає механізму автоматичного оновлення. Для розширеного пошуку Yahoo пропонує не дуже великий, але дуже корисний набір инструметов. Щоб потрапити на сторіночку розширеного пошуку, треба перейти по посиланню "options" з основної сторінки Yahoo. Серед засобів розширеного пошуку - обмеження результатів по даті, пошук в Yahoo, Usenet і серед E-mail адрес, використання логічних операцій над термінами і пошук конкретної фрази. Також присутня можливість шукати слова з довільними закінченнями, указувати слова, які повинні або НЕ повинні бути присутніми в документі, і т.д. Чисто російські ресурси в Yahoo не додаються, тому що в Yahoo Inc. просто нікому дивитися і оцінювати їх вміст. Але ті запити, які не дали результатів на Yahoo передаються на Altavista, а там є хороший індекс російських ресурсів.

      Найбільш ефективними пошуку за ключовими словами і словосполученнями для моєї магістерської, як це ні банально, опинилися пошукові системи Rambler і Google. Саме за їх допомогою знайдено найбільшу кількість корисних посилань (рис. 1) . Найменш ефективними виявилися Yandex, Meta, Yahoo, а також пошукова система ДОННТУ.

Рис.1 Діаграма ефективності пошуку в різних пошукових системах

      Відмічена зручна особливість Рамблера, якщо випадково російське слово було набрано в латинській розкладці клавіатури, то він все одно «зрозуміє» помилку користувача і знайде інформацію за запитом.

      Отже, проведений пошук показав, що значення кількості знайдених по запитах документів в березні і травні відрізняється: загальний тренд до збільшення за рахунок появи нових ресурсів, за винятком деяких запитів, де спостерігається зменшення. Це в свою чергу, може бути пов'язано з тим, що документ з результатами пошуку не існує в мережі - він будується динамічно у момент виконання запиту. Тому повторна спроба того ж запиту до одного і того ж сервера не гарантує збіг результатів, або із збоєм пошукової системи, що теж можливо.А Інтернет дозволяє отримувати інформацію майже на усі теми, але при цьому важлива стратегія пошуку, у кожного вона індивідуальна.


ДонНТУ> Портал магістров ДонНТУ> На головну | Бібліотека | Посилання | Реферат | Індивідуальне завдання