Библиотека


Поиск в интернет компьютерного оборудования по описанию его технических характеристик

Авторы: Кушнир А.Ю., Коломойцева И.А.

Источник: «Інформатика та комп'ютерні технології» (ІКТ 2008)./ Матеріали IV всеукраїнської науково-технічної конференції студентів, аспірантів та молодих вчених — ДонНТУ, Донецьк, 2008.


Поиск информации — задача, которую человечество решает уже многие столетия. По мере роста объема информационных ресурсов, потенциально доступных одному человеку (например, посетителю библиотеки), вырабатываются все более изощренные и совершенные поисковые средства и приемы, позволяющие найти необходимый документ. Все найденные за много лет средства и приемы поиска информации доступны и эффективны и при поиске информации в Интернет [1].

Информационный поиск — большая междисциплинарная область науки, стоящая на пересечении когнитивной психологии, информатики, информационного дизайна, лингвистики, семиотики, и библиотечного дела. Информационный поиск рассматривает поиск информации в документах, поиск самих документов, извлечение метаданных из документов, поиск текста, изображений, видео и звука в локальных реляционных базах данных, в гипертекстовых базах данных таких, как Интернет и локальные интранет-системы [2].

В настоящее время информационный поиск — это бурно развивающаяся область науки, популярность которой обусловлена экспоненциальным ростом объемов информации, в частности в сети Интернет. Информационному поиску посвящена обширная литература и множество конференций [2].

Рассмотрим информационный поиск как процесс. Поиск информации представляет собой процесс выявления в некотором множестве документов (текстов) всех таких, которые посвящены указанной теме (предмету), удовлетворяют заранее определенному условию поиска (запросу) или содержат необходимые (соответствующие информационной потребности) факты, сведения, данные [3].

В общем случае поиск информации состоит из четырех этапов:

а) определение (уточнение) информационной потребности и формулировка информационного запроса;

б) определение совокупности возможных держателей информационных массивов (источников);

в) извлечение информации из выявленных информационных массивов;

г) ознакомление с полученной информацией и оценка результатов поиска [2].

Современные поисковые системы делят на несколько классов: классификационные, предметные и словарные.

В классификационных ИПС используется иерархическая (древовидная) организация информации, которая называется классификатором. Разделы классификатора называются рубриками. Библиотечный аналог классификационной ИПС — систематический каталог. Классификатор разрабатывается и совершенствуется коллективом авторов. Затем его использует другой коллектив специалистов, называемых систематизаторами. Систематизаторы, зная классификатор, читают документы и приписывают им классификационные индексы, указывающие, каким разделам классификатора эти документы соответствуют [1].

Предметная ИПС с точки зрения пользователя устроена наиболее просто. Ищи название нужного предмета своего интереса (предметом может быть и нечто невещественное, например, индийская музыка), а с названием связаны списки соответствующих ресурсов Интернет. Это было бы особенно удобно, если полный перечень предметов невелик [1].

Словарные ИПС способны выдавать списки документов, содержащие миллионы ссылок. Даже просто просмотреть такие списки невозможно, да и не нужно. Было бы удобно иметь возможность задать формальные критерии (хотя бы относительной) важности (с точки зрения пертинентности) документов с тем, чтобы наиболее важные документы попадали бы в начало списка. Все ИПС в настоящее время уделяют основное внимание именно алгоритму ранжирования полученных ссылок [1].

Теория информационного поиска предполагает два основных алгоритма работы словарных ИПС: с использованием ключевых слов и с использованием дескрипторов. В первом случае, для оценки содержимого документа используются только те слова, которые в нем встречаются, и по запросу ИПС сопоставляет слова из запроса со словами документа, определяя по количеству, расположению, весу слов из запроса в документе его релевантность. Все работающие ИПС по историческим причинам используют этот алгоритм, в различных модификациях. При работе с дескрипторами индексируемые документы переводятся на некоторый дескрипторный информационный язык [1].

Целью данной работы является разработка системы для поиска компьютерного оборудования в Интернет.

Каждый пользователь хочет, чтобы его компьютер работал быстрее, жесткий диск был более емким, монитор позволял работать с компьютером продолжительное время с сохранением остроты зрения пользователя и т. д.

Все описанные выше характеристики можно выразить количественно: скорость работы — в тактах процессора и оперативной памяти, объем жесткого диска — в мегабайтах, качество монитора — в соотношении контраста, времени отклика и т. д. Эти характеристики рассматриваются покупателем компьютера в процессе выбора комплектующих компьютера.

Сегодня рынок компьютерной техники в Украине достаточно развит и продолжает динамично расти. Спрос на компьютерную технику увеличивается, ее цена снижается, а качество и характеристики техники улучшаются.

Очень часто нельзя сказать что, в одном магазине все стоит дороже, а в другом — дешевле. Различия в ценах между компаниями меняются при переходе от предмета к предмету. Конечно, это является свойством любого рынка, но рынок компьютерной техники более привязан к Интернету, чем другие рынки Украины, поскольку Интернет является неотъемлемой частью бизнес-процесса компаний на этом рынке.

На своих сайтах компании-продавцы размещают прайс-листы товаров. Эти документы имеют большой размер и, с учетом того, что продавцов достаточно много, выходит, что покупателю компьютера для принятия эффективного и выгодного для него решения необходимо обладать большим объемом информации, опытом в поиске подобного рода данных, а также временем. Данная информации быстро устаревает и в течение небольшого периода времени теряет свою полезность.

Разрабатываемая система WinTechSearcher предназначена для использования в качестве вспомогательного приложения при поиске компьютерного оборудования. При работе с системой пользователь производит запуск процессов поиска и просматривает сгенерированные отчеты. Для того, чтобы запустить процесс поиска необходимо указать название предмета поиска, ограничения на его характеристики, а также сайты компьютерного оборудования, на которых следует производить поиск. Результатом выполнения поиска является отчет, который содержит информацию о найденных предметах, характеристики которых удовлетворяют указанным пользователем ограничениям.

Для работы с определенным сайтом он должен быть зарегистрирован в системе в качестве источника информации. При такой регистрации необходима карта данного сайта, представляющая собой набор документов XML, в которых содержатся указания для системы о месторасположении и формате данных описывающих компьютерное оборудование.

Приложение является многопоточным, что позволяет пользователю вести несколько поисков одновременно. Структура системы WinTechSearcher изображена на рисунке 1.

Структура системы WinTechSearcher

Рис. 1 — Структура системы WinTechSearcher

Разработка проекта ведется в Microsoft Visual Studio 2008 SP1. Приложение использует библиотеки MFC 9, MSXML3, MSHTML.

Пользователями системы WinTechSearcher могут выступать предприятия, которым необходимо осуществить закупку компьютерного оборудования, консультанты компаний-дистрибьюторов и поставщиков оборудования, а также частные лица, которые планируют приобрести компьютерные комплектующие.

Одним из правил успешного менеджмента времени является делегирование как можно большего числа собственных проблем лицам, которые являются профессионалами в решении именно данного типа проблем. В процессе разработки системы WinTechSearcher автор стремится сделать ее профессионалом в получении информации, ее анализе и фильтрации.

Список литературы

  1. Тактаев С. Поиск информации в компьютерных сетях: новые подходы // SearchEngines.ru — Энциклопедия поисковых систем. [Электронный ресурс] / Тактаев С. — Режим доступа: http://www.searchengines.ru/articles/004603.html
  2. Информационный поиск // Материал из Википедии — свободной энциклопедии. [Электронный ресурс] / Режим доступа: http://ru.wikipedia.org/wiki/Информационный_поиск
  3. Теория поиска информации [Электронный ресурс] / Режим доступа: http://download.yandex.ru/class/pechishev/lecture5.pdf
  4. Практические методы поиска и анализа информации // Дистанционный консалтинг — Интернет в бизнесе. [Электронный ресурс] / Режим доступа: http://www.dist-cons.ru/modules/internet/index_02.htm
  5. Солтер, Николас А., Клепер, Скотт Дж. С++ для профессионалов.: Пер. с англ. — М.: ООО «И. Д. Вильямс», 2006. — 912 с.
  6. Reference (MFC Feature Pack) // MSDN Library. [Электронный ресурс] / Режим доступа: http://msdn.microsoft.com/ru-ru/library/bb983528(en-us).aspx