Библиотека
Поиск в интернет компьютерного оборудования по описанию его технических характеристик
Авторы: Кушнир А.Ю., Коломойцева И.А.
Источник: «Інформатика та комп'ютерні технології» (ІКТ 2008)./ Матеріали IV всеукраїнської науково-технічної конференції студентів, аспірантів та молодих вчених — ДонНТУ, Донецьк, 2008.
Поиск информации — задача, которую человечество решает уже многие столетия. По мере роста объема информационных ресурсов, потенциально доступных одному человеку (например, посетителю библиотеки), вырабатываются все более изощренные и совершенные поисковые средства и приемы, позволяющие найти необходимый документ. Все найденные за много лет средства и приемы поиска информации доступны и эффективны и при поиске информации в Интернет [1].
Информационный поиск — большая междисциплинарная область науки, стоящая на пересечении когнитивной психологии, информатики, информационного дизайна, лингвистики, семиотики, и библиотечного дела. Информационный поиск рассматривает поиск информации в документах, поиск самих документов, извлечение метаданных из документов, поиск текста, изображений, видео и звука в локальных реляционных базах данных, в гипертекстовых базах данных таких, как Интернет и локальные интранет-системы [2].
В настоящее время информационный поиск — это бурно развивающаяся область науки, популярность которой обусловлена экспоненциальным ростом объемов информации, в частности в сети Интернет. Информационному поиску посвящена обширная литература и множество конференций [2].
Рассмотрим информационный поиск как процесс. Поиск информации представляет собой процесс выявления в некотором множестве документов (текстов) всех таких, которые посвящены указанной теме (предмету), удовлетворяют заранее определенному условию поиска (запросу) или содержат необходимые (соответствующие информационной потребности) факты, сведения, данные [3].
В общем случае поиск информации состоит из четырех этапов:
а) определение (уточнение) информационной потребности и формулировка информационного запроса;
б) определение совокупности возможных держателей информационных массивов (источников);
в) извлечение информации из выявленных информационных массивов;
г) ознакомление с полученной информацией и оценка результатов поиска [2].
Современные поисковые системы делят на несколько классов: классификационные, предметные и словарные.
В классификационных ИПС используется иерархическая (древовидная) организация информации, которая называется классификатором. Разделы классификатора называются рубриками. Библиотечный аналог классификационной ИПС — систематический каталог. Классификатор разрабатывается и совершенствуется коллективом авторов. Затем его использует другой коллектив специалистов, называемых систематизаторами. Систематизаторы, зная классификатор, читают документы и приписывают им классификационные индексы, указывающие, каким разделам классификатора эти документы соответствуют [1].
Предметная ИПС с точки зрения пользователя устроена наиболее просто. Ищи название нужного предмета своего интереса (предметом может быть и нечто невещественное, например, индийская музыка), а с названием связаны списки соответствующих ресурсов Интернет. Это было бы особенно удобно, если полный перечень предметов невелик [1].
Словарные ИПС способны выдавать списки документов, содержащие миллионы ссылок. Даже просто просмотреть такие списки невозможно, да и не нужно. Было бы удобно иметь возможность задать формальные критерии (хотя бы относительной) важности (с точки зрения пертинентности) документов с тем, чтобы наиболее важные документы попадали бы в начало списка. Все ИПС в настоящее время уделяют основное внимание именно алгоритму ранжирования полученных ссылок [1].
Теория информационного поиска предполагает два основных алгоритма работы словарных ИПС: с использованием ключевых слов и с использованием дескрипторов. В первом случае, для оценки содержимого документа используются только те слова, которые в нем встречаются, и по запросу ИПС сопоставляет слова из запроса со словами документа, определяя по количеству, расположению, весу слов из запроса в документе его релевантность. Все работающие ИПС по историческим причинам используют этот алгоритм, в различных модификациях. При работе с дескрипторами индексируемые документы переводятся на некоторый дескрипторный информационный язык [1].
Целью данной работы является разработка системы для поиска компьютерного оборудования в Интернет.
Каждый пользователь хочет, чтобы его компьютер работал быстрее, жесткий диск был более емким, монитор позволял работать с компьютером продолжительное время с сохранением остроты зрения пользователя и т. д.
Все описанные выше характеристики можно выразить количественно: скорость работы — в тактах процессора и оперативной памяти, объем жесткого диска — в мегабайтах, качество монитора — в соотношении контраста, времени отклика и т. д. Эти характеристики рассматриваются покупателем компьютера в процессе выбора комплектующих компьютера.
Сегодня рынок компьютерной техники в Украине достаточно развит и продолжает динамично расти. Спрос на компьютерную технику увеличивается, ее цена снижается, а качество и характеристики техники улучшаются.
Очень часто нельзя сказать что, в одном магазине все стоит дороже, а в другом — дешевле. Различия в ценах между компаниями меняются при переходе от предмета к предмету. Конечно, это является свойством любого рынка, но рынок компьютерной техники более привязан к Интернету, чем другие рынки Украины, поскольку Интернет является неотъемлемой частью бизнес-процесса компаний на этом рынке.
На своих сайтах компании-продавцы размещают прайс-листы товаров. Эти документы имеют большой размер и, с учетом того, что продавцов достаточно много, выходит, что покупателю компьютера для принятия эффективного и выгодного для него решения необходимо обладать большим объемом информации, опытом в поиске подобного рода данных, а также временем. Данная информации быстро устаревает и в течение небольшого периода времени теряет свою полезность.
Разрабатываемая система WinTechSearcher предназначена для использования в качестве вспомогательного приложения при поиске компьютерного оборудования. При работе с системой пользователь производит запуск процессов поиска и просматривает сгенерированные отчеты. Для того, чтобы запустить процесс поиска необходимо указать название предмета поиска, ограничения на его характеристики, а также сайты компьютерного оборудования, на которых следует производить поиск. Результатом выполнения поиска является отчет, который содержит информацию о найденных предметах, характеристики которых удовлетворяют указанным пользователем ограничениям.
Для работы с определенным сайтом он должен быть зарегистрирован в системе в качестве источника информации. При такой регистрации необходима карта данного сайта, представляющая собой набор документов XML, в которых содержатся указания для системы о месторасположении и формате данных описывающих компьютерное оборудование.
Приложение является многопоточным, что позволяет пользователю вести несколько поисков одновременно. Структура системы WinTechSearcher изображена на рисунке 1.

Рис. 1 — Структура системы WinTechSearcher
Разработка проекта ведется в Microsoft Visual Studio 2008 SP1. Приложение использует библиотеки MFC 9, MSXML3, MSHTML.
Пользователями системы WinTechSearcher могут выступать предприятия, которым необходимо осуществить закупку компьютерного оборудования, консультанты компаний-дистрибьюторов и поставщиков оборудования, а также частные лица, которые планируют приобрести компьютерные комплектующие.
Одним из правил успешного менеджмента времени является делегирование как можно большего числа собственных проблем лицам, которые являются профессионалами в решении именно данного типа проблем. В процессе разработки системы WinTechSearcher автор стремится сделать ее профессионалом в получении информации, ее анализе и фильтрации.
Список литературы
-
Тактаев С. Поиск информации в компьютерных сетях: новые подходы // SearchEngines.ru — Энциклопедия поисковых систем. [Электронный ресурс] / Тактаев С. — Режим доступа: http://www.searchengines.ru/articles/004603.html
Информационный поиск // Материал из Википедии — свободной энциклопедии. [Электронный ресурс] / Режим доступа: http://ru.wikipedia.org/wiki/Информационный_поиск
Теория поиска информации [Электронный ресурс] / Режим доступа: http://download.yandex.ru/class/pechishev/lecture5.pdf
Практические методы поиска и анализа информации // Дистанционный консалтинг — Интернет в бизнесе. [Электронный ресурс] / Режим доступа: http://www.dist-cons.ru/modules/internet/index_02.htm
Солтер, Николас А., Клепер, Скотт Дж. С++ для профессионалов.: Пер. с англ. — М.: ООО «И. Д. Вильямс», 2006. — 912 с.
Reference (MFC Feature Pack) // MSDN Library. [Электронный ресурс] / Режим доступа: http://msdn.microsoft.com/ru-ru/library/bb983528(en-us).aspx