Таксономия и как она поможет сделать жизнь лучше

Better Living Through Taxonomies

Автор: Heather Hedden

Источник: Digital Web Magazine

ВСТУПЛЕНИЕ

Фундаментальной проблемой управления содержимого является создание универсальной системы классификации содержимого, которая позволяла бы классифицировать информационные единицы таким образом, чтобы эту систему можно было интегрировать в другие системы.

С другой стороны, такая система классификаций должна позволять редактировать информационную архитектуру веб-сайта, реализующую удобную навигацию и поиск.

На сегодняшний день, наиболее эффективной моделью классификации содержимого, является таксономия.

Таксономия и как она поможет сделать жизнь лучше

 

Что такое таксономия?

Существуют различные виды таксономий и различные определения этого термина. Часто таксономия представляется как древовидная иерархия терминов, использующихся для классификации объектов (например, растений или животных). Первоначально слово «таксономия» обозначало науку о классификации вещей, но со временем оно стало применяться к любой системе классификации или категоризации. Сейчас мы уже не говорим о таксономии как о науке – под термином таксономия понимается тип управляемого словаря, имеющего иерархическую структуру. В таксономии дочерние элементы входят в широкие родительские элементы.

Пример иерархии элементов:

            Компьютеры и интернет

                        Программное обеспечение

                                   Программы для интернета

                                               Программы для WWW

                                                           HTML-редакторы

Словари

Таксономия, оперирует такими сущностями, как управляемые словари.

Управляемый словарь, это ограниченный список слов и терминов, используемых для индексации и категоризации. Большинство управляемых словарей имеют дополнительные ссылки, указывающие с непредпочтительных. Цель управляемого словаря – обеспечение последовательности при индексации, категоризации и направление пользователя при поиске на нужную информацию.

Различные виды таксономий и управляемых словарей известны под различными названиями.

Если управляемый словарь представляет собой только перечень терминов с их синонимами и ни один из синонимов не назначается предпочтительным, то он называется кольцом синонимов.

Более сложный управляемый словарь с иерархической структурой (общие термины / конкретные термины), со связями и зависимостями между терминами называется тезаурус.

Сложные тезаурусы с настраиваемыми семантическими связями, такими как «находится в», «используется для», «является членом», «принадлежит» известны как онтологии.

В последнее время слово таксономия стало часто использоваться для обозначения любых управляемых словарей и систем классификации, будь то простой глоссарий или хорошо структурированная онтология. Таким образом таксономия – это иерархическая система классификации или управляемый словарь. И то и другое может оказаться полезным для улучшения навигации и качества поиска по сайту.

 

Иерархия и информационная архитектура

Люди «серфят» по интернету, вместо того, чтобы читать все в одном месте; основные идеи, обзоры, резюме располагаются на страницах верхнего уровня, более подробная и конкретная информация расположена на страницах более низкого уровня. Информационная архитектура сайтов принимает иерархический формат с главной страницей, ветвлением от главной страницы к внутренним, образуя, таким образом, перевернутую древовидную структуру. Такая структура находит отражение в меню, содержащих пункты второго уровня, раскрывающихся меню и в картах сайтов.

 

Разумеется, что разработка хорошей иерархической структуры имеет важное значение для создания сайтов с хорошим дизайном и удобной навигацией и хорошая CMS должна предоставлять возможности для этого.

Технология таксономии позволяет выстраивать иерархию содержимого.

ПРИМЕР ПОСТОРЕНИЯ ИЕРАРХИИ В ТЕРМИНАХ ТАКСОНОМИИ

 

Управляемые словари и удобство поиска по Сайту

Другое применение таксономии в цифровой среде – повышение удобства поиска. Названия терминов и понятий должны быть тщательно проанализированы. Термины должны быть однозначными, но в то же время выдержаны в одном стиле. Названия категорий должны быть краткими, чтобы их можно было включать в меню. Термины, использующиеся в меню, должны использоваться в заголовках и других местах на сайте – такая последовательность составляет основу навигации по сайту.

Когда мы говорим о поиске, мы, вероятно, подразумеваем поисковый движок. Для многих из нас работа поисковой системы остается математической загадкой – существуют алгоритмы, учитывающие частоты, близость слов и фраз, но часто все сводится к тому, чтобы введенные пользователем слова присутствовали на странице. Однако, если для поиска используются синонимы (например, «машина» вместо «автомобиль»), часть нужных страниц будет утеряна. В этом случае таксономия типа кольца синонимов может существенно улучшить результаты поиска. Вместо того, чтобы просто искать слова из введенного пользователем запроса, поисковая система сначала разобьет его на слова или фразы, найдет для них синонимы и уже с учетом этого будет искать страницы. При этом, никакого кольца синонимов пользователь не увидит.

Некоторые высококлассные поисковые движки могут поставляться со встроенной функцией создания таксономии, но – за исключением небольшого числа специфических движков – движки редко поставляются со встроенной таксономией. Но даже простейшие движки, в том числе и бесплатные, позволяют настроить поиск в целевых областях (например, ключевые слова или мета-теги). Если вы настроите поисковый движок для поиска только по ключевым словам, а не по полным текстам, и убедитесь, что все страницы правильно помечены ключевыми словами, вы сможете воспользоваться всеми преимуществами таксономии.

Особо эффективной, для поиска является модель таксономии, которая поддерживает запросы одновременно по нескольким параметрам (например, по действию, продукту и расположению).

Какие типы сайтов потенциальные кандидаты для использования таксономии?

При разработке любого сайта можно извлечь пользу из данной технологии, хотя для небольших сайтов сложные таксономии не нужны. При создании же крупных сайтов, например, внутренних порталов крупных диверсифицированных компаний, правительственных учреждений, университетов использование таксономии становиться необходимым. Сайты, которые содержат большие наборы статей, изображений или других данных, также могут улучшить поиск с помощью таксономии.

 

Сайты электронной коммерции, на которых все продукты разбиты по категориям, прекрасные кандидаты для использования фасетной таксономии (или фасетной классификации). Признаками будут различные характеристики продукта – тип, назначение, на каких покупателей ориентирован, ценовая категория, цвет, размер и т.д. Пользователь выбирает значимые для него характеристики, задает по ним ограничения и получает список результатов, соответствующих указанным требованиям.

Сайты, ориентированные на работу с пользователями, для которых не подходит единая система классификации, могут использовать отдельные таксономии для каждой категории, как, например, на сайте Verizon Superpages:

 

 

Как создается таксономия?

Хотя многие системы управления контентом и поисковые движки поддерживают возможность интеграции таксономии, большинство из них не содержит достаточно функций для создания и управления таксономией в рамках самой системы. Обычно, таксономия собирается с помощью отдельных инструментов и потом интегрируется в CMS или приисковую систему.

Для небольшой таксономии можно создать список терминов в Excel, а затем импортировать его. Но для более сложных систем нужны инструменты, поддерживающие несколько синонимов для каждого термина, связи между терминами, определения терминов, атрибуты и категории терминов.

Доступные настольные инструменты для создания таксономии или тезауруса, которые могут экспортировать сложные таксономии в XML и HTML это MultiTes, Webchoir TCS-10, и Term Tree 2000. Более продвинутые системы поддерживают многопользовательскую работу, создание распределенной таксономии, функции индексирования; это Synaptica, WordMap, SchemaLogic, и Thesaurus Master. Наконец, есть поисковые системы с функциями автоматической классификации и составления таксономии.

Использование программного обеспечения само по себе не приведет к созданию полезной таксономии, также как хороший HTML-редактор не гарантирует, что получится хороший сайт. Создание хорошей таксономии требует дополнительных навыков и знаний в области классификации. Наиболее походящими знаниями для создания таксономии являются люди, связанные с работой в библиотеках, работой с информацией или имеющие опыт по созданию тезаурусов.

Заключение

На основе CMS, использующей технологию таксономии для категоризации содержимого, можно создавать сайты практически любой информационной архитектуры, при высоком качестве поиска необходимой информации и возможности различного представления информация для разных пользователей.   

Оригинал статьи: http://www.digital-web.com/articles/better_living_through_taxonomies/.

 
ДонНТУ  >  Портал магистров ДонНТУ  >  Главная  |  Реферат  |  Библиотека  |  Ссылки  |  Отчет о поиске  |  Индивидуальное задание
RUS  |  UKR  |  ENG