Портал магистров
ДонНТУ   Портал магистров

Реферат по теме выпускной работы

Содержание

Введение

На сегодняшний день множество различной информации представлено в мировой сети Интернет. Ежедневно к ней обращаются миллионы пользователей по всему миру. Информация в Интернет представляется в виде гипертекстовых документов – веб-страниц.

Интернет страницы обладают различным интерфейсом – совокупностью средств, при помощи которых пользователь взаимодействует со страницей. К сожалению, не все интернет страницы являются удобными в использовании и, следовательно, имеют меньше шансов стать успешными и востребованными пользователями. Такие страницы подлежат коррекции в направлении дизайна и навигации.

1. Актуальность темы

В настоящее время существует достаточно большое количество различных методов и сервисов для оценки интерфейса и навигации в пределах интернет страниц, однако не все из них являются качественными и достоверными.

К популярным сервисам статистики, данные которых могут быть использованы для анализа удобства навигации по интернет странице, относятся Google Analytics, Яндекс.Метрика, LiveInternet и др. Однако полученные такими средствами данные являются относительно поверхностными и нуждаются в более глубоком анализе.

Некоторые методы, основанные исключительно на экспертных оценках, не могут считаться абсолютно объективными. К тому же, такие методы не позволяют извлекать новые, неизвестные ранее знания из информации, представленной на интернет странице.

Таким образом, необходимо разработать новые алгоритмы оценки интерфейса и навигации в пределах интернет страниц с использованием методов интеллектуального анализа.

2. Цель и задачи исследования, планируемые результаты

Целью работы является исследование и анализ методов оценки интерфейса и навигации в пределах интернет страниц, разработка новых алгоритмов оценки методами интеллектуального анализа.

Основные задачи исследования:

  1. Рассмотреть методы интеллектуального анализа навигации в пределах интернет страниц.
  2. Изучить основные методики анализа данных при поиске шаблонов пользовательского поведения.
  3. Исследовать существующие методы анализа юзабилити интернет старниц, предложить подходы к их совместному использованию с методами интеллектуального анализа данных.

Объект исследования: интернет страница.

В рамках магистерской работы планируется исследовать методы оценки интерфейса и навигации в пределах интернет страниц с целью нахождения эффективного алгоритма.

3. Обзор исследований и разработок

3.1 Обзор международных источников

В Австралии исследованиями в области навигации в пределах интернет страниц занимается Квинслендский технологический университет [1].

В США подобные вопросы изучаются в Калифорнийском университете в Беркли [2].

В Греции разработками в сфере интеллектуального анализа навигации по интернет страницам занимаются ученые Myra Spiliopoulou, Lukas C. Faulstich, Karsten Winkler [3].

В Португалии исследования в данном направлении ведутся союзом двух ученых Jose Borges и Mark Levene [4].

В России вопросами разработки и оценки веб-интерфейсов и приложений занимаются В.В. Чернов [5], А.А. Сортов и А.В. Хорошилов [6].

3.2 Обзор национальных источников

В Украине подобными вопросами занимаются специалисты Харьковского национального университета радиоэлектроники [7], [8].

3.3 Обзор локальных источников

В Донецком национальном техническом университете проблемами интеллектуального анализа интернет страниц занимались нижеперечисленные магистры:

Пающик Юлия Валериевна «Анализ Интернет-трафика с использованием интеллектуального анализа данных». В магистерской работе рассмотрены методы анализа содержимого Интернет-страниц, предложена архитектура системы анализа содержимого Интернет-страниц, предусматривающая в дальнейшем прозрачную очистку Интернет-страниц перед их просмотром пользователями, что улучшает восприятие содержимого Интернет-страниц мобильными устройствами. Реализована подсистема доставки содержимого Интернет-страниц одновременно множеству пользователей в реальном времени [9].

Шинкаренко Валерия Сергеевна «Анализ аудитории и прогнозирование посещаемости интернет ресурса». В работе проводится анализ целевой аудитории интернет ресурса и нахождение зависимостей для прогнозирования и оценки посещения сайта и других параметров [10].

4. Методы оценки интерфейса интернет страниц и навигации в пределах страниц

При всей сложности компьютеров и других продуктов современной технологии «машинная» часть интерфейса «человек-машина» легче поддается пониманию, чем человеческая – намного более сложная и изменчивая. Многие факторы человеческой производительности не зависят от возраста, пола, культурного происхождения или уровня компетентности пользователя. Эти свойства человеческой производительности и способности к обучению имеют непосредственное отношение к основам разработки любого интерфейса [11].

В настоящее время с целью выявления общих закономерностей в Интернете активно применяется технология Web Mining. Данная технология охватывает методы интеллектуального анализа, которые способны на основе данных интернет ресурса обнаружить новые, ранее неизвестные знания для неструктурированной, неоднородной и распределенной информации, содержащейся на интернет страницах и которые в дальнейшем можно будет использовать на практике.

Существует несколько основных методов Web Mining с точки зрения решаемых задач и реализуемых подходов. Некоторые из них могут применяться для оценки интерфейса интернет страниц и навигации в пределах страниц.

4.1 Поиск шаблонов в поведении пользователей

Одним из методов Web Mining, направленных на анализ пользовательской навигации по интернет странице и, следовательно, на оценку качества интерфейса, является поиск шаблонов в поведении пользователей. Целью данного метода является поиск закономерностей в шаблонах взаимодействия пользователя с веб-ресурсом с целью прогнозирования его последующих действий. Анализируемые действия пользователей могут включать не только переходы по ссылкам, но и отправку форм, прокрутку страниц, добавление в избранные страницы и т.д. Найденные шаблоны используются в дальнейшем для оптимизации структуры сайта, изучения целевой аудитории и для прямого маркетинга.

Разработано множество подходов к решению задачи по выявлению знаний из шаблонов навигации пользователей (Jose Borges и Mark Levene "Data Mining of User Navigation Patterns", A. G. Buechner "Navigation Pattern Discovery from Internet Data").

С точки зрения применения алгоритмов интеллектуального анализа данных при поиске шаблонов пользовательского поведения чаще всего используются следующие методики (рис. 1):

  • поиск ассоциации;
  • анализ последовательностей;
  • кластеризация последовательностей.
Рисунок 1 – Метод поиска шаблонов в поведении пользователей

Рисунок 1 – Метод поиска шаблонов в поведении пользователей

Ассоциации – поиск совместно запрашиваемых страниц, заказываемых товаров [12].

Поиск ассоциативных правил – ключевая тема в интеллектуальном анализе. В результате поиска обнаруживаются скрытые связи в, на первый взгляд, никак несвязанных данных. Эти связи – ассоциативные правила. Те правила, количество (поддержка) которых превышает определенный порог, считаются интересными. Примером такого правила, служит утверждение, что в том случае, если произошло событие А, то произойдет и событие В с вероятностью Х.

Транзакция – это множество событий, произошедших одновременно (групповая операция). События, произошедшие одновременно, называют элементами транзакций [13].

Пусть I = {i1, i2, i3, …in} – множество (набор) товаров, называемых элементами, а D – множество транзакций Т, где каждая из них является набором элементов из I, . Любая транзакция представляет собой бинарный вектор, где t[k] = 1, если ik элемент присутствует в ней, иначе t[k] = 0. Мы говорим, что транзакция T содержит X, некоторый набор элементов из I, если . Ассоциативным правилом называется импликация , где , и [14].

Анализ последовательностей – поиск последовательностей действий. Наиболее часто применяется вариант алгоритма Аpriori, разработанного для анализа частых наборов, но модифицированного для выявления частых фрагментов последовательностей и переходов [12].

Алгоритм Apriori – масштабируемый алгоритм поиска ассоциативных правил, базирующийся на методах интеллектуального анализа (Data Mining), предназначенный для обнаружения знаний в базах данных (рис. 2).

Рисунок 2 – Алгоритм Apriori

Рисунок 2 – Алгоритм Apriori
(анимация: 8 кадров, 6 циклов повторения, 12,8 килобайт)

Правило AB имеет поддержку S (англ. support), если S% транзакций из D, содержат AB. Достоверность правила показывает, какова вероятность того, что из A следует B. Правило AB справедливо с достоверностью (англ. confidence) C, если С% транзакций из D, содержащих A, также содержат B,
conf(AB) = supp(AB)/supp(A).

Для применения алгоритма Apriori необходимо провести предобработку данных: во-первых, привести все данные к бинарному виду; во-вторых, изменить структуру данных.

Каждая запись соответствует транзакции: 1 – элемент присутствует в транзакции, и 0 – в противном случае [15].

Также интересен подход кластеризации последовательностей – поиск групп пользователей со схожими последовательностями действий. На первом этапе в этом подходе выделяются последовательности классифицированных действий пользователя, например, в рамках одной сессии. Затем подсчитываются частоты переходов между различными действиями для составления Марковской цепи заданного порядка. На заключительном этапе полученные Марковские цепи кластеризуются для выявления групп с похожими частотами переходов. Для прогнозирования следующего действия пользователя сначала на основании истории его действий в рамках сессии определяется группа, к которой он принадлежит с наибольшей вероятностью. Затем определяется действие, которое выполняется с наибольшей вероятностью в этой группе с учетом последних действий данного пользователя. Для реализации такого анализа можно, например, использовать алгоритм Microsoft Sequential Clustering, входящий в Microsoft Analysis Services 2012.

На рис. 3 изображена структура модели кластеризации последовательностей службы Microsoft Analysis Services.

Рисунок 3 – Структура модели кластеризации последовательностей службы Microsoft Analysis Services

Рисунок 3 – Структура модели кластеризации последовательностей службы Microsoft Analysis Services

Таким образом, в области оценки навигации по интернет странице Web Mining решает следующие задачи:

  • определение типичных сессий и навигационных путей пользователей сайта (анализ последовательностей, ассоциативных правил);
  • нахождение зависимостей при пользовании услугами сайта (поиск ассоциативных правил, кластеризация последовательностей) [12].

4.2 Методы анализа юзабилити

На сегодняшний день удобство использования ресурса – юзабилити интернет страницы – это один из ключевых моментов при работе с поведенческими факторами. Сайт, учитывающий правила web-юзабилити, лучше воспринимается пользователем.

Работа с юзабилити направлена на повышение удобства пребывания пользователя на сайте. Удобство, в свою очередь, неразрывно связано со всеми аспектами сайта, как:

  • текстовое наполнение;
  • форматирование текстов;
  • наличие и логика работы функциональных элементов;
  • расположение функциональных элементов по отношению друг к другу;
  • возможность упрощения работы пользователя с функциональными элементами;
  • дизайн ресурса и т.д.

Работу по оценке юзабилити сайта следует начинать еще при создании сайта, однако если проект уже запущен, проведение анализа юзабилити тоже является возможным.

Существует несколько вариантов анализа юзабилити сайта:

  1. Анализ статистики при помощи сервисов Яндекс.Метрики, Google Analytics и др.

    Счетчики устанавливаются на сайте, данные предоставляются бесплатно – таким образом, это один из самых доступных вариантов анализа юзабилити. Можно провести сравнительный анализ статистики похожих сайтов, если есть соответствующий доступ. К основным минусам данного метода можно отнести недостаточный объем данных и поверхностность выводов без более глубокого анализа.

  2. Работа с отзывами посетителей.

    На сайтах размещают формы голосования и обратной связи. Если какие-либо элементы сайта вызовут у пользователей негативное отношение, они смогут его высказать. Реализовать форму обратной связи на сайте и обработать полученные отзывы несложно, главное – периодически отслеживать мнения посетителей. Минусом метода является то, что в отзывах будут указаны только основные, поверхностные ошибки, присутствующие на сайте.

  3. Тестирование юзабилити сайта.

    Способ подходит, если есть сомнения в успехе нововведений на сайте. Для тестирования страниц можно использовать специальный инструмент от Google – Оптимизатор web-сайтов – и фокус-группы. Необходимо подобрать людей и дать им заранее подготовленное задание по достижению цели сайта. Группа разделяется на две части, и каждая работает со своим вариантом сайта. За действиями участников эксперимента ведется наблюдение, по результатам которого затем делается вывод о том, какой вариант сайта наиболее удобен. Плюсом метода можно считать идеальный выбор между двумя вариантами, статистически подтвержденный. Минус в том, что необходимо сформировать и мотивировать фокус-группу.

  4. Наблюдение за действиями посетителей.

    Данный метод позволяет собирать фокус-группы, обозначать разные задания для них и охватывать любые целевые аудитории, в том числе и смешанные. Для наблюдения можно также воспользоваться инструментом Вебвизор, представленным в Яндекс.Метрике. Вебвизор записывает все действия посетителей на сайте. Достоинства данного метода: большой объем данных для анализа, различные варианты выводов, четкая целевая группа, возможность бесплатного анализа и др. Минусом может являться отсутствие наблюдательского опыта: нужно видеть, что именно мешает посетителю достичь цели, и правильно находить решения проблем [16].

Вышеперечисленные методы не могут быть отнесены к методам интеллектуального анализа юзабилити интернет страниц. Однако в перспективе возможно совместное использование некоторых методов анализа юзабилити и методов интеллектуального анализа, в частности, поиска шаблонов пользовательской навигации.

Например, на данный момент анализ юзабилити на основе данных из отчетов сервисов анализа статистики проводится вручную. В будущем же такая процедура может стать автоматизированной. Такую же методику можно применять и для наблюдения за действиями посетителей. Данные подходы помогут полностью автоматизировать процесс анализа юзабилити.

Выводы

Множество существующих методов оценки интерфейса интернет страниц являются необъективными или поверхностными. С целью улучшения анализа интерфейса и навигации по интернет странице необходимо создать подходы, основанные на применении методов интеллектуального анализа и позволяющие качественно анализировать и извлекать новую полезную информацию из данных интернет страниц.

В данной работе был рассмотрен один из методов Web Mining – поиск шаблонов в поведении пользователей, – результаты которого могут быть использованы для оптимизации структуры сайта.

Также были изучены некоторые варианты анализа юзабилити сайта, которые могут быть использованы совместно с методами интеллектуального анализа для более качественной оценки.

В дальнейшей работе планируется разработка алгоритмов оценки интерфейса интернет страниц и навигации в пределах страниц методами интеллектуального анализа.

Список источников

  1. Yue Xu. Mining for User Navigation Patterns Based on Page Contents [Электронный ресурс] – Режим доступа: www/ URL: http://www2.cs.uregina.ca/~wss/wss03/03/wss03-127.pdf
  2. Melody Yvette Ivory. An Empirical Foundation for Automated Web Interface Evaluation [Электронный ресурс] – Режим доступа: www/ URL: http://webtango.berkeley.edu/papers/thesis/thesis.pdf
  3. Myra Spiliopoulou, Lukas C. Faulstich, Karsten Winkler. A Data Miner analyzing the Navigational Behaviour of Web Users [Электронный ресурс] – Режим доступа: www/ URL: http://www.hhl.info/fileadmin/LS/micro/Download/Spiliopoulou_1999_ADataMiner.
    pdf
  4. Jose Borges, Mark Levene. Data Mining of User Navigation Patterns [Электронный ресурс] – Режим доступа: www/ URL: http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.23.484
  5. Чернов В.В. К проблеме разработки веб-интерфейсов [Электронный ресурс] – Режим доступа: www/ URL: http://www.rae.ru/fs/pdf/2012/11-2/30559.pdf
  6. Сортов А.А., Хорошилов А.В. Функциональное тестирование Web-приложений на основе технологии UniTesK [Электронный ресурс] – Режим доступа: www/ URL: http://ispras.ru/ru/proceedings/docs/2004/8/1/isp_2004_8_1_77.pdf
  7. Почанский О.М. Применение структурных характеристик web-документов при оценивании их привлекательности для конечного пользователя [Электронный ресурс] – Режим доступа: www/ URL: http://archive.nbuv.gov.ua/portal/Natural/SOI/2011_4/pochan.pdf
  8. Егорова И.Н., Истомина А.А. Исследование возможностей веб-аналитики [Электронный ресурс] – Режим доступа: www/ URL: http://journals.uran.ua/index.php/1729-3774/article/viewFile/3917/3585
  9. Пающик Ю.В., – Анализ Интернет-трафика с использованием интеллектуального анализа данных [Электронный ресурс] – Режим доступа: www/ URL: http://masters.donntu.ru/2012/fknt/paushchik/diss/index.htm
  10. Шинкаренко В.С., – Анализ аудитории и прогнозирование посещаемости интернет ресурса [Электронный ресурс] – Режим доступа: www/ URL: http://www.masters.donntu.ru/2006/fvti/shynkarenko/diss/
  11. Раскин Джефф. Интерфейс: новые направления в проектировании компьютерных систем / Джефф Раскин. – М.: Символ-Плюс, 2005. – 272 с.
  12. Web Mining: интеллектуальный анализ данных в сети Internet [Электронный ресурс] – Режим доступа: www/ URL: https://sites.google.com/site/upravlenieznaniami/tehnologii-upravlenia-znaniami/text-mining-web-mining/web-mining
  13. Анализ данных методом ассоциативных правил. Алгоритм Аpriori [Электронный ресурс] – Режим доступа: www/ URL: http://www.drupal-site.com/analiz-dannyh-metodom-associativnyh-pravil-algoritm-apriori
  14. Вильчинская О.С., Тесленко И.В. Извлечение многоуровневых ассоциативных правил из больших баз данных [Электронный ресурс] – Режим доступа: www/ URL: http://archive.nbuv.gov.ua/portal/natural/vejpt/2006_3_3/EEJET_3_3_2006_27-31.pdf
  15. Алгоритм для поиска ассоциативных правил [Электронный ресурс] – Режим доступа: www/ URL: http://www.drupal-site.com/algoritm-dlya-poiska-associativnyh-pravil
  16. Юзабилити сайта – анализ, оценка и тестирование [Электронный ресурс] – Режим доступа: www/ URL: http://www.sembook.ru/book/povyshenie-konversii-sayta/yuzabiliti-sayta/