Реферат по теме выпускной работы
Содержание
- Введение
- 1. Актуальность темы
- 2. Цель и задачи исследования, планируемые результаты
- 3. Обзор исследований и разработок
- 3.1 Обзор международных источников
- 3.2 Обзор национальных источников
- 3.3 Обзор локальных источников
- 4. Методы оценки интерфейса интернет страниц и навигации в пределах страниц
- 4.1 Поиск шаблонов в поведении пользователей
- 4.2 Методы анализа юзабилити
- Выводы
- Список источников
Введение
На сегодняшний день множество различной информации представлено в мировой сети Интернет. Ежедневно к ней обращаются миллионы пользователей по всему миру. Информация в Интернет представляется в виде гипертекстовых документов – веб-страниц.
Интернет страницы обладают различным интерфейсом – совокупностью средств, при помощи которых пользователь взаимодействует со страницей. К сожалению, не все интернет страницы являются удобными в использовании и, следовательно, имеют меньше шансов стать успешными и востребованными пользователями. Такие страницы подлежат коррекции в направлении дизайна и навигации.
1. Актуальность темы
В настоящее время существует достаточно большое количество различных методов и сервисов для оценки интерфейса и навигации в пределах интернет страниц, однако не все из них являются качественными и достоверными.
К популярным сервисам статистики, данные которых могут быть использованы для анализа удобства навигации по интернет странице, относятся Google Analytics, Яндекс.Метрика, LiveInternet и др. Однако полученные такими средствами данные являются относительно поверхностными и нуждаются в более глубоком анализе.
Некоторые методы, основанные исключительно на экспертных оценках, не могут считаться абсолютно объективными. К тому же, такие методы не позволяют извлекать новые, неизвестные ранее знания из информации, представленной на интернет странице.
Таким образом, необходимо разработать новые алгоритмы оценки интерфейса и навигации в пределах интернет страниц с использованием методов интеллектуального анализа.
2. Цель и задачи исследования, планируемые результаты
Целью работы является исследование и анализ методов оценки интерфейса и навигации в пределах интернет страниц, разработка новых алгоритмов оценки методами интеллектуального анализа.
Основные задачи исследования:
- Рассмотреть методы интеллектуального анализа навигации в пределах интернет страниц.
- Изучить основные методики анализа данных при поиске шаблонов пользовательского поведения.
- Исследовать существующие методы анализа юзабилити интернет старниц, предложить подходы к их совместному использованию с методами интеллектуального анализа данных.
Объект исследования: интернет страница.
В рамках магистерской работы планируется исследовать методы оценки интерфейса и навигации в пределах интернет страниц с целью нахождения эффективного алгоритма.
3. Обзор исследований и разработок
3.1 Обзор международных источников
В Австралии исследованиями в области навигации в пределах интернет страниц занимается Квинслендский технологический университет [1].
В США подобные вопросы изучаются в Калифорнийском университете в Беркли [2].
В Греции разработками в сфере интеллектуального анализа навигации по интернет страницам занимаются ученые Myra Spiliopoulou, Lukas C. Faulstich, Karsten Winkler [3].
В Португалии исследования в данном направлении ведутся союзом двух ученых Jose Borges и Mark Levene [4].
В России вопросами разработки и оценки веб-интерфейсов и приложений занимаются В.В. Чернов [5], А.А. Сортов и А.В. Хорошилов [6].
3.2 Обзор национальных источников
В Украине подобными вопросами занимаются специалисты Харьковского национального университета радиоэлектроники [7], [8].
3.3 Обзор локальных источников
В Донецком национальном техническом университете проблемами интеллектуального анализа интернет страниц занимались нижеперечисленные магистры:
Пающик Юлия Валериевна «Анализ Интернет-трафика с использованием интеллектуального анализа данных». В магистерской работе рассмотрены методы анализа содержимого Интернет-страниц, предложена архитектура системы анализа содержимого Интернет-страниц, предусматривающая в дальнейшем прозрачную очистку Интернет-страниц перед их просмотром пользователями, что улучшает восприятие содержимого Интернет-страниц мобильными устройствами. Реализована подсистема доставки содержимого Интернет-страниц одновременно множеству пользователей в реальном времени [9].
Шинкаренко Валерия Сергеевна «Анализ аудитории и прогнозирование посещаемости интернет ресурса». В работе проводится анализ целевой аудитории интернет ресурса и нахождение зависимостей для прогнозирования и оценки посещения сайта и других параметров [10].
4. Методы оценки интерфейса интернет страниц и навигации в пределах страниц
При всей сложности компьютеров и других продуктов современной технологии «машинная» часть интерфейса «человек-машина» легче поддается пониманию, чем человеческая – намного более сложная и изменчивая. Многие факторы человеческой производительности не зависят от возраста, пола, культурного происхождения или уровня компетентности пользователя. Эти свойства человеческой производительности и способности к обучению имеют непосредственное отношение к основам разработки любого интерфейса [11].
В настоящее время с целью выявления общих закономерностей в Интернете активно применяется технология Web Mining. Данная технология охватывает методы интеллектуального анализа, которые способны на основе данных интернет ресурса обнаружить новые, ранее неизвестные знания для неструктурированной, неоднородной и распределенной информации, содержащейся на интернет страницах и которые в дальнейшем можно будет использовать на практике.
Существует несколько основных методов Web Mining с точки зрения решаемых задач и реализуемых подходов. Некоторые из них могут применяться для оценки интерфейса интернет страниц и навигации в пределах страниц.
4.1 Поиск шаблонов в поведении пользователей
Одним из методов Web Mining, направленных на анализ пользовательской навигации по интернет странице и, следовательно, на оценку качества интерфейса, является поиск шаблонов в поведении пользователей. Целью данного метода является поиск закономерностей в шаблонах взаимодействия пользователя с веб-ресурсом с целью прогнозирования его последующих действий. Анализируемые действия пользователей могут включать не только переходы по ссылкам, но и отправку форм, прокрутку страниц, добавление в избранные страницы и т.д. Найденные шаблоны используются в дальнейшем для оптимизации структуры сайта, изучения целевой аудитории и для прямого маркетинга.
Разработано множество подходов к решению задачи по выявлению знаний из шаблонов навигации пользователей (Jose Borges и Mark Levene "Data Mining of User Navigation Patterns", A. G. Buechner "Navigation Pattern Discovery from Internet Data").
С точки зрения применения алгоритмов интеллектуального анализа данных при поиске шаблонов пользовательского поведения чаще всего используются следующие методики (рис. 1):
- поиск ассоциации;
- анализ последовательностей;
- кластеризация последовательностей.
Ассоциации – поиск совместно запрашиваемых страниц, заказываемых товаров [12].
Поиск ассоциативных правил – ключевая тема в интеллектуальном анализе. В результате поиска обнаруживаются скрытые связи в, на первый взгляд, никак несвязанных данных. Эти связи – ассоциативные правила. Те правила, количество (поддержка) которых превышает определенный порог, считаются интересными. Примером такого правила, служит утверждение, что в том случае, если произошло событие А, то произойдет и событие В с вероятностью Х.
Транзакция – это множество событий, произошедших одновременно (групповая операция). События, произошедшие одновременно, называют элементами транзакций [13].
Пусть I = {i1, i2, i3, …in} – множество (набор) товаров, называемых элементами, а D – множество транзакций Т, где каждая из них является набором элементов из I, . Любая транзакция представляет собой бинарный вектор, где t[k] = 1, если ik элемент присутствует в ней, иначе t[k] = 0. Мы говорим, что транзакция T содержит X, некоторый набор элементов из I, если . Ассоциативным правилом называется импликация , где , и [14].
Анализ последовательностей – поиск последовательностей действий. Наиболее часто применяется вариант алгоритма Аpriori, разработанного для анализа частых наборов, но модифицированного для выявления частых фрагментов последовательностей и переходов [12].
Алгоритм Apriori – масштабируемый алгоритм поиска ассоциативных правил, базирующийся на методах интеллектуального анализа (Data Mining), предназначенный для обнаружения знаний в базах данных (рис. 2).
Правило AB имеет поддержку S (англ. support), если S% транзакций из D, содержат AB. Достоверность правила показывает, какова вероятность того, что из A следует B. Правило AB справедливо с достоверностью (англ. confidence) C, если С% транзакций из D, содержащих A, также содержат B,
conf(AB) = supp(AB)/supp(A).
Для применения алгоритма Apriori необходимо провести предобработку данных: во-первых, привести все данные к бинарному виду; во-вторых, изменить структуру данных.
Каждая запись соответствует транзакции: 1 – элемент присутствует в транзакции, и 0 – в противном случае [15].
Также интересен подход кластеризации последовательностей – поиск групп пользователей со схожими последовательностями действий. На первом этапе в этом подходе выделяются последовательности классифицированных действий пользователя, например, в рамках одной сессии. Затем подсчитываются частоты переходов между различными действиями для составления Марковской цепи заданного порядка. На заключительном этапе полученные Марковские цепи кластеризуются для выявления групп с похожими частотами переходов. Для прогнозирования следующего действия пользователя сначала на основании истории его действий в рамках сессии определяется группа, к которой он принадлежит с наибольшей вероятностью. Затем определяется действие, которое выполняется с наибольшей вероятностью в этой группе с учетом последних действий данного пользователя. Для реализации такого анализа можно, например, использовать алгоритм Microsoft Sequential Clustering, входящий в Microsoft Analysis Services 2012.
На рис. 3 изображена структура модели кластеризации последовательностей службы Microsoft Analysis Services.
Таким образом, в области оценки навигации по интернет странице Web Mining решает следующие задачи:
- определение типичных сессий и навигационных путей пользователей сайта (анализ последовательностей, ассоциативных правил);
- нахождение зависимостей при пользовании услугами сайта (поиск ассоциативных правил, кластеризация последовательностей) [12].
4.2 Методы анализа юзабилити
На сегодняшний день удобство использования ресурса – юзабилити интернет страницы – это один из ключевых моментов при работе с поведенческими факторами. Сайт, учитывающий правила web-юзабилити, лучше воспринимается пользователем.
Работа с юзабилити направлена на повышение удобства пребывания пользователя на сайте. Удобство, в свою очередь, неразрывно связано со всеми аспектами сайта, как:
- текстовое наполнение;
- форматирование текстов;
- наличие и логика работы функциональных элементов;
- расположение функциональных элементов по отношению друг к другу;
- возможность упрощения работы пользователя с функциональными элементами;
- дизайн ресурса и т.д.
Работу по оценке юзабилити сайта следует начинать еще при создании сайта, однако если проект уже запущен, проведение анализа юзабилити тоже является возможным.
Существует несколько вариантов анализа юзабилити сайта:
- Анализ статистики при помощи сервисов Яндекс.Метрики, Google Analytics и др.
Счетчики устанавливаются на сайте, данные предоставляются бесплатно – таким образом, это один из самых доступных вариантов анализа юзабилити. Можно провести сравнительный анализ статистики похожих сайтов, если есть соответствующий доступ. К основным минусам данного метода можно отнести недостаточный объем данных и поверхностность выводов без более глубокого анализа.
- Работа с отзывами посетителей.
На сайтах размещают формы голосования и обратной связи. Если какие-либо элементы сайта вызовут у пользователей негативное отношение, они смогут его высказать. Реализовать форму обратной связи на сайте и обработать полученные отзывы несложно, главное – периодически отслеживать мнения посетителей. Минусом метода является то, что в отзывах будут указаны только основные, поверхностные ошибки, присутствующие на сайте.
- Тестирование юзабилити сайта.
Способ подходит, если есть сомнения в успехе нововведений на сайте. Для тестирования страниц можно использовать специальный инструмент от Google – Оптимизатор web-сайтов – и фокус-группы. Необходимо подобрать людей и дать им заранее подготовленное задание по достижению цели сайта. Группа разделяется на две части, и каждая работает со своим вариантом сайта. За действиями участников эксперимента ведется наблюдение, по результатам которого затем делается вывод о том, какой вариант сайта наиболее удобен. Плюсом метода можно считать идеальный выбор между двумя вариантами, статистически подтвержденный. Минус в том, что необходимо сформировать и мотивировать фокус-группу.
- Наблюдение за действиями посетителей.
Данный метод позволяет собирать фокус-группы, обозначать разные задания для них и охватывать любые целевые аудитории, в том числе и смешанные. Для наблюдения можно также воспользоваться инструментом Вебвизор, представленным в Яндекс.Метрике. Вебвизор записывает все действия посетителей на сайте. Достоинства данного метода: большой объем данных для анализа, различные варианты выводов, четкая целевая группа, возможность бесплатного анализа и др. Минусом может являться отсутствие наблюдательского опыта: нужно видеть, что именно мешает посетителю достичь цели, и правильно находить решения проблем [16].
Вышеперечисленные методы не могут быть отнесены к методам интеллектуального анализа юзабилити интернет страниц. Однако в перспективе возможно совместное использование некоторых методов анализа юзабилити и методов интеллектуального анализа, в частности, поиска шаблонов пользовательской навигации.
Например, на данный момент анализ юзабилити на основе данных из отчетов сервисов анализа статистики проводится вручную. В будущем же такая процедура может стать автоматизированной. Такую же методику можно применять и для наблюдения за действиями посетителей. Данные подходы помогут полностью автоматизировать процесс анализа юзабилити.
Выводы
Множество существующих методов оценки интерфейса интернет страниц являются необъективными или поверхностными. С целью улучшения анализа интерфейса и навигации по интернет странице необходимо создать подходы, основанные на применении методов интеллектуального анализа и позволяющие качественно анализировать и извлекать новую полезную информацию из данных интернет страниц.
В данной работе был рассмотрен один из методов Web Mining – поиск шаблонов в поведении пользователей, – результаты которого могут быть использованы для оптимизации структуры сайта.
Также были изучены некоторые варианты анализа юзабилити сайта, которые могут быть использованы совместно с методами интеллектуального анализа для более качественной оценки.
В дальнейшей работе планируется разработка алгоритмов оценки интерфейса интернет страниц и навигации в пределах страниц методами интеллектуального анализа.
Список источников
- Yue Xu. Mining for User Navigation Patterns Based on Page Contents [Электронный ресурс] – Режим доступа: www/ URL: http://www2.cs.uregina.ca/~wss/wss03/03/wss03-127.pdf
- Melody Yvette Ivory. An Empirical Foundation for Automated Web Interface Evaluation [Электронный ресурс] – Режим доступа: www/ URL: http://webtango.berkeley.edu/papers/thesis/thesis.pdf
- Myra Spiliopoulou, Lukas C. Faulstich, Karsten Winkler. A Data Miner analyzing the Navigational Behaviour of Web Users [Электронный ресурс] – Режим доступа: www/ URL: http://www.hhl.info/fileadmin/LS/micro/Download/Spiliopoulou_1999_ADataMiner.
pdf - Jose Borges, Mark Levene. Data Mining of User Navigation Patterns [Электронный ресурс] – Режим доступа: www/ URL: http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.23.484
- Чернов В.В. К проблеме разработки веб-интерфейсов [Электронный ресурс] – Режим доступа: www/ URL: http://www.rae.ru/fs/pdf/2012/11-2/30559.pdf
- Сортов А.А., Хорошилов А.В. Функциональное тестирование Web-приложений на основе технологии UniTesK [Электронный ресурс] – Режим доступа: www/ URL: http://ispras.ru/ru/proceedings/docs/2004/8/1/isp_2004_8_1_77.pdf
- Почанский О.М. Применение структурных характеристик web-документов при оценивании их привлекательности для конечного пользователя [Электронный ресурс] – Режим доступа: www/ URL: http://archive.nbuv.gov.ua/portal/Natural/SOI/2011_4/pochan.pdf
- Егорова И.Н., Истомина А.А. Исследование возможностей веб-аналитики [Электронный ресурс] – Режим доступа: www/ URL: http://journals.uran.ua/index.php/1729-3774/article/viewFile/3917/3585
- Пающик Ю.В., – Анализ Интернет-трафика с использованием интеллектуального анализа данных [Электронный ресурс] – Режим доступа: www/ URL: http://masters.donntu.ru/2012/fknt/paushchik/diss/index.htm
- Шинкаренко В.С., – Анализ аудитории и прогнозирование посещаемости интернет ресурса [Электронный ресурс] – Режим доступа: www/ URL: http://www.masters.donntu.ru/2006/fvti/shynkarenko/diss/
- Раскин Джефф. Интерфейс: новые направления в проектировании компьютерных систем / Джефф Раскин. – М.: Символ-Плюс, 2005. – 272 с.
- Web Mining: интеллектуальный анализ данных в сети Internet [Электронный ресурс] – Режим доступа: www/ URL: https://sites.google.com/site/upravlenieznaniami/tehnologii-upravlenia-znaniami/text-mining-web-mining/web-mining
- Анализ данных методом ассоциативных правил. Алгоритм Аpriori [Электронный ресурс] – Режим доступа: www/ URL: http://www.drupal-site.com/analiz-dannyh-metodom-associativnyh-pravil-algoritm-apriori
- Вильчинская О.С., Тесленко И.В. Извлечение многоуровневых ассоциативных правил из больших баз данных [Электронный ресурс] – Режим доступа: www/ URL: http://archive.nbuv.gov.ua/portal/natural/vejpt/2006_3_3/EEJET_3_3_2006_27-31.pdf
- Алгоритм для поиска ассоциативных правил [Электронный ресурс] – Режим доступа: www/ URL: http://www.drupal-site.com/algoritm-dlya-poiska-associativnyh-pravil
- Юзабилити сайта – анализ, оценка и тестирование [Электронный ресурс] – Режим доступа: www/ URL: http://www.sembook.ru/book/povyshenie-konversii-sayta/yuzabiliti-sayta/