Реферат за темою випускної роботи
Зміст
- Вступ
- 1. Актуальність теми
- 2. Мета і задачі дослідження та заплановані результати
- 3. Огляд досліджень та розробок
- 3.1 Огляд міжнародних джерел
- 3.2 Огляд національних джерел
- 3.3 Огляд локальних джерел
- 4. Методи оцінки інтерфейсу інтернет сторінок і навігації в межах сторінок
- 4.1 Пошук шаблонів в поведінці користувачів
- 4.2 Методи аналізу юзабіліті
- Висновки
- Перелік посилань
Вступ
На сьогодні безліч різноманітної інформації представлена у світовій мережі Інтернет. Щодня до неї звертаються мільйони користувачів по всьому світу. Інформація в Інтернет подається у вигляді гіпертекстових документів – веб-сторінок.
Інтернет сторінки мають різний інтерфейс – сукупність засобів, за допомогою яких користувач взаємодіє зі сторінкою. На жаль, не всі інтернет сторінки є зручними у використанні і, отже, мають менше шансів стати успішними і потрібними користувачам. Такі сторінки підлягають корекції в напрямку дизайну та навігації.
1. Актуальність теми
На даний час існує досить велика кількість різних методів і сервісів для оцінки інтерфейсу і навігації в межах інтернет сторінок, однак не всі з них є якісними і достовірними.
До популярних сервісів статистики, дані яких можуть бути використані для аналізу зручності навігації по інтернет сторінці, відносяться Google Analytics, Яндекс.Метрика, LiveInternet та ін. Однак отримані такими засобами дані є відносно поверхневими і потребують більш глибокого аналізу.
Деякі методи, засновані виключно на експертних оцінках, не можуть вважатися абсолютно об'єктивними. До того ж, такі методи не дозволяють вилучати нові, невідомі раніше знання з інформації, представленої на інтернет сторінці.
Таким чином, необхідно розробити нові алгоритми оцінки інтерфейсу і навігації в межах інтернет сторінок з використанням методів інтелектуального аналізу.
2. Мета і задачі дослідження та заплановані результати
Метою роботи є дослідження та аналіз методів оцінки інтерфейсу і навігації в межах інтернет сторінок, розробка нових алгоритмів оцінки методами інтелектуального аналізу.
Основні задачі дослідження:
- Розглянути методи інтелектуального аналізу навігації в межах інтернет сторінок.
- Дослідити основні методики аналізу даних при пошуку шаблонів поведінки користувача.
- Дослідити існуючі методи аналізу юзабіліті інтернет сторінок, запропонувати підходи до їх спільного використання з методами інтелектуального аналізу даних.
Об'єкт дослідження: інтернет сторінка.
У рамках магістерської роботи планується дослідити методи оцінки інтерфейсу і навігації в межах інтернет сторінок з метою знаходження ефективного алгоритму.
3. Огляд досліджень та розробок
3.1 Огляд міжнародних джерел
В Австралії дослідженнями в області навігації в межах інтернет сторінок займається Квінслендський технологічний університет [1].
У США подібні питання вивчаються в Каліфорнійському університеті в Берклі [2].
У Греції розробками в сфері інтелектуального аналізу навігації по інтернет сторінкам займаються вчені Myra Spiliopoulou, Lukas C. Faulstich, Karsten Winkler [3].
У Португалії дослідження в даному напрямі ведуться союзом двох вчених Jose Borges і Mark Levene [4].
У Росії питаннями розробки та оцінки веб-інтерфейсів та програм займаються В.В. Чернов [5], А.А. Сортов і А.В. Хорошилов [6].
3.2 Огляд національних джерел
В Україні подібними питаннями займаються фахівці Харківського національного університету радіоелектроніки [7], [8].
3.3 Огляд локальних джерел
У Донецькому національному технічному університеті проблемами інтелектуального аналізу інтернет сторінок займалися нижчеперелічені магістри:
Пающик Юлія Валеріївна «Аналіз Інтернет-трафіку з використанням інтелектуального аналізу даних». У магістерській роботі розглянуто методи аналізу вмісту Інтернет-сторінок, запропонована архітектура системи аналізу вмісту Інтернет-сторінок, що передбачає надалі прозору очистку Інтернет-сторінок перед їх переглядом користувачами, що покращує сприйняття вмісту Інтернет-сторінок мобільними пристроями. Реалізована підсистема доставки вмісту Інтернет-сторінок одночасно безлічі користувачів в реальному часі [9].
Шинкаренко Валерія Сергіївна «Аналіз аудиторії та прогнозування відвідуваності інтернет ресурсу». У роботі проводиться аналіз цільової аудиторії інтернет ресурсу і знаходження залежностей для прогнозування та оцінки відвідування сайту та інших параметрів [10].
4. Методи оцінки інтерфейсу інтернет сторінок і навігації в межах сторінок
При всій складності комп'ютерів та інших продуктів сучасної технології «машинна» частина інтерфейсу «людина-машина» легше піддається розумінню, ніж людська – набагато більш складна і мінлива. Багато факторів людської продуктивності не залежать від віку, статі, культурного походження або рівня компетентності користувача. Ці властивості людської продуктивності і здатності до навчання мають безпосереднє відношення до основ розробки будь-якого інтерфейсу [11].
На даний час з метою виявлення загальних закономірностей в Інтернеті активно застосовується технологія Web Mining. Дана технологія охоплює методи інтелектуального аналізу, які здатні на основі даних інтернет ресурсу виявити нові, раніше невідомі знання для неструктурованої, неоднорідної і розподіленої інформації, що міститься на інтернет сторінках, і які надалі можна буде використовувати на практиці.
Існує кілька основних методів Web Mining з точки зору розв'язуваних завдань і реалізованих підходів. Деякі з них можуть застосовуватися для оцінки інтерфейсу інтернет сторінок і навігації в межах сторінок.
4.1 Пошук шаблонів в поведінці користувачів
Одним з методів Web Mining, спрямованих на аналіз навігації користувачів по інтернет сторінці і, отже, на оцінку якості інтерфейсу, є пошук шаблонів в поведінці користувачів. Метою даного методу є пошук закономірностей в шаблонах взаємодії користувача з веб-ресурсом з метою прогнозування його наступних дій. Аналізовані дії користувачів можуть включати не тільки переходи по посиланнях, але і відправку форм, прокрутку сторінок, додавання в обрані сторінки і т.д. Знайдені шаблони використовуються надалі для оптимізації структури сайту, вивчення цільової аудиторії і для прямого маркетингу.
Розроблено безліч підходів до вирішення завдання з виявлення знань з шаблонів навігації користувачів (Jose Borges і Mark Levene "Data Mining of User Navigation Patterns", AG Buechner "Navigation Pattern Discovery from Internet Data").
З точки зору застосування алгоритмів інтелектуального аналізу даних при пошуку шаблонів поведінки користувача найчастіше використовуються такі методики (рис. 1):
- пошук асоціації;
- аналіз послідовностей;
- кластеризація послідовностей.
Асоціації – пошук спільно запитуваних сторінок, замовлених товарів [12].
Пошук асоціативних правил – ключова тема в інтелектуальному аналізі. В результаті пошуку виявляються приховані зв'язки в, на перший погляд, ніяк непов'язаних даних. Ці зв'язки – асоціативні правила. Ті правила, кількість (підтримка) яких перевищує певний поріг, вважаються цікавими. Прикладом такого правила, служить твердження, що в тому випадку, якщо відбулася подія А, то відбудеться і подія В з імовірністю Х.
Транзакція – це безліч подій, що відбулися одночасно (групова операція). Події, що відбулися одночасно, називають елементами транзакцій [13].
Нехай I = {i1, i2, i3, ... in} – безліч (набір) товарів, званих елементами, а D – безліч транзакцій Т, де кожна з них є набором елементів з I, . Будь-яка транзакція являє собою бінарний вектор, де t [k] = 1, якщо ik елемент присутній в ній, інакше t [k] = 0. Ми говоримо, що транзакція T містить X, деякий набір елементів з I, якщо . Асоціативним правилом називається імплікація , де , і [14].
Аналіз послідовностей – пошук послідовностей дій. Найбільш часто застосовується варіант алгоритму Аpriori, розробленого для аналізу частих наборів, але модифікованого для виявлення частих фрагментів послідовностей і переходів [12].
Алгоритм Apriori – масштабований алгоритм пошуку асоціативних правил, що базується на методах інтелектуального аналізу (Data Mining), призначений для виявлення знань у базах даних (рис. 2).
Правило AB має підтримку S (англ. support), якщо S% транзакцій з D, містять AB. Достовірність правила показує, яка ймовірність того, що з A слід B. Правило AB справедливо з достовірністю (англ. confidence) C, якщо С% транзакцій з D, що містять A, також містять B, conf (AB) = supp (AB) / supp (A) [13].
Для застосування алгоритму Apriori необхідно провести попередню обробку даних: по-перше, привести всі дані до бінарного вигляду, по-друге, змінити структуру даних.
Кожен запис відповідає транзакції: 1 – елемент присутній в транзакції, і 0 – в іншому випадку [15].
Також цікавий підхід кластеризації послідовностей – пошук груп користувачів з схожими послідовностями дій. На першому етапі в цьому підході виділяються послідовності класифікованих дій користувача, наприклад, в рамках однієї сесії.
Потім підраховуються частоти переходів між різними діями для складання Марківського ланцюга заданого порядку. На заключному етапі отримані Марківські ланцюги кластеризуються для виявлення груп зі схожими частотами переходів.
Для прогнозування наступного дії користувача спочатку на підставі історії його дій в рамках сесії визначається група, до якої він належить з найбільшою ймовірністю. Потім визначається дія, яка виконується з найбільшою імовірністю в цій групі з урахуванням останніх дій даного користувача. Для реалізації такого аналізу можна, наприклад, використовувати алгоритм Microsoft Sequential Clustering, що входить до Microsoft Analysis Services 2012.
На рис. 3 зображена структура моделі кластеризації послідовностей служби Microsoft Analysis Services.
Таким чином, в області оцінки навігації по інтернет сторінці Web Mining вирішує такі задачі:
- визначення типових сесій і навігаційних шляхів користувачів сайту (аналіз послідовностей, асоціативних правил);
- знаходження залежностей при користуванні послугами сайту (пошук асоціативних правил, кластеризація послідовностей) [12].
4.2 Методи аналізу юзабіліті
На сьогодні день зручність використання ресурсу – юзабіліті інтернет сторінки – це один з ключових моментів при роботі з поведінковими факторами. Сайт, що враховує правила web-юзабіліті, краще сприймається користувачем.
Робота з юзабіліті спрямована на підвищення зручності перебування користувача на сайті. Зручність, у свою чергу, нерозривно пов'язано з усіма аспектами сайту, як:
- текстове наповнення;
- форматування текстів;
- наявність і логіка роботи функціональних елементів;
- розташування функціональних елементів по відношенню один до одного;
- можливість спрощення роботи користувача з функціональними елементами;
- дизайн ресурсу і т.д.
Роботу з оцінки юзабіліті сайту слід починати ще при створенні сайту, однак якщо проект вже запущений, проведення аналізу юзабіліті теж є можливим.
Існує кілька варіантів аналізу юзабіліті сайту:
- Аналіз статистики за допомогою сервісів Яндекс.Метрики, Google Analytics та ін.
Лічильники встановлюються на сайті, дані надаються безкоштовно – таким чином, це один з найбільш доступних варіантів аналізу юзабіліті. Можна провести порівняльний аналіз статистики подібних сайтів, якщо є відповідний доступ. До основних мінусів даного методу можна віднести недостатній обсяг даних і поверховість висновків без більш глибокого аналізу.
- Робота з відгуками відвідувачів.
На сайтах розміщують форми голосування і зворотного зв'язку. Якщо будь-які елементи сайту викличуть у користувачів негативне відношення, вони зможуть його висловити. Реалізувати форму зворотного зв'язку на сайті і обробити отримані відгуки нескладно, головне – періодично відстежувати думки відвідувачів. Мінусом методу є те, що у відгуках будуть вказані тільки основні, поверхневі помилки, присутні на сайті.
- Тестування юзабіліті сайту.
Спосіб підходить, якщо є сумніви в успіху нововведень на сайті. Для тестування сторінок можна використовувати спеціальний інструмент від Google – Оптимізатора web-сайтів – і фокус-групи. Необхідно підібрати людей і дати їм заздалегідь підготовлене завдання по досягненню мети сайту. Група поділяється на дві частини, і кожна працює зі своїм варіантом сайту. За діями учасників експерименту ведеться спостереження, за результатами якого потім робиться висновок про те, який варіант сайту найбільш зручний. Плюсом методу можна вважати ідеальний вибір між двома варіантами, статистично підтверджений. Мінус в тому, що необхідно сформувати і мотивувати фокус-групу.
- Спостереження за діями відвідувачів.
Даний метод дозволяє збирати фокус-групи, позначати різні завдання для них і охоплювати будь-які цільові аудиторії, в тому числі і змішані. Для спостереження можна також скористатися інструментом Вебвізор, представленим у Яндекс.Метрика. Вебвізор записує всі дії відвідувачів на сайті. Переваги цього методу: великий обсяг даних для аналізу, різні варіанти висновків, чітка цільова група, можливість безкоштовного аналізу та ін Мінусом може бути відсутність спостережницького досвіду: потрібно бачити, що саме заважає відвідувачеві досягти мети, і правильно знаходити вирішення проблем [16].
Вищеперелічені методи не можуть бути віднесені до методів інтелектуального аналізу юзабіліті інтернет сторінок. Однак у перспективі можливе спільне використання деяких методів аналізу юзабіліті і методів інтелектуального аналізу, зокрема, пошуку шаблонів навігації користувача.
Наприклад, на даний момент аналіз юзабіліті на основі даних зі звітів сервісів аналізу статистики проводиться вручну. У майбутньому ж така процедура може стати автоматизованою. Таку ж методику можна застосовувати і для спостереження за діями відвідувачів. Дані підходи допоможуть повністю автоматизувати процес аналізу юзабіліті.
Висновки
Багато існуючих методів оцінки інтерфейсу інтернет сторінок є необ'єктивними або поверхневими. З метою поліпшення аналізу інтерфейсу і навігації по інтернет сторінці необхідно створити підходи, що засновані на застосуванні методів інтелектуального аналізу та дозволяють якісно аналізувати і вилучати нову корисну інформацію з даних інтернет сторінок.
У даній роботі був розглянутий один з методів Web Mining – пошук шаблонів в поведінці користувачів, – результати якого можуть бути використані для оптимізації структури сайту.
Також були досліджені деякі варіанти аналізу юзабіліті сайту, які можуть бути використані спільно з методами інтелектуального аналізу для більш якісної оцінки.
У подальшій роботі планується розробка алгоритмів оцінки інтерфейсу інтернет сторінок і навігації в межах сторінок методами інтелектуального аналізу.
Перелік посилань
- Yue Xu. Mining for User Navigation Patterns Based on Page Contents [Электронный ресурс] – Режим доступа: www/ URL: http://www2.cs.uregina.ca/~wss/wss03/03/wss03-127.pdf
- Melody Yvette Ivory. An Empirical Foundation for Automated Web Interface Evaluation [Электронный ресурс] – Режим доступа: www/ URL: http://webtango.berkeley.edu/papers/thesis/thesis.pdf
- Myra Spiliopoulou, Lukas C. Faulstich, Karsten Winkler. A Data Miner analyzing the Navigational Behaviour of Web Users [Электронный ресурс] – Режим доступа: www/ URL: http://www.hhl.info/fileadmin/LS/micro/Download/Spiliopoulou_1999_ADataMiner.
pdf - Jose Borges, Mark Levene. Data Mining of User Navigation Patterns [Электронный ресурс] – Режим доступа: www/ URL: http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.23.484
- Чернов В.В. К проблеме разработки веб-интерфейсов [Электронный ресурс] – Режим доступа: www/ URL: http://www.rae.ru/fs/pdf/2012/11-2/30559.pdf
- Сортов А.А., Хорошилов А.В. Функциональное тестирование Web-приложений на основе технологии UniTesK [Электронный ресурс] – Режим доступа: www/ URL: http://ispras.ru/ru/proceedings/docs/2004/8/1/isp_2004_8_1_77.pdf
- Почанский О.М. Применение структурных характеристик web-документов при оценивании их привлекательности для конечного пользователя [Электронный ресурс] – Режим доступа: www/ URL: http://archive.nbuv.gov.ua/portal/Natural/SOI/2011_4/pochan.pdf
- Егорова И.Н., Истомина А.А. Исследование возможностей веб-аналитики [Электронный ресурс] – Режим доступа: www/ URL: http://journals.uran.ua/index.php/1729-3774/article/viewFile/3917/3585
- Пающик Ю.В., – Анализ Интернет-трафика с использованием интеллектуального анализа данных [Электронный ресурс] – Режим доступа: www/ URL: http://masters.donntu.ru/2012/fknt/paushchik/diss/index.htm
- Шинкаренко В.С., – Анализ аудитории и прогнозирование посещаемости интернет ресурса [Электронный ресурс] – Режим доступа: www/ URL: http://www.masters.donntu.ru/2006/fvti/shynkarenko/diss/
- Раскин Джефф. Интерфейс: новые направления в проектировании компьютерных систем / Джефф Раскин. – М.: Символ-Плюс, 2005. – 272 с.
- Web Mining: интеллектуальный анализ данных в сети Internet [Электронный ресурс] – Режим доступа: www/ URL: https://sites.google.com/site/upravlenieznaniami/tehnologii-upravlenia-znaniami/text-mining-web-mining/web-mining
- Анализ данных методом ассоциативных правил. Алгоритм Аpriori [Электронный ресурс] – Режим доступа: www/ URL: http://www.drupal-site.com/analiz-dannyh-metodom-associativnyh-pravil-algoritm-apriori
- Вильчинская О.С., Тесленко И.В. Извлечение многоуровневых ассоциативных правил из больших баз данных [Электронный ресурс] – Режим доступа: www/ URL: http://archive.nbuv.gov.ua/portal/natural/vejpt/2006_3_3/EEJET_3_3_2006_27-31.pdf
- Алгоритм для поиска ассоциативных правил [Электронный ресурс] – Режим доступа: www/ URL: http://www.drupal-site.com/algoritm-dlya-poiska-associativnyh-pravil
- Юзабилити сайта – анализ, оценка и тестирование [Электронный ресурс] – Режим доступа: www/ URL: http://www.sembook.ru/book/povyshenie-konversii-sayta/yuzabiliti-sayta/