Українська   English
ДонНТУ   Портал магистров

Реферат по теме выпускной работы


Содержание

1. Цель и задачи

Цель работы состоит в разработке модели персонализации сайта, основанной на анализе постоянных и текущих потребностей пользователей. Для достижения цели предлагается ввести в модель конечного пользователя его поисковый профиль и учитывать поисковые профили всей аудитории сайта в модели персонализации.

Для достижения поставленной цели не обходимо решение следующих задач:

1. Провести анализ существующих сервисов персонализации и методов предоставления релевантного для пользователя контента.

2. Выбрать алгоритм кластеризации поисковых и навигационных профилей пользователя.

3. Разработать модель персонализации и алгоритм управления контентом веб-сайта на основе оценки потребностей пользователя.

2. Актуальность темы

C развитием сети Интернет растет количество крупных сайтов с большим количеством страниц, гиперссылок и сложной структурой навигации. Информационная перегруженность страниц и их высокая функциональность приводят к тому, что пользователям становится сложнее ориентироваться, находить и осуществлять выбор интересующей (релевантной) информации. Для современных крупных Интернет-библиотек, Интернет-магазинов, государственных Веб-порталов, сайтов турагенств, поисковых сервисов и т.д. существует актуальная задача эффективной навигационной и поисковой поддержки пользователей. Эту задачу можно решать путем персонализации содержимого в соответствии с потребностями и особенностями поведения конечного пользователя.

Персонализация веб-страниц позволяет кардинально изменить отношение сайта к своим посетителям. В результате не только пользователь будет «общаться» с веб-страницей, но и сам сайт будет обращаться к любому, попавшему на страницу, не как к части общей массы, а как к конкретному человеку, имеющему свои личные интересы – персонально.

Услуги по персонализации сайтов, их автоматизированной адаптации под ожидания посетителей на рынке интернет-маркетинга существуют давно. Однако, по причине сложности в технической реализации процессов персонализации к этим работам привлекаются не сторонние организации, а собственные программисты. Сторонние сервисы (например Adobe Digital Marketing Suite или Google Analytics + Siteapps.com) выполняют ограниченное число действий по персонализации сайта, которых обычно недостаточно для заметного повышения эффективности сайта.

Для качественной персонализации сайта необходимо использовать информацию не только о маркетинговых качествах посетителя, но и информацию из CRM и других внутренних баз данных каждого конкретного предприятия. В этом случае появляется намного больше метрик и измерений для описания сегмента посетителя и выполнения правила персонализации.

Предполагается, что, посещая сайт, конечный пользователь пытается удовлетворить некоторую известную ему совокупность потребностей. Причем одни потребности могут иметь постоянный характер вне зависимости от частоты сеансов, а другие нет. Исходя из этого, потребности разделяются на постоянные (не зависящие от сеанса) и текущие (сеансозависимые). Очевидно, что подходы к персонализации, должны учитывать характер потребностей пользователя.

При персонализации, учитывающей постоянные потребности, как правило сохраняется история поисковых запросов и просмотренных страниц пользователя (навигационный профиль). Выявление ранее непросмотренных конечным пользователем страниц, но удовлетворяющих его постоянным потребностям может осуществлять с учетом совокупности поисковых запросов, имевших место у того или иного пользователя с похожими навигационными профилями.

Примером персонализации на основе текущих потребностей являются популярные в настоящее время рекомендательные системы, которые работают на основе поисковых профилей пользователей. При этом часто компании используют специально созданные, встроенные в веб-сайт рекомендательные системы. Для интеграции рекомендательной системы с выбранным веб-сайтом необходимы координальные изменения его системы управления данными (CMS). Одним из прогрессивных подходов к упрощению интеграции рекомендательных систем с сайтами является использование SaaS-технологии (Software as a service).

Недостатком существующих средств персонализации является ориентация только на текущие потребности пользователей, что снижает точность сформированных системой персонализации рекомендаций. В связи с этим актуальной является задача разработки комбинированной модели персонализации и алгоритмов управления контентом сайтов, учитывающих постоянные и текущие потребности пользователей.

3. Предполагаемая научная новизна

Модель персонализации и алгоритм управления контентом сайтов, учитывающие его постоянные и текущие потребности, на основе комбинации навигационного и поискового профиля пользователя.

4. Планируемые практические результаты

На основе разработанной модели и алгоритмов предложена система персонализации, которая может интегрироваться с веб-сайтами для повышения эффективности доступа к релевантной для пользователя информации.

5. Обзор исследований и разработок по теме

5.1 Глобальный уровень

Многие компании предлагают сегодня услуги по персонализации. Рассмотрим краткую характеристику доступных сегодня инструментов, которые ориентированы на удобную интеграцию с веб-сайтом и не требуют квалифицированного программирования.

Сервис Personyze [1] создан для сегментирования посетителей сайта в режиме реального времени, а также для предоставления им персонализированного и оптимизированного контента, основанного на их демографических, поведенческих и исторических характеристиках. Personyze предлагает самую расширенную SaaS платформу на рынке персонализации сайтов и сегментации пользователей в режиме реального времени. Сразу после добавления кода можно в реальном времени видеть отчёты о поведении пользователей на сайте. Все посетители автоматически распределяются по сегментам в соответствии с их местоположением, источником посещений (включая конкретные ключевые запросы), демографическими данными, действиями на сайте и т.д. – всего около 50 метрик. Как только установлено соответствие посетителя и сегмента, Personyze выполняет необходимые персонализирующие действия, позволяющие вам менять любой фрагмент контента сайта, будь то добавление баннера, изменение картинки, изменение текста, добавление рекомендованных продуктов и многое другое. Посетитель будет видеть оптимизированную под него версию сайта. Сервис удобен тем, что позволяет работать с отдельными сегментами и предоставлять детализированные отчёты по каждому из них.

Создатели Monoloop [2] сконцентрированы на контроле за покупательским циклом. Установленный на сайт, их сервис отслеживает поведение каждого посетителя сайта, узнаёт его в момент следующего посещения и в соответствии с этим меняет под него определённые элементы сайта. Monoloop автоматически создаёт профиль для каждого нового клиента и позволяет выстраивать внятную и последовательную кампанию по работе с ним. Сервис запоминает, что именно интересует покупателя, и может предложить другие подходящие товары из схожих категорий. Плюс он понимает, на каком этапе принятия решения о покупке находится покупатель, и советует, что можно сделать, чтобы подтолкнуть покупателя к покупке.

Gravity [3] стартап поколения Web 3.0 — это версия веба, подразумевающая персонализацию интернета для каждого пользователя. Он позиционирует себя как сервис, предлагающий уникальный персонализированный опыт, который помогает пользователям находить наиболее интересный контент на основе их индивидуальных потребностей. На начальном этапе сервис был ориентирован на конечных потребителей, но в настоящее время сосредоточен только на B2B (рекламодатели и издатели). Персонализация Gravity заключается в применении различных фильтров в режиме «реального времени» к информации, доступной пользователям в поиске и социальных медиа. Запатентованная Gravity технология создает Interest Graph на базе интересов, предпочтений и привычек пользователя, и позволяет владельцам сайтов предложить своим читателям редакторский и рекламный контент, соответствующий их интересам.

Persuasion API [4] отличается от остальных сервисов персонализации тем, что делает акцент на применении приёмов психологии убеждения. Став их клиентами, вы автоматически получаете бесплатный курс, объясняющий, как именно можно влиять на потенциальных покупателей. Например, можно давить на срочность, использовать мнение авторитета или привязать социальный элемент. Ещё одна особенность Persuasion API — умение автоматически менять тактику, если первая не сработала. Сервис отслеживает поведение пользователя, причём даже если он заходит на сайт с различных девайсов, и записывает их в его профайл. Всех потенциальных и реальных клиентов можно сегментировать и применять к отдельному сегменту или конкретному пользователю соответствующий тип убеждения. Затем можно проанализировать, на какие группы какие акции действуют лучше, кто в итоге больше покупает, и использовать удачные стратегии в дальнейшем.

В работе [5] предложена массовая рекомендательная система (МРС), не требующая перепрограммирования CMS, которая легко интегрируется в веб-сайт. Обработка поступающей пользовательской информации осуществляется на основе SaaS-технологии (Software as a service) — на веб-сайте устанавливается только результирующий интерфейс (блок рекомендуемых ссылок), а хранение и обработка пользовательских данных осуществляется на стороннем сервере МРС. Для установки МРС необходимо всего лишь зарегистрироваться на веб-сайте проекта, настроить внешний вид блока ссылок и вставить полученный html-код и javascript-код в нужное место своего веб-сайта.

В статье [6] рассматривается проблема улучшения поисковых и навигационных систем. Для ее решения предлагается использовать информационный портрет пользователя. Описывается метод построения и применения такого портрета, основанный на ключевых словах. Приводятся результаты экспериментов, показывающих его работоспособность. Делается вывод о том, что системы, использующие информационный портрет дают лучшие результаты, чем системы без персонификации.

5.2 Национальный уровень

На национальном уровне работы по созданию средств персонализации Web сайтов и рекомендательных систем ведутся в университетах и академических институтах.

В работе [7] рассмотрен вопрос разработки рекомендательной системы с использованием комбинированного колаборативних подхода для информационного онлайн ресурса.

В работе [8] проведен анализ современных поисковых систем, а также систем предоставления рекомендаций. Выбранный явный сбор данных. Разработана и программно реализована адаптивная поисковая система, которая базируется на явном сборе данных о предпочтениях пользователя.

В работе [9] проведен анализ существующих методов информационного поиска и предложена процедура фильтрации по схожести образов основном основанную на уже рассмотренном материале. Главная идея заключается в том, чтобы для каждого образа заранее вычислить большинство похожих на него. Тогда для создания рекомендаций пользователю достаточно будет найти те образцы, которым он выставил высокие оценки, и создать взвешенный список образцов, которые были бы максимально похожими на эти. Коллоборативная фильтрация использует сходство мнений различных пользователей для выдачи рекомендаций по объектам. Она основывается на том факте, что человеческие пристрастия не распределяются случайным образом: в мыслях группы людей прослеживаются общие тенденции.

5.3 Локальный уровень

На локальном уровне, в пределах ДонНТУ, научные разработки в области рекомендательных систем и персонализации являются новыми, однако есть ряд работ по близкому направлению связанному с кластеризацией текстовых документов [10-11].

6. Краткое изложение собственных результатов

6.1 Модель персонализации и алгоритм управления контентом веб-сайта на основе оценки потребностей пользователя

Рассматривается вариант персонализации веб-сайта, предполагающий автоматическое предоставление конкретному пользователю ссылок на страницы с интересующей его информацией. При посещении сайта пользователь пытается удовлетворить свои потребности в информации, причем некоторая информация может требоваться ему в каждом сеансе, а к некоторой он может обращаться, только в текущем сеансе. С учетом этого множество рекомендуемых системой ссылок можно представить в следующем виде:

где L — множество рекомендуемых конечному пользователю ссылок;

— множество ссылок на страницы, удовлетворяющих постоянные потребности;

— множество ссылок на страницы, удовлетворяющих текущие потребности.

Множество ссылок может состоять как из ранее просмотренных , так и непросмотренных страниц — множество g-ых ссылок на просмотренные конечным пользователем страницы, отвечающих постоянным потребностям.

— множество j-ых ссылок на непросмотренные конечным пользователем страницы, отвечающих постоянным потребностям.

Расчет принадлежности ранее просмотренной страницы множеству предлагается осуществлять на основе коэффициента линейной корреляции между порядковым номером сеанса, имевших место у конечного пользователя, и количеством сеансов, в которых была просмотрена анализируемая страница:

,        (1)

где — коэффициент линейной корреляции для страницы;

b — количество сеансов;

l — порядковый номер сеанса,;

— количество сеансов, в которых имел место просмотр страницы .

Если имеется ярко выраженная корреляционная связь , то в соответствии со шкалой Чеддока заносится в множество и ранжируется в соответствии с величиной связи.

Выявление страниц, которые ранее не просматривались конкретным пользователем, но удовлетворяющих его постоянным потребностям, можно осуществлять с учетом совокупности поисковых запросов (поискового профиля), имевших место у иных пользователей.

Поисковый запрос является формализованным на естественном для пользователя языке описанием его потребности, поэтому к пользователям с похожими потребностями можно отнести таких пользователей, у которых похожи поисковые профили. Можно предположить, что наиболее весомые страницы, которые были просмотрены пользователями с похожими поисковыми профилями, могут относиться к сфере их общих постоянных интересов. Чтобы выявить такие страницы необходимо решить следующие задачи:

Пример кластеров для двухмерного случая приведен на рис. 1.

Пример кластеров для простейших поисковых профилей

Рисунок 1 Пример кластеров для простейших поисковых профилей

(анимация: 7 кадров, 12 циклов повторений, 19Kb)

Кластеризацию поисковых профилей, как и все указанные задачи, можно выполнять в офф-лайн режиме. В этом случае инициация процесса кластеризации не зависит от момента обращения пользователя. Запуск процесса можно производить периодически в заранее рассчитанные периоды времени, когда сервер наименее загружен. При выборе алгоритма кластеризации необходимо учитывать ограниченность временных и вычислительных ресурсов.

В соответствии с особенностями массива поисковых профилей, обрабатываемого посредством кластеризации, выделены следующие основные требования к алгоритму кластеризации: