В данной статье рассматриваются вопросы создания компьютерной подсистемы организации структуры коммерческих веб-сайтов, которая способна анализировать информацию о продажах, о поведении покупателей в процессе выбора и покупки товара, группировать покупателей по отдельным признакам и генерировать для каждой из групп уникальный контент, повышая тем самым эффективность электронных продаж.
У даній статті розглядаються питання створення комп'ютерної підсистеми організації структури комерційних веб-сайтів, яка здатна аналізувати інформацію про продажі, про поведінку покупців в процесі вибору і покупки товару, групувати покупців по окремих ознаках і генерувати для кожної з груп унікальний контент, підвищуючи тим самим ефективність електронних продажів.
The creation of computerized subsystem for organization structure of commercial websites is discussed. The describing subsystem is able to analyze sales information and information about clients behavior during searching and buying goods. In addition subsystem allows group customers by individual characteristics and generate unique content for each group for increasing the efficiency of electronic sales.
Общая постановка проблемы. На сегодняшний день рост оборота интернет-торговли в Украине существенно превышает темпы развития традиционной торговли. Доля товаров, купленных в сети, неуклонно растет. Во второй половине 2000-х годов объем виртуальных покупок
ежегодно увеличивался в 1,5-2 раза. В итоге, товарооборот электронной розничной торговли в Украине в 2010 году составил более 1 млрд. долларов [1].
Стремительно расширяется и аудитория клиентов. В 2009 г. уже более 80% пользователей Интернета совершили хотя бы одну покупку онлайн, тогда как в 2008 г. эта цифра не превышала 60%. Учитывая то, что месячная аудитория глобальной сети в Украине в 2011 году превышает 10 млн. человек и уверенно растет, задачи совершенствования принципов и организации торговли являются актуальными [1].
На данном этапе все больше оффлайн компаний розничной торговли выходят на рынок интернет-коммерции, разрабатывая собственные интернет-площадки продажи товаров либо покупая уже готовые решения. В большинстве случаев действующие в нашей стране интернет-магазины предоставляют посетителям базовый набор действий, который он может совершить, покупая товар в интернете. Однако существенная разница может наблюдаться в системах управления такими магазинами, то есть в той части, которую использует продавец при размещении товара на страницах своего интернет-портала.
В данной статье описывается возможность создания компьютерной подсистемы организации структуры коммерческих веб-сайтов, которая способна автоматически анализировать информацию, поведение групп покупателей интернет-магазина и генерировать для каждой из групп уникальный контент, повышая тем самым эффективность интернет-продаж.
Следует, прежде всего, выделить задачи, которые должна решать такая подсистема:
- Собирать и хранить статистическую информацию о поведении посетителей коммерческого веб-сайта и о результатах пребывания потенциальных покупателей на страницах веб-сайта.
- Выявлять группы покупателей, посетителей коммерческого веб-сайта, и наоборот, относить нового покупателя к той или иной группе.
- Генерировать уникальный контент для каждой из групп посетителей.
- Анализировать уровень продаж каждого из товаров.
- Основываясь на анализе продаж, изменять уникальный контент.
Сбор статистической информации. Статистическая информация, необходима на всем протяжении работы подсистемы. Эта информация содержит как данные, предоставляемые пользователем при регистрации на сайте, так и данные о его переходах по страницам веб-сайта, и используется для определения групп пользователей интернет-магазина и для анализа путей их переходов по страницам сервиса. Механизм сбора статистики переходов пользователей интернет-магазина может быть основан на одной из двух существующих моделей отслеживания путей посетителей веб-сайтов:
– Server Side Tracking System (SSTS). Это система, которая отслеживает пути переходов посетителей по веб-страницам и базируются на стороне сервера;
– Client Side Tracking System (CSTS), более известна как Real Time Tracking system. Это аналогичная система, которая основывается на отслеживании пользовательских путей на основе cookie-файлов посетителя [2].
Модели, которые базируются на стороне пользователя, имеют заметные преимущества по отношению к моделям, находящимся на сервере. Во-первых, информация собирается в реальном времени, что увеличивает быстродействие системы, собирая данные непосредственно в базу данных, то есть программисту не нужно дополнительно проводить анализ log-файлов сервера, что сокращает затраты технических ресурсов и времени.
Во-вторых, это более аккуратный
метод, так как посетители определяются путем присваивания им специального уникального ID, тогда
как в серверных моделях посетитель определяется по IP адресу своего компьютера, который не всегда может быть уникальным.
Исходя из этого, для разрабатываемой подсистемы была выбрана модель, построенная на стороне клиента.
Механизм работы выбранной модели заключается в следующем. Для получения информации о клиенте используется технология AJAX. Специально разработанный код JavaScript внедряется на каждую html-страницу коммерческого веб-сайта. После чего, переходя между страницами, клиент передает информацию на сервер сбора статистических данных, где информация заносится в базу данных и анализируется.
Необходимо отметить, что владельцу коммерческого веб-сайта выгодно использовать технологию AJAX, так как нагрузка на сервер коммерческого сайта не увеличивается. Использование данной технологии предполагает обязательное наличие поддержки JavaScript браузером клиента.
Выявление групп покупателей. Данная задача является задачей кластеризации. Существует достаточно большое количество методов кластеризации. Выбор того или иного метода зависит от конкретной задачи [4].
Для решения проблемы группирования покупателей интернет-магазина были рассмотрены следующие методы кластеризации, которые применяются для небольших объемов статистических данных и небольшого количества кластеров:
– метод k-средних,
– метод ближайшего соседа
,
– метод Варда.
Метод k-средних – один из наиболее известных методов определения принадлежности элементов кластерам, основанный на минимизации разницы между элементами кластера и максимизации расстояния между кластерами. Алгоритм k-средних вычисляет квадраты евклидовых расстояний между записями данных в кластере и вектор, представляющий собой среднее данного кластера [3]. Метод сходится, выдавая окончательный набор из k кластеров, когда упомянутая сумма минимизирована. Алгоритм k-средних назначает каждой точке данных ровно один кластер и не допускает неопределенности в принадлежности точки кластеру.
Метод ближайшего соседа
, или метод одиночной связи заключается в том, что на основании матрицы расстояний определяются два наиболее близких объекта, которые образуют первый кластер. Далее выбирается объект, который будет включен в этот кластер. Таким объектом будет тот, который имеет наименьшее расстояние хотя бы с одним из объектов, уже включенных в кластер. На следующем шаге аналогично включается в кластер следующий объект и так далее до образования единственного кластера [3].
Метод Варда отличается от всех других методов, поскольку он использует методы дисперсионного анализа для оценки расстояний между кластерами [3]. Метод минимизирует сумму квадратов (SS) для любых двух (гипотетических) кластеров, которые могут быть сформированы на каждом шаге.
Данные методы были исследованы на основании собранных статистических данных, из которых были отобраны следующие показатели: группа, к которой относится приобретенный товар, его цена, пол клиента, его возраст, наличие скидки при покупке. Конкретные значения показателей нормировались по следующим формулам:
где Xij – значение i-гo показателя j-го клиента;
Xmin.i – минимальное значение i-гo показателя клиента среди всех
клиентов;
Xmax.i – максимальное значение i-гo показателя клиента среди всех
клиентов.
Формула (1) использовалась в случае, когда большие значения соответствуют лучшему результату, а формула (2), когда меньшие значения соответствуют лучшему результату. Таким образом, полученные нормированные показатели Kij наодятся находятся в интервале [0;1].
Исследования проводились с помощью встроенных функций пакета Matlab. Наилучшие результаты были достигнуты при использовании метода ближайшего соседа
. Для его реализации использовалась матрица NxM, где M – количество характеристик (в данном случае M=5), а N – количество клиентов, которое при исследовании варьировалось от 30 до 500. При этом итоговое количество кластеров получалось от трех до пяти. На рис. 1 представлен результат кластеризации для N=30 в виде дендрограммы (иерархического дерева кластеров). Исходные данные для приведенного варианта были сгруппированы в 4 кластера.
Рисунок 1 – Иерархическое дерево кластеров
Таким образом, были выделены группы пользователей коммерческого веб-сайта, что позволяет перейти к следующему этапу решения задачи – генерации уникального контента сайта для каждой из этих групп.
Генерация уникального контента для пользователей сайта. В разрабатываемой подсистеме под понятием уникальный контент подразумевается набор товаров существующего интернет-магазина, которые рекламируются на страницах пользователей, при этом данный набор товаров подстраивается под конкретную группу пользователей, тем самым привлекая их внимание и увеличивая эффективность продаж. Изначально для подсистемы определяются те наборы товаров, которые по мнению экспертов подходят для той или иной группы клиентов, после чего подсистеме предоставляется возможность изменять эти наборы и автоматически оценивать результат своей работы. Если результат удовлетворяет заданным подсистемой условиям, то такие условия сохраняются, иначе подсистема меняет составляющие наборов товаров, и так происходит до тех пор пока не будет достигнут заданный результат.
Результат работы системы можно оценить двумя способами. В первом случае можно воспользоваться традиционным решением оценивания эффективности работы подсистемы, подсчитывая продажи каждого наименования из набора товаров за определ?нное установленное администратором время. При этом такой подход обладает рядом недостатков. Например, нельзя точно определить, что стало причиной покупки товара, возможно, это сгенерированный системой контент, а возможно, на данном промежутке времени возрос сезонный спрос на товар и поэтому количество его продаж резко возросло.
Во втором случае, основываясь на собираемой статистики, можно отследить пути переходов пользователя по ссылкам интернет-магазина, тем самым выявив интерес каждой конкретной группы пользователей к тому или иному набору товаров. То есть чем больше переходов совершила та или иная группа клиентов по ссылкам из уникального набора товаров, тем лучше этот набор подходит для данной группы. При этом следует учитывать колебание данного показателя по отношению к общему количеству посетителей сайта за выбранный промежуток времени.
Выводы. Описанная подсистема организации структуры коммерческого веб-сайта представляет собой интеллектуальную систему, которая самостоятельно способна видоизменять рекламный контент сайта, подстраиваясь под определ?нные целевые аудитории.
Разрабатываемая подсистема позволит менеджерам интернет-магазина эффективней управлять его структурой и ассортиментом, повышая таким образом эффективность продаж.
Список литературы
1. Оборот интернет-торговли в Украине превысил $1 млрд :: Marketing Media Review - Украина [Электронный ресурс] / Журнал Marketing Media Review (MMR). - Режим доступа : www/ URL : http://mmr.net.ua/news/newsid/20925/ - 10.08.2010г. - Загл. с экрана.
2. Real-Time Tracking System [Electronic resource] / FeedsManagement.com · A Feed Optimization, Creation & Feed Management Company. - Режим доступа : www/ URL : http://feedsmanagement.com/services/real-time-tracking-system - Загл. с экрана.
3. Кластерный анализ [Электронный ресурс] / Электронный учебник StatSoft. - Режим доступа: www/ URL : http://www.statsoft.ru/home/textbook/modules/stcluan.html - Загл. с экрана.
4. Мандель, И.Д. Кластерный анализ [Текст] / И. Д. Мандель. - М.: Финансы и статистика, 1988. - 176 с. : ил. - ISBN 5-279-00050-7 .