Реферат по теме выпускной работы
Содержание
- Введение
- 1. Актуальность темы
- 2. Цель и задачи исследования
- 3. Научная новизна
- 4. Обзор методов моделирования социальных сетей
- 5. Временное моделирование социальных медиа
- 6. Кластеризация сообществ
- 6.1 Общие понятия кластеров
- 6.2 Основные этапы кластерного анализа
- 7. Модели распространения информации
- 7.1 Вейвлет-анализ
- Выводы
- Список источников
Введение
Термин cоциальная сеть
(от англ. social networks) введён в 1954г. социологом Джеймсом Барнсом. В своей работе он охарактеризовал социальную сеть как систему точек, точками этой системы являются люди[1].
В настоящее время социальные сети являются самыми популярными веб-сайтами в мире, после поисковиков. И если популярность поисковиков вполне понятная, то в чём же популярность социальных сетей?
Социальные сети многофункциональны и имеют очень простой формат. Их можно использовать для личного общения, поиска работы, продвижения бизнеса и политических идей, поиска вариантов сотрудничества.
68% глав государств и правительств из 193 стран – членов ООН имеют свои собственные аккаунты в соцсетях.
Огромный плюс социальных сетей – отсутствие вирусов.
По данным международного агентства We Are Social, специализирующегося на исследованиях в области соцмедиа:
1. Актуальность темы
Актуальность темы исследования обусловлена ростом популярности в обществе социальных сетей, и их дальнейшее развитие в значительной степени определяет и перспективы развития Интернета.
К популярным социальным сетям можно отнести: ВКонтакте, Одноклассники, Twitter, Facebook, Instagram. В России самой перспективной и популярной сетью является сеть ВКонтакте. Ее аудитория составляет 77% от всей мобильной аудитории в России, а это 97 миллионов активных пользователей.
2. Цель и задачи исследования
Цель исследования состоит в разработке и исследовании математических моделей описания поведения социальных групп.
К числу основных задач исследования относятся:
- Разработка приемов кластеризации сообществ в социальных сетях.
- Временное моделирование количества агентов в сообществах.
- Разработка модели распространения информации в сети.
Объект исследования: сообщества социальной сети ВКонтакте.
3. Научная новизна
Предложена математическая модель кластеризации сообществ. Предложены математические модели, объясняющие образование семейства групп, как результат активизации массы индивидов с последующей дифференциацией их на группы разного уклона. Разработана математическая модель, описывающая жизненный цикл сообществ в социальных сетях. Смоделированы на основе вейвлет-анализа процессы распространения информации в сети.
4. Обзор методов моделирования социальных сетей
При исследовании социальных сетей можно выделить основные этапы: определить статистические свойства, характеризующие поведение систем с сетевой структурой; получить статистические данные; создать модели сетей; спрогнозировать поведение систем на основе измеряемых свойств.
При моделировании социальных сетей, как правило, используется несколько основных характеристик:
Социальные сети подразделяются на формальные и неформальные, вертикальные и горизонтальные. Неформальные социальные сети строятся на неформальных связях, в формальных социальных сетях четко определены роли, права и обязанности каждого участника.
В социальных сетях, построенных по вертикальному признаку, вершину образует команда
, которая состоит из лидеров и их ближайших помощников. Команда формирует стратегию группы, тактику взаимодействия, конфронтации или сотрудничества с внешними социальными сетями.
Социальные сети, построенные по горизонтальному принципу являются сообществом агентов примерно одного социального статуса и, соответственно, влияния [3].
5. Временное моделирование социальных медиа
Жизненный цикл социальных групп
Социальные сети можно использовать как инструмент для осведомления людей о новом продукте, запущенном на рынок. Социальные медиа могут использоваться в качестве механизма распространения скидочных купонов и предложений, что делает их средством реализации стратегий жизненного цикла продукции. Социальные сети можно использовать для рекламы.
Поэтому стратегии социальных сетей идут бок о бок со стратегиями жизненного цикла продукта, и оба типа циклов актуальны для маркетологов в процессе принятия решений[4].
Каждый продукт или услуга имеет жизненный цикл, и, сообщества в социальных сетях имеют свой специфический сценарий жизненного цикла. Люди также имеют жизненный цикл, начинающийся с рождения и заканчивающийся смертью. Они проходят через младенчество, рост, зрелость и смерть.
Зная этапы развития групп, можно использовать этапы роста и зрелости групп, которые являются отличными площадками для продвижения бизнеса с помощью социальных сетей.
Жизнь группы или всей сети начинается с начальной зоны, за которой следует всплеск молвы
(резкое увеличение участников), затем спад лощина сомневающихся
(или долина сомнений), когда часть участников покидает группу, затем рост числа участников сети до зоны стабильности и неизбежное умирание проекта с заменой его новым, более актуальным.
|
Начиная с лета 2014г. нами собирались исходные данные по нескольким группам Вконтакте. Наиболее показательна с точки зрения циклов жизненных групп оказалась группа Сводки от ополчения Новороссии
.
В поле зрения группа попала 1 июня 2014г, когда у нее было 12 тысяч подписчиков, и уже через пять дней их количество превысило 33 тысячи.
На рисунке показан рост числа подписчиков группы, по оси У показано число подписчиков, по Х – даты.
|
Рассматривая историю групп как временные ряды, мы выделили сезонную составляющую. Как видно, наибольшей активностью участники группы отличаются в осенние месяцы, наименьшей – в августе.
Анализ активности по дням недели показал, что наименьшее количество участников участвуют в обсуждениях в субботу.
|
6. Кластеризация сообществ
6.1 Общие понятия кластеров
Одним из возможных подходов к обработке статистических данных с целью выделения объектов в группы со схожими характеристиками является кластерный анализ.
Впервые термин кластер
вошел в научный оборот в математике, когда в конце 1930-х гг. был сформулирован аппарат кластерного анализа многомерных данных. Слово «кластер» можно перевести с английского языка как кисть, гроздь; скопление, концентрация; группа. Экономическая интерпретация слова введена в научный оборот в 1990г. американским экономистом М. Портером
Посредством кластерного анализа могут успешно решаться такие задачи, как первичный скоринг-рисков, характерных для деятельности банков и страховых компаний, оценка эффективности операций на рынке ценных бумаг и производных финансовых инструментов. Другими примерами могут быть задачи, связанные с необходимостью кластеризации поставщиков, конкурентов, рынков сбыта, выявления схожих производственных ситуаций, при которых возникает брак, и т.п.
Кластерный анализ представляет собой совокупность методов и алгоритмов, предназначенных для разбиения исходной совокупности объектов на группы (кластеры) таким образом, чтобы в один кластер попадали объекты с близкими значениями свойств и признаков[5].
6.2 Основные этапы кластерного анализа
Основные этапы:
6.3 Кластеризация сообществ ВКОНТАКТЕ
Однако социальные сети стали не только неисчерпаемым источником бизнес-возможностей. Эксперты отмечают стремительную политизацию социальных сетей. Это предполагает формирование различных сетевых политических сообществ, причем среди них могут быть как провластные (патриотически настроенные), так и оппозиционные (от конструктивных критиков до радикалов и экстремистов)[6].
Для кластеризации брались группы разной направленности. Чтобы оценить уровень политизации социальных сетей, возможности пересечения их участников, вероятность перемещения участников из одного кластера в другой, рассматривалось три типа сообществ.
- 1. Полностью нейтральные к политике группы по интересам (рыбалка, группы книголюбов, путешественников, любителей животных и пр.).
- 2. Новостные сообщества и сообщества, созданные для обсуждения политических новостей, сообщества партий, телеканалов.
- 3. Третий вид групп аналогичен сообществам второго вида, но с ярко выраженной критической нотой, «критики».
Для решения задачи нами рассматривались 38 сообществ.
В результате кластеризации можно сделать вывод, что в целом рассмотренный контингент участников делится на пять кластеров. Кластер сообществ абсолютно индифирентных к политике (кластер 2); кластер лиц имеющих свои увлечения и предпочитающих получать краткие политические новости. Кластер критикующих и два кластера политической направленности, причем в одном из них в группы выкладываются только позитивные новости, в другом возможна незначительная критика.
|
Полученные данные не противоречат данным других источников[7]. Как правило, политически активными является лишь незначительная (до 10%) часть общества, однако, как показывают исследования, политическая активность населения растет[8].
7. Модели распространения информации
Одним из существенных аспектов изучения социальных сетей является процесс распространения информации в сети. Под термином распространение информации
принимается процесс, посредством которого некоторый информационный объект распространяется по коммуникационным каналам во времени и в пространстве среди узлов сети. Существует несколько различных подходов к моделированию процесса распространения информации.
Одним из методов моделирования процесса распространения информации является моделирование, базирующееся на аналогиях с физикой и медициной и получившее название модели просачивания и заражения или эпидемии [9-10]. Скорости распространения информации высоки по аналогии с обычной эпидемией, при условии, что информация вызвала всеобщий интерес. Распространение начинается с небольшого числа групп и постепенно переходит на все большее их число, достигает пика, далее следует спад.
Как правило, процесс распространения предполагает три этапа: формирование базы распространения (медленный рост), резкий рост и третий этап – насыщение и спад интереса к информации.
Для разработки модели процесса распространения информации были собраны статистические данные за первые три дня после первой публикации информации об указе в СМИ. Указ Об определении в гуманитарных целях категорий лиц, имеющих право обратиться с заявлениями о приёме в гражданство Российской Федерации в упрощённом порядке
.
На рис показано, как изменялась область распространения информации в течении трех суток, за 100% принят суммарный охват пользователей за эти три дня.
|
7.1 Вейвлет-анализ
С помощью вейвлет-анализа разработана модель распространения информации в сети. Пиком интереса к новости является второй день события, информация остается актуальной в течении пяти дней, если это действительно важная новость. В целом интерес к новости исчезает на одиннадцатый день.
Нами даны результаты применения вейвлет-преобразований. По оси Х отложены точки временного интервала, по У – количество групп ВКонтакте, опубликовавших новость и присоединившихся к обсуждению. Пунктирной линией отображен исходный сигнал, т.е. статистические данные, красным цветом информация, очищенная от шума.
|
Аналогичные преобразования были применены к статистическим данным числа просмотров и репостов информации. Полученные данные обработаны в пакете Statistica с целью прогнозирования длительности интереса
к информации, см. рис. Синим цветом на рисунке отмечена кривая изменения количества просмотров, красным – интерполирующий полином, пунктирной линией – прогнозируемое количество просмотров в последующие часы. Как видно, интерес к новости будет сохраняться, однако ее уровень существенно снизится. Локальные минимумы соответствуют ночному времени. Максимальное число просмотров приходится на второй день, в последующие дни интерес начинает ослабевать.
|
Выводы
В ходе выполнения магистерской работы были изучены существующие модели, описывающие социальные сети, собрана статистика, доказывающая популярность сетей, необходимость и целесообразность их исследований.
Разработаны модели кластеризации сообществ ВКонтакте, позволяющие прогнозировать миграцию подписчиков групп/пабликов.
С помощью методов временного прогнозирования разработан алгоритм прогнозирования числа участников в группах.
Т.к. моделирование социальных процессов преследует множество различных целей и задач, то важным аспектов выполненной работы является создание на основе большого числа статистических данных, собранных автором, модели распространения информации в сети, оценены сроки актуальности и популярности распространяемых по сети новостей.
Для выполнения перечисленных задач автором была создана и проанализирована обширная статистическая база, в которую входили данные глобальной Интернет-статистики по пользователям, их личностным особенностям, темпам проникновения пользователей в Интернет, количеству сообщений, публикуемых авторами в социальных сетях, уровню отзыва сети (лайки, репосты, комментарии) на полученную информацию.
Статистические данные собирались автором в течение трех лет, кроме общедоступных источников использовался такой инструмент, как онлайн опросы. Полученные результаты опубликованы.
Результаты работы позволяют разрабатывать и обосновывать механизмы эффективного информационного управления и продвижения информации в социальных сетях.
Список источников
- Barnes, J. A. Class and committees in a Norwegian Island parish// HumanRelations.- 1954. V.7.-P 39-58.
- DIGITAL 2019 : THE RUSSIAN FEDERATION [Электронный ресурс] : / DataReportal. Режим доступа: http://www.journ.msu.ru/downloаds/smi_intеrnеt.pdf.
- Свинцовский А.А. Теоретические аспекты моделирования социальных сетей. Информационное общество, 2013, вып. 6, с. 16-21.
- Прогнозирование временных рядов в пакете Statistica : методические указания / сост. Л.И. Дубровская. – Томск : Томский государственный университет, 2012. – 36 с.
- Кластерный анализ и сегментация. [Электронный ресурс]/ Режим доступа: http://www.tidydata.ru/segmentation.
- Федорченко С.Н. Глобальное исследование политизации социальных сетей // Обозреватель - Observer, 2016. №8(319). С. 57-67.
- 13 малоизвестных аналитических инструментов для сообществ «ВКонтакте». Нетология. [Электронный ресурс]/ Режим доступа: https://netology.ru/blog/13-maloizvestnykh-instrumentov-dlya-raboty-s-soobshchestvami-vkontakte.
- Манипуляция обществом или истинный размер пяти процентов. Режим доступа: https://alex-leshy.livejournal.com/480772.html.
- Губанов Д.А., Новиков Д.А., Чхартишвили А.Г. Социальные сети: модели информационного влияния, управления и противоборства. 3-е изд., перераб. и дополн. М.: МЦНМО, 2018. – 224 с.
- Губанов Д.А., Новиков Д.А., Чхартишвили А.Г. Модели влияния в социальных сетях // Управление большими системами. 2009. № 27. С. 205-281.