EN
ДонНТУ   Портал магистров

Реферат по теме выпускной работы

Содержание

Введение

Термин cоциальная сеть (от англ. social networks) введён в 1954г. социологом Джеймсом Барнсом. В своей работе он охарактеризовал социальную сеть как систему точек, точками этой системы являются люди[1].

В настоящее время социальные сети являются самыми популярными веб-сайтами в мире, после поисковиков. И если популярность поисковиков вполне понятная, то в чём же популярность социальных сетей?

Социальные сети многофункциональны и имеют очень простой формат. Их можно использовать для личного общения, поиска работы, продвижения бизнеса и политических идей, поиска вариантов сотрудничества.

68% глав государств и правительств из 193 стран – членов ООН имеют свои собственные аккаунты в соцсетях.

Огромный плюс социальных сетей – отсутствие вирусов.

По данным международного агентства We Are Social, специализирующегося на исследованиях в области соцмедиа:

  • в 2019 году аудитория интернета насчитывает 4.39 миллиарда человек, что на 366 миллионов (9%) больше, чем в январе 2018 года;
  • в социальных сетях зарегистрировано 3.48 миллиарда пользователей. По сравнению с данными на начало прошлого года этот показатель вырос на 288 миллионов (9%) [2].
  • 1. Актуальность темы

    Актуальность темы исследования обусловлена ростом популярности в обществе социальных сетей, и их дальнейшее развитие в значительной степени определяет и перспективы развития Интернета.

    К популярным социальным сетям можно отнести: ВКонтакте, Одноклассники, Twitter, Facebook, Instagram. В России самой перспективной и популярной сетью является сеть ВКонтакте. Ее аудитория составляет 77% от всей мобильной аудитории в России, а это 97 миллионов активных пользователей.

    2. Цель и задачи исследования

    Цель исследования состоит в разработке и исследовании математических моделей описания поведения социальных групп.

    К числу основных задач исследования относятся:

    1. Разработка приемов кластеризации сообществ в социальных сетях.
    2. Временное моделирование количества агентов в сообществах.
    3. Разработка модели распространения информации в сети.

    Объект исследования: сообщества социальной сети ВКонтакте.

    3. Научная новизна

    Предложена математическая модель кластеризации сообществ. Предложены математические модели, объясняющие образование семейства групп, как результат активизации массы индивидов с последующей дифференциацией их на группы разного уклона. Разработана математическая модель, описывающая жизненный цикл сообществ в социальных сетях. Смоделированы на основе вейвлет-анализа процессы распространения информации в сети.

    4. Обзор методов моделирования социальных сетей

    При исследовании социальных сетей можно выделить основные этапы: определить статистические свойства, характеризующие поведение систем с сетевой структурой; получить статистические данные; создать модели сетей; спрогнозировать поведение систем на основе измеряемых свойств.

    При моделировании социальных сетей, как правило, используется несколько основных характеристик:

  • дискретность;
  • подобие (ключевые характеристики узлов сети должны быть тождественны друг другу);
  • близость (узлы должны находиться в едином пространственно-временном цикле);
  • взаимность (взаимодействие узлов).

    Социальные сети подразделяются на формальные и неформальные, вертикальные и горизонтальные. Неформальные социальные сети строятся на неформальных связях, в формальных социальных сетях четко определены роли, права и обязанности каждого участника.

    В социальных сетях, построенных по вертикальному признаку, вершину образует команда, которая состоит из лидеров и их ближайших помощников. Команда формирует стратегию группы, тактику взаимодействия, конфронтации или сотрудничества с внешними социальными сетями.

    Социальные сети, построенные по горизонтальному принципу являются сообществом агентов примерно одного социального статуса и, соответственно, влияния [3].

    5. Временное моделирование социальных медиа

    Жизненный цикл социальных групп

    Социальные сети можно использовать как инструмент для осведомления людей о новом продукте, запущенном на рынок. Социальные медиа могут использоваться в качестве механизма распространения скидочных купонов и предложений, что делает их средством реализации стратегий жизненного цикла продукции. Социальные сети можно использовать для рекламы.

    Поэтому стратегии социальных сетей идут бок о бок со стратегиями жизненного цикла продукта, и оба типа циклов актуальны для маркетологов в процессе принятия решений[4].

    Каждый продукт или услуга имеет жизненный цикл, и, сообщества в социальных сетях имеют свой специфический сценарий жизненного цикла. Люди также имеют жизненный цикл, начинающийся с рождения и заканчивающийся смертью. Они проходят через младенчество, рост, зрелость и смерть.

    Зная этапы развития групп, можно использовать этапы роста и зрелости групп, которые являются отличными площадками для продвижения бизнеса с помощью социальных сетей.

    Жизнь группы или всей сети начинается с начальной зоны, за которой следует всплеск молвы (резкое увеличение участников), затем спад лощина сомневающихся (или долина сомнений), когда часть участников покидает группу, затем рост числа участников сети до зоны стабильности и неизбежное умирание проекта с заменой его новым, более актуальным.

    Особенности жизненных циклов в социальных сетях (анимация: 8 кадров, 8 циклов повторения, 95.5 килобайт)

    Начиная с лета 2014г. нами собирались исходные данные по нескольким группам Вконтакте. Наиболее показательна с точки зрения циклов жизненных групп оказалась группа Сводки от ополчения Новороссии.

    В поле зрения группа попала 1 июня 2014г, когда у нее было 12 тысяч подписчиков, и уже через пять дней их количество превысило 33 тысячи.

    На рисунке показан рост числа подписчиков группы, по оси У показано число подписчиков, по Х – даты.

    Рост числа подписчиков группы

    Рассматривая историю групп как временные ряды, мы выделили сезонную составляющую. Как видно, наибольшей активностью участники группы отличаются в осенние месяцы, наименьшей – в августе.

    Анализ активности по дням недели показал, что наименьшее количество участников участвуют в обсуждениях в субботу.

    Сезонная составляющая временных рядов

    6. Кластеризация сообществ

    6.1 Общие понятия кластеров

    Одним из возможных подходов к обработке статистических данных с целью выделения объектов в группы со схожими характеристиками является кластерный анализ.

    Впервые термин кластер вошел в научный оборот в математике, когда в конце 1930-х гг. был сформулирован аппарат кластерного анализа многомерных данных. Слово «кластер» можно перевести с английского языка как кисть, гроздь; скопление, концентрация; группа. Экономическая интерпретация слова введена в научный оборот в 1990г. американским экономистом М. Портером

    Посредством кластерного анализа могут успешно решаться такие задачи, как первичный скоринг-рисков, характерных для деятельности банков и страховых компаний, оценка эффективности операций на рынке ценных бумаг и производных финансовых инструментов. Другими примерами могут быть задачи, связанные с необходимостью кластеризации поставщиков, конкурентов, рынков сбыта, выявления схожих производственных ситуаций, при которых возникает брак, и т.п.

    Кластерный анализ представляет собой совокупность методов и алгоритмов, предназначенных для разбиения исходной совокупности объектов на группы (кластеры) таким образом, чтобы в один кластер попадали объекты с близкими значениями свойств и признаков[5].

    6.2 Основные этапы кластерного анализа

    Основные этапы:

  • формирование базы данных, в том числе выделение и отбор характеристик исследуемых объектов;
  • выбор метрик, т.е. определение критериев схожести объектов;
  • разбиение множества объектов на группы;
  • представление и интерпретация полученных результатов;
  • оценка результатов кластеризации.
  • 6.3 Кластеризация сообществ ВКОНТАКТЕ

    Однако социальные сети стали не только неисчерпаемым источником бизнес-возможностей. Эксперты отмечают стремительную политизацию социальных сетей. Это предполагает формирование различных сетевых политических сообществ, причем среди них могут быть как провластные (патриотически настроенные), так и оппозиционные (от конструктивных критиков до радикалов и экстремистов)[6].

    Для кластеризации брались группы разной направленности. Чтобы оценить уровень политизации социальных сетей, возможности пересечения их участников, вероятность перемещения участников из одного кластера в другой, рассматривалось три типа сообществ.

      1. Полностью нейтральные к политике группы по интересам (рыбалка, группы книголюбов, путешественников, любителей животных и пр.).
      2. Новостные сообщества и сообщества, созданные для обсуждения политических новостей, сообщества партий, телеканалов.
      3. Третий вид групп аналогичен сообществам второго вида, но с ярко выраженной критической нотой, «критики».

    Для решения задачи нами рассматривались 38 сообществ.

    В результате кластеризации можно сделать вывод, что в целом рассмотренный контингент участников делится на пять кластеров. Кластер сообществ абсолютно индифирентных к политике (кластер 2); кластер лиц имеющих свои увлечения и предпочитающих получать краткие политические новости. Кластер критикующих и два кластера политической направленности, причем в одном из них в группы выкладываются только позитивные новости, в другом возможна незначительная критика.

    Инфографика. Распределение групп по кластерам

    Полученные данные не противоречат данным других источников[7]. Как правило, политически активными является лишь незначительная (до 10%) часть общества, однако, как показывают исследования, политическая активность населения растет[8].

    7. Модели распространения информации

    Одним из существенных аспектов изучения социальных сетей является процесс распространения информации в сети. Под термином распространение информации принимается процесс, посредством которого некоторый информационный объект распространяется по коммуникационным каналам во времени и в пространстве среди узлов сети. Существует несколько различных подходов к моделированию процесса распространения информации.

    Одним из методов моделирования процесса распространения информации является моделирование, базирующееся на аналогиях с физикой и медициной и получившее название модели просачивания и заражения или эпидемии [9-10]. Скорости распространения информации высоки по аналогии с обычной эпидемией, при условии, что информация вызвала всеобщий интерес. Распространение начинается с небольшого числа групп и постепенно переходит на все большее их число, достигает пика, далее следует спад.

    Как правило, процесс распространения предполагает три этапа: формирование базы распространения (медленный рост), резкий рост и третий этап – насыщение и спад интереса к информации.

    Для разработки модели процесса распространения информации были собраны статистические данные за первые три дня после первой публикации информации об указе в СМИ. Указ Об определении в гуманитарных целях категорий лиц, имеющих право обратиться с заявлениями о приёме в гражданство Российской Федерации в упрощённом порядке.

    На рис показано, как изменялась область распространения информации в течении трех суток, за 100% принят суммарный охват пользователей за эти три дня.

    Область распространения информации

    7.1 Вейвлет-анализ

    С помощью вейвлет-анализа разработана модель распространения информации в сети. Пиком интереса к новости является второй день события, информация остается актуальной в течении пяти дней, если это действительно важная новость. В целом интерес к новости исчезает на одиннадцатый день.

    Нами даны результаты применения вейвлет-преобразований. По оси Х отложены точки временного интервала, по У – количество групп ВКонтакте, опубликовавших новость и присоединившихся к обсуждению. Пунктирной линией отображен исходный сигнал, т.е. статистические данные, красным цветом информация, очищенная от шума.

    Вейвлет-преобразования временного ряда

    Аналогичные преобразования были применены к статистическим данным числа просмотров и репостов информации. Полученные данные обработаны в пакете Statistica с целью прогнозирования длительности интереса к информации, см. рис. Синим цветом на рисунке отмечена кривая изменения количества просмотров, красным – интерполирующий полином, пунктирной линией – прогнозируемое количество просмотров в последующие часы. Как видно, интерес к новости будет сохраняться, однако ее уровень существенно снизится. Локальные минимумы соответствуют ночному времени. Максимальное число просмотров приходится на второй день, в последующие дни интерес начинает ослабевать.

    Статистические данные числа просмотров и репостов

    Выводы

    В ходе выполнения магистерской работы были изучены существующие модели, описывающие социальные сети, собрана статистика, доказывающая популярность сетей, необходимость и целесообразность их исследований.

    Разработаны модели кластеризации сообществ ВКонтакте, позволяющие прогнозировать миграцию подписчиков групп/пабликов.

    С помощью методов временного прогнозирования разработан алгоритм прогнозирования числа участников в группах.

    Т.к. моделирование социальных процессов преследует множество различных целей и задач, то важным аспектов выполненной работы является создание на основе большого числа статистических данных, собранных автором, модели распространения информации в сети, оценены сроки актуальности и популярности распространяемых по сети новостей.

    Для выполнения перечисленных задач автором была создана и проанализирована обширная статистическая база, в которую входили данные глобальной Интернет-статистики по пользователям, их личностным особенностям, темпам проникновения пользователей в Интернет, количеству сообщений, публикуемых авторами в социальных сетях, уровню отзыва сети (лайки, репосты, комментарии) на полученную информацию.

    Статистические данные собирались автором в течение трех лет, кроме общедоступных источников использовался такой инструмент, как онлайн опросы. Полученные результаты опубликованы.

    Результаты работы позволяют разрабатывать и обосновывать механизмы эффективного информационного управления и продвижения информации в социальных сетях.

    Список источников

    1. Barnes, J. A. Class and committees in a Norwegian Island parish// HumanRelations.- 1954. V.7.-P 39-58.
    2. DIGITAL 2019 : THE RUSSIAN FEDERATION [Электронный ресурс] : / DataReportal. Режим доступа: http://www.journ.msu.ru/downloаds/smi_intеrnеt.pdf.
    3. Свинцовский А.А. Теоретические аспекты моделирования социальных сетей. Информационное общество, 2013, вып. 6, с. 16-21.
    4. Прогнозирование временных рядов в пакете Statistica : методические указания / сост. Л.И. Дубровская. – Томск : Томский государственный университет, 2012. – 36 с.
    5. Кластерный анализ и сегментация. [Электронный ресурс]/ Режим доступа: http://www.tidydata.ru/segmentation.
    6. Федорченко С.Н. Глобальное исследование политизации социальных сетей // Обозреватель - Observer, 2016. №8(319). С. 57-67.
    7. 13 малоизвестных аналитических инструментов для сообществ «ВКонтакте». Нетология. [Электронный ресурс]/ Режим доступа: https://netology.ru/blog/13-maloizvestnykh-instrumentov-dlya-raboty-s-soobshchestvami-vkontakte.
    8. Манипуляция обществом или истинный размер пяти процентов. Режим доступа: https://alex-leshy.livejournal.com/480772.html.
    9. Губанов Д.А., Новиков Д.А., Чхартишвили А.Г. Социальные сети: модели информационного влияния, управления и противоборства. 3-е изд., перераб. и дополн. М.: МЦНМО, 2018. – 224 с.
    10. Губанов Д.А., Новиков Д.А., Чхартишвили А.Г. Модели влияния в социальных сетях // Управление большими системами. 2009. № 27. С. 205-281.