Перейти к основному содержанию
ИТарктика
УДК 004.77
Михаил Ростиславович Елагин
советник директора ГАУ РК "ЦИТ"
Методы и инструменты анализа сложных (комплексных) сетей
Аннотация:

В статье приведен обзор методов и инструментов анализа и моделирования комплексных (сложных) сетей различной природы (в первую очередь социальных и технических сетей).

Ключевые слова: сложные сети, комплексные сети, сетевой анализ, анализ рисков.

  1. Введение

Данная статья представляет собой краткий обзор методов и инструментов анализа сетей различного типа (в первую очередь сетей социального взаимодействия), применяющихся в рамках научно-исследовательских и опытно-конструкторских работ по тематике «Исследование, анализ и моделирование сложных (комплексных) сетей, в том числе сетей социального взаимодействия, с целью выявления и предотвращения социальных и политических рисков, определения тенденций развития», проводимых ГАУ РК ЦИТ.

Как следует из названия темы, основной целью работ является разработка методов и создание информационно-аналитических систем, предназначенных для выявления и раннего предупреждения рисков различного характера в средах взаимодействия, представляемых в виде комплексных сетевых структур.

  1. Что такое сложные (комплексные) сети

С точки зрения теории, комплексная (сложная) сеть – это  множество объектов (узлов) различной природы, связанных друг с другом связями различного типа, которые могут динамически изменяться во времени.  Сложные сети, как правило, обладают нетривиальной топологией. Различная природа объектов, множественность разнотипных связей, временная динамика связей с одной стороны, делают такую сеть достаточно сложным объектом исследования, но, с другой стороны, позволяют описать в терминах сети практически любую сложную структуру, как техническую, так и социальную.

  1. Примеры сложных (комплексных) сетей
    • Сети социальных взаимодействий (от «бабушек у подъезда» до социальных сетей Интернет)
    • Организационная структура предприятий, корпораций
    • Организационная структура функциональных сообществ (от «элитных клубов» до преступных сообществ)
    • Корпоративные компьютерные сети (совокупность рабочих мест, сервером, сетевого оборудования, каналов связей и пользователей)
    • Текст (совокупность слов, связанных семантическими связями)
  1. Цели и задачи анализа и моделирования комплексных сетей

Практически любая сеть может быть рассмотрена как среда распространения сигналов (влияний) различного типа. Анализ топологических характеристик сети и ряда параметров и атрибутов, выходящих за рамки классической топологии, позволяют осуществить предсказание поведения «возмущений» в сети, распространение различного типа влияний и воздействий. Кроме того, анализ определенного типа сетей, таких, как текстовые сообщения, позволяет осуществлять анализ внутренней структуры (контент-анализ), внутреннего посыла (интент-анализ), идентификацию авторства текстов. Также представляет интерес возможность поиска скрытых (неявных) связей между объектами, выявление «кластеров» и «клик».

В практическом плане задачи анализа и моделирования сложных (комплексных) сетей связаны, в большинстве своем, с выявлением, анализом и ранним предупреждением рисков, а также с предиктивным анализом и моделированием поведения.

Среди задач такого рода можно указать:

  • Моделирование «диффузии инновацией» - распространения различных идей в обществе, с учетом существования различных групп и разной топологии сообществ;
  • Моделирование и анализ распространения информации в различных социальных группах;
  • Моделирование электоральных процессов, моделирование протестных движений;
  • Поиск скрытых (неявных) взаимосвязей между различными акторами, в том числе, в задачах выявления конфликтов интересов, в других задачах экономической безопасности;
  • Выявление различных связанных групп (кластеров, клик), в том числе в организационных структурах различного типа;
  • Анализ управляемости сложных организационных структур;
  • Анализ и моделирование информационных потоков, потоков влияния и управления

Приведенный выше примерный список решаемых задач показывает, для каких целей могут быть применены методы и инструменты сетевого анализа:

  • Снижение рисков и различных видов ущерба (политического, имиджевого, финансового и т.п.) за счет раннего выявления угрожающих ситуаций и возможности детального анализа развития таких ситуаций в динамике;
  • Повышение качества и эффективности управления сложными структурами (корпорации, государственное и муниципальное управление), в первую очередь на операционном, тактическом и оперативном уровне, за счет возможности анализа большинства аспектов информационного взаимодействия, возможности анализа, прогнозирования и моделирования ситуаций.
  • Повышению качества подготовки и принятия решений за счет возможности детального, технологичного анализа информационных потоков и структур, обеспечивающих социальное взаимодействие.
  1. Реализация. Функционал системы.

В рамках исследовательского проекта и опытно-конструкторской работы разрабатывается система, позволяющая реализовывать следующие функции в части сетевого анализа структур информационного поля:

  • Собирать информацию об информационных потоках в обществе (СМИ, социальные сети, публикации, выступления, комментарии и т.п.),
  • Выявлять по открытым источникам лидеров общественного мнения (в том числе анонимных или выступающих под прикрытием виртуальных «фейковых» личностей), оценивать их влияние на определенные сегменты общества, в зависимости от возникающих ситуаций,
  • Выявлять по открытым источникам основные и неявные каналы распространения информации, характеристики распространения информации (сознательные и несознательные искажения, слухи и т.п.),
  • Оценивать степень влияния на лидеров общественного мнения и на ключевые источники информации различных «внешних» источников, выявлять случаи и ситуации сознательного «вброса» информации из сторонних источников,
  • Выделять и отслеживать информационное поведение различных социальных групп и функциональных сообществ, оказывающих или могущих оказывать влияние на социальные, социально-экономические, общественно-политические процессы в обществе,
  • Строить схемы взаимодействия объектов (социальные группы, персоны, организации и т.п.), позволяющие моделировать распространение информации, информационных и иных воздействий в различных ситуациях (в том числе критических),
  • Прогнозировать возможность негативного развития различных ситуаций в информационном пространстве, оценивать результаты их развития и отрабатывать модели реагирования и противодействия.

Кроме того, разрабатываемая система позволяет классифицировать всю поступающую информацию, оперативно выявлять события и объекты, представляющие интерес для различных органов власти (например, в таких сферах, как промышленность, сельское хозяйство, туризм и т.п.), осуществлять постоянный мониторинг по заданным областям и направлениям деятельности.  Система может быть применена, в частности, для анализа и моделирования инвестиционной деятельности в республике, анализе отраслевых и региональных потребностей, мониторинга экономической деятельности и взаимодействия субъектов рынка.

 

  1. 6. Используемые инструменты
    1. Системы хранения, анализа, визуализации объектов и связей
  • AllegroGraph – графовая NoSQL база данных, со встроенным языком запросов, позволяющая хранить сведения об объектах и связей в виде триплетов, обеспечивающая построение и анализ семантических сетей.
  • Gruff – браузер/система визуализации/ввода и отображения данных для графовой базы AllegroGraph.
  • ORA (Organization Risk Analyzer, университетская система, бесплатная для некоммерческого использования, однопользовательская) – система, предназначенная для описания и анализа сложных сетей (социальные группы и сети, организации, сообщества различного типа, сети целей и задач и т.п.). Позволяет анализировать сети, выявлять скрытые(неявные) структуры и связи, выделять ключевые элементы, обеспечивающие связанность различных подсетей (например, в организации, или в преступном сообществе), моделировать распространение различных «сигналов» в заданных сетях (например, распространение слухов в сообществе, распространение инфекции в городе, «диффузию денег» и т.п., моделировать поведение различных сетей при изменении их структуры (например, при ликвидации или изоляции ключевых элементов).
  • ИАС «Семантический архив» (российская коммерческая разработка, Москва) - в настоящее время используется только для сбора, классификации и статобработки публикаций в СМИ и подготовки тематических дайджестов (обзоров прессы по заданным тематикам, с упоминанием заданных ключевых слов – персон, организаций). Введена в промышленную эксплуатацию.
  • «PersonalBrain» (коммерческая зарубежная однопользовательская система) - графическая «записная книжка», позволяющая вести локальную базу данных по персонам, организациям, событиям, объектам различного типа, выстраивать и визуализировать связи между ними (например, служебные, родственные отношения, связь с определенными событиями или активностью и т.п.). Не имеет средств автоматической обработки сетей по сложным алгоритмам, но позволяет визуально выявлять неявные связи.
  • Gephi (программа на открытых кодах) – программа для обработки и анализа сложных сетей, позволяющая определять топологию сетей (типы связанности), выявлять устойчивые структуры (кластеры, «клики»). Позволяет проводить  сложный анализ сетевых структур.
  • VenSim PLE (зарубежная разработка, бесплатная для некоммерческого использования) – система когнитивного моделирования и анализа сложных процессов, позволяет анализировать (качественно и количественно) влияние различных  факторов на  конечный результат.
  • AnyLogic (коммерческая система, отечественная разработка, С.-Петербург) – универсальная система моделирования, позволяющая, по различным методикам (системная динамика, агентное и мультиагентное моделирование, когнитивное моделирование и анализ) моделировать поведение различных социальных и технических систем (начиная от моделирования вирусной атаки на компьютерную сеть заканчивая моделирование протестных настроений в обществе). Коробочный продукт, не требующий ввода в эксплуатацию.
    1. Внешние базы данных:
  • Integurm (отечественная коммерческая база данных по организациям и ИП) – аналог базы SPARQ, содержит актуальную информацию по организациям (карточки компаний, регистрационная информация, учредители, действующие и бывшие руководители статистическая отчетность, учрежденные организации, формы ЕГРЮЛ, заключенные госконтракты и т.п.). Имеет возможность представления связей между объектами в виде сети (графа).

Литература

  1. Евин, И. А. Введение в теорию сложных сетей [Текст] / И. А. Евин // Компьютерные исследования и моделирование. – 2010. – Т. 2, № 2. – С. 121-141.
  2. Кравченко, С. А. Динамичная природа социального риска: необходимость нелинейного мышления и адекватного теоретического инструментария [Текст]   / С. А. Кравченко // Социальная политика и социология. – 2008. – № 3 (39). – С. 44-60.
  3. Губанов, Д. А. Моделирование репутации и информационного управления в социальных сетях [Текст] / Д. А.  Губанов, Д. А. Новиков, А. Г. Чхартишвили // Управление большими системами. – 2009. –  № 26.1. – С. 209-234.
  4. Моделирование социально-политической и экономической динамики [Текст] / А. Михайлов [и др.] . – Москва : РГСУ, 2004.
  5. Харитонов, В. А. Сетевые механизмы анализа многофакторных рисков [Текст] / В. А. Харитонов,  А. О. Алексеев // Сетевые модели в принятии решений. Управление большими системами. – 2010. – № 30.1. –  С. 197–218.