Университет ИТМО

Научный вебинар «Выделение сообществ в сетях с атрибутами узлов»

 

Во время этой онлайн встречи мы обсуждали актуальную ситуацию в области методологии выделения сообществ в сетях с атрибутами узлов, а также предложим классификацию существующих методов и оценим их достоинства и недостатки. Отдельное внимание было уделено существующим проблемам в области выделения сообществ в сетях с атрибутами узлов, в том числе проблеме критического отбора методов для практического использования.

 

В мире больших данных повсеместно встречаются сети с определенной структурой, узлы которых снабжены дополнительной информацией – атрибутами. Например, это могут быть социальные сети, где атрибутами узлов являются интересы пользователя, в частности, подписки на тематические сообщества; или сети документов с гиперссылками, где в качестве атрибутов узлов выступают ключевые слова документа. Для удобства анализа атрибуты узлов обычно представляют в виде векторов с вещественными числами в качестве элементов. 

Задача выделения сообществ в таких сетях состоит в поиске подмножеств узлов (называемых сообществами, кластерами, модулями или группами) таких, что внутри каждого подмножества узлы тесно связаны структурно и при этом имеют похожие атрибуты. Например, можно выделять в социальной сети так называемые тематические сообщества — группы пользователей с тесными дружескими связями и похожими интересами (тематикой подписок). Такое выделение сообществ имеет не только очевидные приложения в маркетинге и рекламе (зная тематические сообщества, например, можно целенаправленно и экономно делать рекламные и маркетинговые предложения заинтересованным лицам в социальных сетях), но и позволяет получать полезную информацию для решения широкого круга задач: от борьбы со спамом до раскрытия принципов функционирования мошеннических и террористических организаций, от кластеризации сетей документов до анализа сетей межбелкового взаимодействия и распространения эпидемий.

К настоящему времени накопилось огромное количество методов выделения сообществ в сетях с атрибутами узлов, основанных на различных идеях и техниках. Какие из этих методов выбрать аналитику, чтобы получить качественные результаты на практике? Эта задача, как выясняется, весьма нетривиальна…

 

Докладчик — Петр Чунаев, научный сотрудник НЦКР Университета ИТМО, кандидат физико-математических наук