【复杂网络分析】motif、cluster、clique、community 的介绍和比较

写在前面的话

这几个概念之前没弄清楚,查了资料整理了一下,并且结合自己的理解和大家分享一下。

介绍

Motif(模体) :网络中频繁出现的局部连接模式。更学术的解释是:在复杂网络中发现的某种相互连接的模式个数显著高于随机网络

Cluster :这和聚类有关,基于节点邻居们的相似性集结成团。具体来说,就是根据clustering coefficient(一个点的邻接点之间相互连接的程度)形成密度相对较高的网群。

Clique最大的完全子图,全连接的完全子图。这里涉及到一个概念,派系。派系是一个点的子集(sub-set),其中任何一对点都有一条直边相连接,并且派系是不被其他任何派系所包含的。

如下图所示,一个3-成员的派系有3条边,一个4-成员的派系有6条边,一个5-成员的派系有10条边,以此类推,一个n-成员的派系有n(n-1)/2条边。
在这里插入图片描述

Community社区内部节点之间有很多连接,但是这些节点和其它社区节点连接较少

比较

大家看了上面的介绍可能会感觉这几个概念很相似,下面说一下我的理解。

Motif(模体)

如果节点中的边带有权重,或者节点有着内在属性(特征),可以将模体扩展为权重数值排列不同的多个子图。这些子图可以描述网络生成的动力学特征。不同于内部紧密连接的community,模体描述的因为网络生成过程中所涌现出的规律,而不是已完成的网络所呈现的局部密集的区域。

简单来说就是,模体更像是一种规律的体现,所涉及和体现的内容更广。在三个节点组成的有向图,一共有 13 种可能,其中每一种,如果在网络中出现的概率比随机网络中明显高一截,就可以看成是一个模体。

Cluster:生活社交网络中,你的朋友之间相互认识的程度。Cluster更关心点的相似性问题,Motif更关心网络生成的规律,Community更关心社区内外的区别

Clique :Clique与Community紧密联系,如果两个k-clique之间存在k-1个共同的节点,那么就称这两个clique是“相邻”的。彼此相邻的这样一串clique构成最大集合,就可以称为一个Community(而且这样的社区是可以重叠的,即所谓的overlapping community,就是说有些节点可以同时属于多个社区)。下面第一组图表示两个3-clique形成了一个社区,第二组图是一个重叠社区的示意图。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
这里着重提一下社团检测和聚类,这两者很容易混淆

社团检测:找出网络中联系紧密的部分,社团内部联系紧密,社团之间联系稀疏 。

紧密怎么定义?

很容易想到密度高这一点,这是和顶点,边,度等结构分不开的,这些都体现网络的结构

简单来说,就是社团检测更关心网络中紧密的部分,而忽略节点属性相似性

聚类:将不同类的节点分开,同类的节点聚成一类。

聚类的核心?

计算节点之间的距离或相似度,根据这个依据进行操作。这些距离和相似度都利用节点特征进行计算得到,但是没有考虑节点的边,度等结构。

简单来说,就是聚类更关心节点属性相似性,而忽略节点之间的联系

可以看出两者存在本质的区别,但是不互相冲突

社团检测和聚类的结合屡见不鲜,利用属性辅助社团检测目前很火,大家可以去网上找找。

总结

Community更关心网络中紧密的部分

Cluster更关心点的属性相似性问题

Clique与Community相关,但不是其子集,它只是一个全连接的完全子图概念

Motif 更关心网络生成规律,或者说是功能的独立性,因为它需要与一些特定的功能(动力学)建立起联系,因此它所描述的不只是拓扑层次的信息,还必须包含一定的动力学

Logo

瓜分20万奖金 获得内推名额 丰厚实物奖励 易参与易上手

更多推荐