在许多领域的论文,尤其是生物和计算机类的论文中,我们经常会见到motif,那么motif是什么意思?本文将通过最最原始的一篇论文《Network Motifs: Simple Building Blocks of Complex Networks》来介绍一下motif的来龙去脉,以及检测方法,以及其本质内涵。
论文地址:Network Motifs——《Science》
本文旨在发现诸如“小世界现象”和“scale-free网络”等网络特征的背后的机理。并提出了一种检测network motifs的算法,这种方法可以适用于几乎任何网络。
首先假设网络是有向的,具有许多潜在的n-node subgraphs(n这里取3和4)。我们说motifs就是那种与随机网络相比出现次数较多的n-node subgraph结构。
我们构造的随机网络上的单个结点具有和真实网络一样的特性,即每个结点的入度和出度与真实网络中的对应结点相同。另外还生成了具有相同(n-1)-node的子图结构,以保证motif不会因为其子模式的重要而重要。(这里比较绕,就是说生成相同的n-node子图的子图,这样你检测出来的n-node子图才有意义。)
此图红色虚线表示一种feedforward loop motif模式在现实网络中出现五次,而在随机图上出现次数很少。
由此,我们定义**“network motifs”**为在随机图中出现的次数大于或等于在真实网络的概率小于一个截断点(cutoff value)概率P=0.001。(这里就理解为motifs在真实网络中出现的概率较大)
下面是算法的应用,以及结论:
- 转录基因网络
- 食物网
- 神经元网络
- 电路网络
- 万维网
结论:
不重要,就是说具有相同特征的网络中提取出来的motifs也是相同的,主要看一下提取出来的motifs的结构。
network motifs的几个优点:
对小数据集同样适用、对错误数据不敏感。