第三章-小世界

时间:2024-04-12 16:44:54

小世界问题

Milgram用信件传递实验,得到了一个平均数。
证明:

  1. 世界是小的:六度分隔,社会网络中包含丰富的短路径
  2. 自动寻找短路径:有意识的转发能够导致自动寻找短路径

问题:
为什么社会网络具有这种性质
能否依靠这些原理,构造模型

普遍性

其他学者的重复研究

电子邮件,
Dodds, Muhamad, Watts
再次证明了5-7步就能

网页之间的链接是否存在短路径。
没有关系的网页之间的直径是18次点击。

模型

随机网络没有这种小世界特性。

为什么社会网络具有这种性质:

  1. 同质性:共同朋友等,说明有很多三角形
  2. 弱联系:偶然原因(如出差),会有远程朋友,是弱链接

网格距离:地理距离,物理距离
网络距离:通过的节点数+1

可以证明:满足这两种性质的网络,网络距离会小,满足–世界是小的。

watts模型:

所有个体连接周围8人,有的节点还会发出长边连接他人。

可以证明,这个网络不能很好的体现第二条性质–自动寻找短路径。
虽然短路径存在,但是往往不能找到。

为什么社会网络的搜索会沿着短路径进行

现实社会通过短视搜索,可以找到短路径,但是watts的模型使用短视搜索,不能找到短路径。

短视搜索

国务院想找社会学专家。
国务院–北大–北大社会学系–某某人 ==>最短路径
国务院–某大学-北大–北大社会学系–某某人

短视搜索的特点:

  1. 有目标
  2. 局部知识
  3. 与目标对比,试图推进

因此,这种搜索有以下特点

  1. 每个节点有特征,特征有距离
  2. 每个个体知道目标节点的特征,自己的特征,邻居的特征
  3. 搜索过程看成是信息的传递过程,节点把信息传递给离目标节点距离较近的邻居

watts网络中使用这种短视搜索得到的不一定是最短路径。因此还是有一点缺点。

wst模型

长连接不是随机产生的:让两个节点之间的连边概率和距离(网格距离)的q次方成正比。

q是优化参数。
如果q=0,就是普通的watts,此时长连接随机产生
如果q太大,就会难以形成长连接。

理论结果:q=2最好
仿真实验:也是如此

wsk:短路径的存在性,短视搜索的有效性

q在现实中的体现

现实网络真的存在这个关系吗:
成为朋友的概率和距离平方成反比吗
第三章-小世界

距离为d 2d 3d …成为朋友的概率 3/4.3/10 4/12 .。。。

在线网络验证

数据

某社交网站上有用户的地理位置信息和关联关系。
但是这些用户地理分布不均,和假设不符。

数据处理

地理距离范围内的人数,比实际物理距离更能反映其距离。农村邻居隔较远,但是作为最近的邻居,往往容易成为朋友

重新定义距离度度量,排名rank:
和个体物理距离最近的rank为1,第二近的rank为2,依次类推。

在均匀分布的网络中,rank和d平方成正比,因此rank和d2 成正比,所以需要验证 朋友数量正比于1/rq/2 中q=2

2005 PANS 完美验证

核心-外围

社会因素,如社会地位会使得 分散搜索遇到难题。
这说明了网络结构的特征—中心外围特征

分散搜索:
通过熟人转发,在不认识的人之间建立联系。

送信的时候,送给明星比送给普通人更容易。

Milgram 1967 小世界实验假设之2:
每个人都有熟人,不过不同类型,不同阶层的人没有交往,因此不曾有连接的两人之间不能建立连接。

社会因素影响的社会结构–核心边缘结构

Borgatti, Eviertt 1999:
社会较高的人,被连接在核心紧密的核心
社会地位低的人,在边沿

不仅仅是理论,现实社会中也普遍存在

凝聚性可以用聚类系数表达,但是核心性和凝聚性不同。

对网络的理解要回到实际中去。

理论上:节点聚类系数相同,被连接到的概率相同。

现实中:
地位低的人会更加困难
媒体寻人比普通人寻人更快
结构洞上的人容易被找到。

网络结构重要,网络结构的社会属性也重要