文件名称:Twitter-基于社交网络的推荐章节数据集.zip
文件大小:19.79MB
文件格式:ZIP
更新时间:2024-04-06 11:55:17
推荐系统 NLP
【数据说明】本数据是Twitter用户的信息,包含了用户的属性、社交圈(circles)和egonetwork,数据已被做了脱敏处理。数据共有81306个用户和1768149条连边。 nodeId.edges:用户nodeId的egonetwork中的所有连边,nodeID是此egonetwork的中心节点。Twitter中的朋友关系是有方向的,比如文件中的一行元素为“a b”,就表示a关注了(follow)b,这不意味着b一定关注了a。注:nodeId并不出现在这些连边列表中,但是中心节点nodeId关注了此文件中的所有id。 nodeId.circles:用户nodeId所在的社交圈(circle),以及社交圈内的所有其他成员。每一行数据对应一个社交圈;第一列元素表示社交圈的编号。 nodeId.feat:该文件描述了在对应的nodeId.edges文件中所有出现用户的属性特征。第一列元素是用户id;从第二列开始,对应到不同维度的属性,1表示用户拥有这个属性,0则表示没有。 nodeId.egofeat:用户nodeId的属性特征。 nodeId.featnames:属性特征的名称。提供了属性特征的类别,比如教育信息、生日信息等,但是更详细的信息就被隐藏掉了。 【使用说明】需要引用J. McAuley, J. Leskovec. Learning to Discover Social Circles in Ego Networks. NIPS 2012, pp. 539-547. 【源数据出处】斯坦福大学网络分析平台