文件名称:使用行为-基于dnn的youtube推荐
文件大小:1.7MB
文件格式:PDF
更新时间:2024-07-09 09:46:56
hadoop ETL data model user
(3)空间行为 · 旋回半径(radius of gyration):包括用户所有位置的 圆的最小半径,位置为用户停留大于 15 min 的基站。 · 旅行距离 (distance traveled):为用户在一段时间内 到访位置的连续距离。 · 地点数(number of place):用户停留地点总数。 · 地点熵(entropy of place):表示用户在某地点通话 、 发短信、上网的信息量,用户停留的地点越多,地点 熵越大。 用户 A 的地点熵计算式为: H4,A@Z=- Z ∑f4,Zlnf4,Z (5) 其中,f4,Z 为 A 在 Z 地使用手机的频率。 (4)活动行为 · 通话回复率(call response rate):表示用户回复通话 的比率, 回复通话为用户甲同用户乙通话后 1 h 内 用户乙回复用户甲的通话。 通话回复率为回复通话 次数占通话总次数的百分数。 · 短信回复率(text response rate):表示用户回复短信 的比率, 回复短信为用户甲发给用户乙短信后 1 h 内用户乙回复用户甲的短信。 短信回复率为回复短 信次数占总短信的百分数。 · 发起通话率(percent of call initiated):表示某用户同 其他用户通话时有多少次为该用户主叫。 发起通话 率等于用户主叫通话的次数与通话总次数的比率。 (5)使用行为 · 通话次数(number of call):用户通话的次数。 · 短信数(number of text):用户发短信的次数。 · 上网次数(number of internet):用户上网的次数。 · 上网流量 (flow of internet):用户上网的总流量 ,包 括 Wi-Fi、2G、3G 上网。 · 互动次数 (number of interaction):用户间互动行为 的次数。 互动行为包括通话和短信,1 h 内互动行为 的往复记为互动。 (6)关联性 · 机卡比值(cellphone-card ratio):表示同一手机号对应 终端数量的比值,比值越大,说明该号码曾被多个手机 终端使用。 计算时使用终端串码(IMEI)关联手机号。 · 卡机比值(card-cellphone ratio):表示某一终端使用 过手机号的数量,比值越大,说明该终端使用过的 手机卡越多。 2016039-6 144· ·