用户行为分析模型设计思路-基于dnn的youtube推荐

时间:2024-07-09 09:46:55
【文件属性】:

文件名称:用户行为分析模型设计思路-基于dnn的youtube推荐

文件大小:1.7MB

文件格式:PDF

更新时间:2024-07-09 09:46:55

hadoop ETL data model user

4.4 系统服务器需求评估 本系统每月采集数据大约为 59 TB。 系统需要的服务 器计算过程见表 3,计算结果共需要 18 台服务器。 4.5 系统拓扑结构 本系统采用吉比特网络接入 Hadoop 平台 ,各个节点 均配置 4 端口吉比特 , 分别接入两台相互冗余的接入交 换机 ,并采用网卡聚合方式接入 ,以保障网络接入的安 全稳定性 。 对于多台应用服务器的负载均衡访问 ,均由 DCN 接入层部署的负载均衡器提供。 系统拓扑结构如图2 所示 。 5 用户行为分析模型设计与应用 5.1 用户行为分析模型设计思路 本系统对原本只用于计费使用的通信、上网数据进行 深 度 加 工 , 挖 掘 其 中 的 用 户 行 为 属 性 , 如 规 律 性 (regularity)、 多 元 性 (diversity)、 空 间 行 为 (spatial behavior)、 活动行为 (active behavior)、 使用行为 (basic phone use)、关联性(correlation)6 类,并与这些关键指标构 建用户行为模式。 (1)规律性 · 平均通话间隔(average inter-call time):计算用户通 话(包括主被叫)间隔的平均值,单位为 s。从上一通 电话开始,到下一通电话开始记为一次间隔。 · 平均短信间隔(average inter-text time):计算用户收 发短信间隔的平均值,单位为 s,取样为每两条短信 之间的时间间隔。 · 平均上网间隔 (average inter-internet time):计算用 户上网间隔的平均值,单位为 s,取样为每两次上网 之间的时间间隔,上网行为包括通过 2G、3G、Wi-Fi 上网。 2016039-4 142· ·


网友评论