基于模型的细分客户的嵌入技术-研究论文

时间:2024-06-08 11:20:20
【文件属性】:

文件名称:基于模型的细分客户的嵌入技术-研究论文

文件大小:1.45MB

文件格式:PDF

更新时间:2024-06-08 11:20:20

Segmentation Estimation/statistical techniques embedding missing

我们考虑使用对项目子集的购买,评级,点击等多样化的偏好观察,将大量客户分成具有相似偏好的非重叠组的问题。 我们关注的是项目范围很大(从数千到数百万不等)和非结构化(缺少明确定义的属性)的环境,每个客户仅提供对少数项目的观察。 这些数据特征限制了现有技术在市场营销和机器学习中的适用性。 为了克服这些限制,我们提出了一种基于模型的嵌入技术,该技术将客户的观察结果和一个概率模型类生成观察结果作为输入,并为每个客户输出一个嵌入(一种在欧几里得空间中的低维表示形式) 。 然后,我们对嵌入进行聚类以获得分段。 从理论上讲,我们得出精确的必要条件和充分条件,以保证真实段的渐近恢复。 通过经验,我们在两个实际案例中证明了我们方法的速度和性能:(a)MovieLens数据集上新电影推荐的准确性提高了84%,以及(b)类似产品的性能提高了8%在eBay上的离线数据集上的推荐算法。 我们表明,我们的方法优于标准隐性类,经验贝叶斯和基于人口统计的技术。


网友评论