DSSM-with-Paddle:使用PaddlePaddle的DSSM实现

时间:2024-05-28 06:00:58
【文件属性】:

文件名称:DSSM-with-Paddle:使用PaddlePaddle的DSSM实现

文件大小:1.64MB

文件格式:ZIP

更新时间:2024-05-28 06:00:58

nlp nlp-machine-learning dssm Python

DSSM带桨 细节 使用PaddlePaddle的DSSM实现。 它使用用户搜索查询和带有标签1的单击标题以及带有标签0的未单击/无关标题来预测用户搜索查询和广告标题之间的相关性。 train_cluster_old.py 以csv格式读取输入内容:查询,标题,标签。 旧模型遵循原始论文,具有完全相同的结构和参数。 但是,由于语言的变化而预测标签时,它只能达到约70-80%的准确度(本文设计为英语,但训练和测试集基于中文) train_cluster.py 读取csv格式的输入,例如:query,title_1,title_2。 这是一种改进的模型,其中title_1或2中的标题之一是用户单击的标题,而另一标题是无关的。 该模型的工作是学习其中一个标题比另一个标题更相关。 通过这种方法,该模型在单台机器上可以达到88%的精度,而在集群上训练时可以达到94%的精度。 参考 Paddl


【文件预览】:
DSSM-with-Paddle-master
----infer.py(2KB)
----parse.py(2KB)
----wordseg.so(5.21MB)
----train_cluster_old.py(10KB)
----parse_old.py(2KB)
----README.md(1KB)
----train_cluster.py(8KB)

网友评论