ditto:论文代码“具有预训练语言模型的深度实体匹配”

时间:2024-06-04 19:13:07
【文件属性】:

文件名称:ditto:论文代码“具有预训练语言模型的深度实体匹配”

文件大小:48.24MB

文件格式:ZIP

更新时间:2024-06-04 19:13:07

Python

同上:具有预训练语言模型的深度实体匹配 同上是基于诸如BERT之类的预训练语言模型的实体匹配(EM)解决方案。 给定一对数据条目,EM检查两个条目是否引用相同的真实世界实体(产品,业务,出版物,人员等)。 Ditto通过微调利用了预训练语言模型(LM)强大的语言理解能力。 同上将每个数据条目序列化为文本序列,并将EM转换为可通过LM微调解决的序列对分类问题。 我们还采用了一组新颖的优化方法,包括摘要,注入特定领域的知识和数据扩充,以进一步提高匹配模型的性能。 有关更多技术细节,请参阅《进行文。 要求 的Python 3.7.5 PyTorch 1.4 HuggingFace变形金刚 带有en_core_web_lg模型的空间 NVIDIA Apex(FP16培训) 安装所需的软件包 conda install -c conda-forge nvidia-apex pip inst


网友评论