文件名称:context-mover-distance-and-barycenters:AISTATS 2020论文随附的代码
文件大小:29KB
文件格式:ZIP
更新时间:2024-06-17 14:06:52
Python
上下文移动器的距离和重心:用于建筑物表示的上下文的最佳传输 抽象的 我们提供了一个用于构建实体及其组成的无监督表示的框架,其中每个实体都被视为概率分布而不是固定长度的向量。 特别是,在与实体共同出现的上下文中支持此分布,并将其嵌入适当的低维空间中。 这使我们能够从“最优运输”的角度来考虑表示学习的问题,并利用其众多的工具,例如Wasserstein距离和Wasserstein重心。 我们详细阐述了该方法如何应用于获取文本的无监督表示形式,并定量地和定性地说明了诸如测量句子相似度和单词蕴含度等任务时的性能,在该过程中,我们从经验上观察到了显着的收获。 提议的方法的主要优点包括: (a)通过将实体建模为分布来捕获不确定性和多义性(b)利用特定任务的基础几何形状(以地面成本为基础) (c)同时提供可解释性和上下文之间最佳传输的概念(d)在现有的点嵌入方法之上很容易应用。 本质上,该框架可用于任
【文件预览】:
context-mover-distance-and-barycenters-master
----.gitignore(1KB)
----histograms.py(14KB)
----ppmi_fast.py(10KB)
----options.py(8KB)
----cooc_pickler.py(3KB)
----clustering.py(21KB)
----utils.py(4KB)
----README.md(5KB)
----cooc_analysis.py(5KB)
----flags.py(186B)
----ppmi.py(4KB)
----wasserstein.py(34KB)