文件名称:真棒句嵌入:精选的预训练句子和单词嵌入模型列表
文件大小:53KB
文件格式:ZIP
更新时间:2024-02-22 13:24:52
nlp awesome natural-language word-embeddings awesome-list
很棒的句子嵌入 精选的预训练句子和单词嵌入模型列表 目录 关于此回购 好吧,这里有一些很棒的单词嵌入和句子嵌入列表,但是它们都已经过时了,更重要的是不完整 此仓库也将是不完整的,但我会尽力找到并包括所有具有预训练模型的论文 这不是一个典型的很棒的列表,因为它有表格,但是我想这还可以,并且比庞大的列表要好得多 如果您发现任何错误或发现其他论文或其他内容,请发送请求请求,并帮助我保持此列表的最新状态 请享用! 通用框架 几乎所有的句子嵌入都是这样的: 给定某种词嵌入和可选的编码器(例如LSTM),它们将获得上下文化的词嵌入。 然后,他们定义某种类型的池化(可以像上一次池化一样简单)。 基于此,他们要么直接将其用于监督分类任务(例如推断),要么生成目标序列(例如“跳过思考”)。 因此,总的来说,我们有许多您从未听说过的句子嵌入,您可以对任何词嵌入进行均值池,这就是句子嵌入! 词嵌入 注意:不必担心代码的语言,几乎可以总是(子词模型除外)仅在您选择的框架中使用预训练的嵌入表,而忽略训练代码 日期 纸 引用次数 训练守则 预训练模型 -- 不适用 -- 2013/01 999+ 20
【文件预览】:
awesome-sentence-embedding-master
----.travis.yml(1KB)
----word-embedding.json(21KB)
----pull_request_template.md(193B)
----encoder.json(17KB)
----README_BASE.md(12KB)
----_config.yml(206B)
----LICENSE(34KB)
----generate.py(8KB)
----CONTRIBUTING.md(2KB)
----.gitignore(3KB)
----CODE_OF_CONDUCT.md(3KB)
----contextualized.json(29KB)
----README.md(56KB)
----inbox(1KB)