文件名称:kb-shrink:缩减知识密集型任务的知识库,一次一对键值对
文件大小:26KB
文件格式:ZIP
更新时间:2024-04-14 22:47:40
Python
知识库收缩 笔记: 观察以KB为单位的密钥分布 减少嵌入向量的大小 截断SVD / PCA,自动编码器,随机投影,裁剪/折叠嵌入 观察性能下降与大小的关系 训练前与训练后减少效果 通过聚类减少知识库的大小。 观察性能与群集数 训练前与训练后减少效果 必须对MIPS进行修改,以使其趋向于平均值-商店群集大小。 用法 pip3 install -r requirementss.txt mkdir -p data # download ELI5 dataset wget -O data/eli5-dev.jsonl http://dl.fbaipublicfiles.com/KILT/eli5-dev-kilt.jsonl # compute sentence prompt embeddings python3 src/misc/embedding.py --dataset "data/el
【文件预览】:
kb-shrink-main
----src()
--------reduce_count()
--------reduce_dim()
--------misc()
----requirements.txt(86B)
----meta()
--------cache_artefact.odg(15KB)
----README.md(2KB)
----.gitignore(43B)