CORD-19-ANN:ANN使用SBERT搜索COVID CORD-19数据集

时间:2024-02-21 08:05:48
【文件属性】:

文件名称:CORD-19-ANN:ANN使用SBERT搜索COVID CORD-19数据集

文件大小:799KB

文件格式:ZIP

更新时间:2024-02-21 08:05:48

machine-learning pytorch spacy transformer scispacy

CORD-19-ANN 此仓库包含脚本和模型,可通过或使用嵌入来搜索 。 句子嵌入不是搜索的理想选择(请参阅),但是可以提供基本搜索功能无法提供的数据洞察力。 仍有改进相关文档检索的空间。 我们并不精通医学领域,因此我们强烈建议您以问题/ PR的形式提供任何反馈或改进! 我们提供了预训练的模型和FAISS索引,可按照以下说明启动您自己的服务器。 最后,我们提供了一个前端,可用于搜索数据集并通过UI提取信息。 可以在找到前端的说明和安装。 我们目前正在gcp实例上托管服务器,如果有人可以为更永久的托管解决方案做出贡献,将不胜感激。 安装 资源 我们假设您已经从安装了PyTorch和必要的CUDA软件包。 我们建议使用Conda来简化安装。 # Install FAISS conda install faiss-cpu -c pytorch # Other instructions can be found at https://github.com/facebookresearch/faiss/blob/master/INSTALL.md git clone https://


【文件预览】:
CORD-19-ANN-master
----setup.py(209B)
----Dockerfile(1KB)
----requirements.txt(182B)
----index_server.py(3KB)
----download_data.py(1KB)
----LICENCE(1KB)
----.gitmodules(128B)
----sentence-transformers()
----README.md(10KB)
----cord_ann()
--------__init__.py(0B)
--------index.py(6KB)
--------clusters.py(469B)
--------mapping.py(1KB)
--------embeddings.py(704B)
----imgs()
--------cord_ann_example.gif(895KB)
----search_index.py(2KB)
----cluster_sentences.py(2KB)
----extract_sentences.py(2KB)
----generate_embeddings.py(1KB)
----frontend()
--------.gitignore(12B)
--------Dockerfile(333B)
--------package.json(2KB)
--------src()
--------webpack.config.js(4KB)
--------docker-compose.yml(289B)
--------.env.defaults(27B)
--------.eslintrc.js(482B)
--------README.md(5KB)
--------babel.config.js(2KB)
--------server.js(305B)
----create_index.py(2KB)

网友评论