文件名称:nlp火车测试重叠检测器
文件大小:156KB
文件格式:ZIP
更新时间:2024-03-04 23:04:42
JupyterNotebook
NLP Train-Test重叠检测器 目标数据集 随机分割 使用随机分割比较训练和测试之间的文本 export PYTHONPATH=./src python src/aimed_random.py --trainfile " trainfile.json " Biocreative II基因提及 重叠。 请从BioCreative网站下载此任务的测试和培训文件。 这比较了训练和测试之间的文本 export PYTHONPATH=./src outputdir=split python src/bc2_gene_mention.py --trainfile " tests/data/bc2_gene_mention.in " --testfile " tests/data/bc2_gene_mention.in " --type text --outdir $outputdir --e
【文件预览】:
nlp-train-test-overlap-detector-master
----SimilaritySplitter.ipynb(132KB)
----src()
--------similarity()
--------aimed_random.py(2KB)
--------utils()
--------bc3_article_classification.py(10KB)
--------bc2_gene_mention.py(13KB)
--------requirements_prod.txt(62B)
--------sst2_dataset.py(13KB)
--------chemu_gene_mention.py(4KB)
--------aimed_uniquedoc.py(3KB)
----.travis.yml(204B)
----LICENSE(1KB)
----AnalyseBC2GMPredictions.ipynb(89KB)
----README.md(3KB)
----tests()
--------requirements.txt(31B)
--------tests_similarity()
--------__init__.py(0B)
--------data()
----.gitignore(2KB)
----Similarity.ipynb(463KB)