automaticParaphrase:自动复述生成

时间:2024-03-02 17:49:06
【文件属性】:

文件名称:automaticParaphrase:自动复述生成

文件大小:40KB

文件格式:ZIP

更新时间:2024-03-02 17:49:06

Python

自动释义工具 我们提供了一种自动生成释义的工具。 该工具首先生成Parphrh,通过在Parikh 提出的不同嵌入模型的词嵌入向量上应用余弦相似度,去除语义上不相关的重复词组,并将其去重复。 产品特点 使用在线翻译器(例如和 )或预训练的神经翻译模型(例如和 )自动翻译 应用弱监督方法生成更多数据 通过和语义相似性过滤掉错误的措辞 通过删除重复数据删除 安装及使用 为了生成释义,请按照下列步骤操作: 使用Python 3版本创建和激活虚拟环境: Linux 创建虚拟环境: virtualenv -p python3 venv激活虚拟环境: source ./env/bin/activate Windows 创建虚拟环境: c:\>c:\Python35\python -m venv c:\path\to\myenv 与大多数Unix系统和服务不同,Windows不包括系统支持的


【文件预览】:
automatedParaphrase-master
----translator()
--------my_memory_translator.py(8KB)
--------marian_translator.py(11KB)
--------google_translator.py(2KB)
--------open_nmt.py(1KB)
--------yandex_translator.py(7KB)
--------deepl_translator.py(7KB)
----pos()
--------pos_extraction.py(4KB)
----evaluation()
--------chrf_score.py(5KB)
--------gleu_score.py(5KB)
--------diversity_metrics.py(9KB)
--------bleu_score.py(10KB)
----synonym()
--------nltk_wordnet.py(5KB)
--------parpahraser.py(5KB)
----config.ini(374B)
----main.py(18KB)
----requirements.txt(174B)
----dataset()
--------web_question_crawl.py(10KB)
----README.md(5KB)
----.gitignore(126B)
----filtering()
--------bert_filter.py(19KB)
--------use_filter.py(1KB)
--------embedding_service.py(3KB)

网友评论