文件名称:rdf2text:从具有序列到序列模型的RDF数据生成文本
文件大小:590KB
文件格式:ZIP
更新时间:2024-05-18 23:23:35
rdf nlg Python
学习使用seq2seq模型从RDF事实图生成文本 Badr Abdullah,FrançoisBuet和Reem Mathbout的项目工作。 该存储库包含用于为训练模型准备数据的代码,这些训练模型使用WebNLG数据从RDF三元组生成自然语言文本(有关数据的更多信息,请参见本文: ://webnlg.loria.fr/pages/webnlg-challenge )。 此项目中的所有模块均已使用python 3.6开发和测试。 运行模块仅需要两个非核心Python库:NLTK和SPARQLWrapper。 目前,该代码可用于解析XML文件中的RDF数据,应用文本预处理,检索RDF实体的语义类型,对目标语句执行去词义化以及生成用于训练和评估序列的数据集,以用于从NLG到NLG的序列模型事实图。 生成训练数据集 要使用该模块生成训练数据集,请使用: 源端的扁平序列 mkdir ../
【文件预览】:
rdf2text-master
----relex_predictions.py(2KB)
----utils()
--------rdf_utils.py(6KB)
--------text_utils.py(10KB)
--------sparql_utils.py(3KB)
--------__init__.py(0B)
----generate_train_dataset.py(2KB)
----__init__.py(0B)
----multi-bleu.perl(5KB)
----graph2text.py(20KB)
----README.md(4KB)
----metadata()
--------delex.txt(5.69MB)
--------onto_classes_system.json(40KB)
--------entity_type.list(84KB)
--------entities.list(59KB)
--------ontology_ponderated_occurences.json(3KB)
--------properties.list(5KB)
--------OntologyClasses.xml(217KB)
--------prop_schema.list(11KB)
----support()
--------generate_nodelex.py(1KB)
--------get_entity_type.py(1KB)
--------get_property_schema.py(1KB)
--------link_metadata.py(1KB)
--------generate_eval_metadata.py(1KB)
--------__init__.py(0B)
--------generate_onto_classes_system.py(1KB)
--------generate_lists.py(1KB)
----generate_eval_dataset.py(3KB)