文件名称:event_extraction:百度aistudio活动抽取比赛
文件大小:116KB
文件格式:ZIP
更新时间:2024-05-03 10:02:39
Python
百度aistudio 2020 事件抽取赛道 update on 2020.07.09 优化了gen_kfold_data.py,重构了代码,能够生成event type分类任务的数据index_type_fold_data_{},以及role extraction阶段任务的数据verfify_neg_fold_data_{},注意所有文件的对应路径要与自己在config中配置的相同。另外,neg_fold_data_{}为之前老版本的数据存储格式,与verify_neg_fold_data_{}是一样的,可以一样使用 依赖包:主要是tensorflow 1.12.0,另外使用了bojone的bert4keras,详见 ,其余见requirements.txt 目前主要集中使用机器阅读理解的方式来尝试解决事件抽取任务。主要分为两个阶段: 1、事件类型抽取 2、事件论元抽取,使用MRC的方式
【文件预览】:
event_extraction-master
----event_predict.py(42KB)
----run_event_role.sh(397B)
----run_event_classification.sh(416B)
----run_event.py(3KB)
----bert()
--------optimization_test.py(2KB)
--------tokenization.py(12KB)
--------tokenization_test.py(4KB)
--------modeling_test.py(9KB)
--------__init__.py(616B)
--------run_classifier.py(33KB)
--------optimization.py(6KB)
--------general_utils.py(4KB)
--------modeling.py(43KB)
--------README.md(4KB)
--------theseus_replacement_scheduler.py(1KB)
--------run_pretraining.py(18KB)
--------extract_features.py(13KB)
--------create_pretraining_data.py(15KB)
--------run_classifier_predict_online.py(16KB)
----requirements.txt(47B)
----run_retro_rolemrc.sh(423B)
----data()
--------slot_pattern()
----train_helper.py(34KB)
----common_utils.py(1KB)
----models()
--------__init__.py(22B)
--------layers()
--------bert_mrc.py(8KB)
--------tf_metrics.py(8KB)
--------utils.py(10KB)
--------bert_event_type_classification.py(16KB)
--------event_verify_av.py(12KB)
----LICENSE(1KB)
----optimization.py(23KB)
----gen_kfold_data.py(2KB)
----run_retro_eav.sh(420B)
----README.md(2KB)
----configs()
--------bert_config.py(3KB)
--------__init__.py(22B)
--------bert_mrc_config.py(4KB)
--------event_config.py(7KB)
--------base_config.py(3KB)
----data_processing()
--------basic_prepare_data.py(10KB)
--------data_utils.py(5KB)
--------__init__.py(22B)
--------bert_mrc_prepare_data.py(13KB)
--------bert_prepare_data.py(2KB)
--------tokenize.py(14KB)
--------mrc_query_map.py(276B)
--------event_prepare_data.py(54KB)