people_relation_extract:结合BERT+GRU+ATT模型,对自己收集的人物关系数据进行模型训练,用于人物关系抽取

时间:2024-06-16 14:43:40
【文件属性】:

文件名称:people_relation_extract:结合BERT+GRU+ATT模型,对自己收集的人物关系数据进行模型训练,用于人物关系抽取

文件大小:690KB

文件格式:ZIP

更新时间:2024-06-16 14:43:40

Python

运行该项目的模型训练和模型预测脚本需要准备BERT中文版的模型数据,下载网址为: 。   利用笔者自己收集的3881个样本,对人物关系抽取进行尝试。人物关系共分为14类,如下: { "unknown": 0, "夫妻": 1, "父母": 2, "兄弟姐妹": 3, "上下级": 4, "师生": 5, "好友": 6, "同学": 7, "合作": 8, "同人": 9, "情侣": 10, "祖孙": 11, "同门": 12, "亲戚": 13 }   人物关系类别频数分布条形图如下:   模型结构: BERT + 双向GRU + Attention + FC   模型训练效果: # 训练集(train), loss: 0.0260, acc: 0.9941 # 最终测试集(test), loss: 0.9505, acc:


【文件预览】:
people_relation_extract-master
----.gitignore(83B)
----bert()
--------args.py(2KB)
--------tokenization.py(10KB)
--------__init__.py(616B)
--------optimization.py(6KB)
--------modeling.py(37KB)
--------graph.py(7KB)
--------extract_feature.py(14KB)
----requirements.txt(96B)
----sent.txt(1B)
----data()
--------bar_chart.png(33KB)
--------test.txt(114KB)
--------data_into_train_test.py(1KB)
--------relation_bar_chart.py(1KB)
--------rel_dict.json(226B)
--------train.txt(455KB)
--------人物关系表.xlsx(290KB)
----load_data.py(1KB)
----att.py(2KB)
----README.md(5KB)
----.idea()
--------bert_document_classify.iml(428B)
--------misc.xml(185B)
--------encodings.xml(135B)
--------vcs.xml(180B)
--------codeStyles()
--------dbnavigator.xml(22KB)
--------inspectionProfiles()
--------modules.xml(296B)
----model_train.py(3KB)
----model.png(42KB)
----loss_acc.png(30KB)
----model_predict.py(4KB)

网友评论