文件名称:Chinese_Event_Extraction_CRF-
文件大小:3.77MB
文件格式:ZIP
更新时间:2024-05-28 04:15:35
HTML
Chinese_Event_Extraction_CRF- 我使用CRF ++ 0.58从中国交通法中的句子中提取事件(也称为序列分块问题)。 我主要要提取四个元素: 主题,动作,关键字,结果,义务,禁止,正确。 前四个元素用于描述事件,后三个元素是事件的类。 如今,人们主要使用HMM,CRF来标记NLP字段中的序列。 与HMM相比,CRF可以考虑整个句子的标签。 因此,CRF的性能优于HMM。 使用我的程序的步骤: 1.给我一颗星(非常重要)。 2.在目录./CRF++-0.58中,使用UTF-8编码将Trainfile和Testfile保存为Trainfile.txt和Testfile.txt。 3.运行:。\ crf_learn.exe -c 0.3。\ Template。\ Trainfile.txt。\ model 参数-c用于控制过拟合和欠拟合之间的平衡。 然后
【文件预览】:
Chinese_Event_Extraction_CRF--master
----HTMLToTsv.java(1KB)
----Template(361B)
----Readme.txt(1KB)
----Trainfile(90KB)
----prediction(0B)
----model(3.25MB)
----processPrediction.py(391B)
----PredictClass.py(0B)
----result.txt(35KB)
----toCharacterTrainFile.py(863B)
----TrainClass.py(0B)
----CRF++-0.58()
--------example()
--------sdk()
--------Template(361B)
--------Trainfile.txt(90KB)
--------Trainfile(90KB)
--------model(3.64MB)
--------Testfile.txt(22KB)
--------result.txt(64KB)
--------report.png(24KB)
--------README(20B)
--------libcrfpp.dll(330KB)
--------BSD(1KB)
--------crf_test.exe(50KB)
--------LGPL(26KB)
--------AUTHORS(28B)
--------doc()
--------crf_learn.exe(50KB)
--------Testfile(22KB)
--------COPYING(164B)
----evaluate.py(935B)
----HTMLToTsv.py(4KB)
----htmlfile.txt(207KB)
----dict.txt(31B)
----README.md(1KB)
----Testfile(22KB)
----CRF++-0.58.zip(495KB)