MetaPAD:来自大规模文本语料库的元模式发现

时间:2024-05-30 17:37:49
【文件属性】:

文件名称:MetaPAD:来自大规模文本语料库的元模式发现

文件大小:152.67MB

文件格式:ZIP

更新时间:2024-05-30 17:37:49

C++

MetaPAD 海量文本语料库的元模式驱动属性发现 执行run.sh zip / data-metapad.zip键入新闻语料库 zip / output-metapad.zip分段(顶部或底部)与具有适当粒度的元模式(自上而下或自下而上)的表匹配后的元模式(使用元模式(属性)提取信息) 细分:C ++同义词模式分组:Python类型级别调整:Python


【文件预览】:
MetaPAD-master
----utils.py(5KB)
----metapad.py(51KB)
----zip()
--------data-metapad.zip(65.6MB)
--------output-metapad.zip(73.97MB)
----run.sh(4KB)
----README.md(454B)
----cseg()
--------Tokenizer.jar(13.44MB)
--------src()
--------Makefile(645B)
--------README.md(25B)

网友评论