fddc-extraction-release:fddc提取释放

时间:2021-05-09 00:24:33
【文件属性】:
文件名称:fddc-extraction-release:fddc提取释放
文件大小:14KB
文件格式:ZIP
更新时间:2021-05-09 00:24:33
Python FDDC2018金融算法挑战赛02-A股上市公司公告信息抽取 基本信息 config: 目录包含一些配置文件 docparser: 实现对文档的解析,主要是对HTML文件的解析,解析HTML中的文本段落和表格信息 extract: 实现信息抽取器,主要基于docparser解析后的结果进行信息抽取,这里主要实现了增减持项目的抽取器 ner: 封装实现 NER打标签的工具 utils: 实现一些功能性组件 app.py: 主函数,实现对某篇HTML文件或某个目录下HTML文件的信息抽取 requirements.txt: pip 的相关依赖列表 运行方法 运行python环境为: python3.6 NER部分采用 需要下载相关模型文件并在app.py中配置相关模型目录路径 ner_model_dir_path # 安装相关依赖 pip install -r requirements.tx
【文件预览】:
fddc-extraction-release-master
----utils()
--------TextUtils.py(1KB)
--------__init__.py(22B)
----docparser()
--------__init__.py(22B)
--------HTMLParser.py(4KB)
----app.py(3KB)
----requirements.txt(72B)
----config()
--------ner_com_blacklist.txt(64B)
--------ZengJianChiConfig.json(1KB)
----extract()
--------ZengJianChiExtractor.py(18KB)
--------__init__.py(22B)
----README.md(958B)
----ner()
--------NERTagger.py(6KB)
--------__init__.py(23B)
----.gitignore(1KB)

网友评论