multiword_expression_tagger:用于多字表达式的 Python 标记器

时间:2024-07-10 07:08:42
【文件属性】:

文件名称:multiword_expression_tagger:用于多字表达式的 Python 标记器

文件大小:87KB

文件格式:ZIP

更新时间:2024-07-10 07:08:42

Python

用于多字表达式的 Python 标记器 文档 提供有关此想法的文档。 任务 读取样本语料库。 该脚本提取文本,将其分组为句子。 使用MBSP工具,获得了句子中每个词的词性标签和引理。 通过一些时间单位和动作动词方式的列表,该程序可以识别一些多词表达。 程序 该程序( src/main.py模块)使用解释的模式 1 和 2 识别时间的多词表达式。 用法: python main.py 输出: 时光飞逝 随着时间的流逝


【文件预览】:
multiword_expression_tagger-master
----src()
--------corpus_reader.py(822B)
--------simple_tagger.py(2KB)
--------main.py(484B)
----resource()
--------MANNER-OF-MOTION-VERBS.txt(676B)
--------UNITS_OF_TIME.txt(405B)
--------input_data()
----README.md(728B)

网友评论