文件名称:pos_tagger:POS标记任务的神经模型
文件大小:9KB
文件格式:ZIP
更新时间:2024-04-07 20:15:31
Python
神经POS标记器 用于英语的词性标记任务的神经模型的实现。 目录 一般信息 词性标记是一项NLP任务,用于使用适当的词性标记对文本中的单词进行标记。此任务对于分析文本的语言属性很有用,但也可以用于改善其他任务的结果(例如情感分析)。示例(来自“语音和语言处理”书,第8章): 有/ PRO / EX有/ VERB / VBP 70 / NUM / CD孩子/ NOUN / NNSthere / ADV / RB ./PUNC/ 在这个项目中,在sample.conll数据上训练了一个神经模型来执行任务。 技术领域 对于项目开发,使用以下技术: 的Python:3.8 设置 创造环境 步骤0)克隆仓库: git clone https://github.com/pmarkovic/pos_tagger.git 步骤1)创建conda环境: conda env create -f pavle_r
【文件预览】:
pos_tagger-main
----.gitignore(28B)
----README.md(1KB)
----data_preprocess.sh(77B)
----train.py(3KB)
----model.py(2KB)
----test_data()
--------de-test.tsv(2KB)
--------srb_test_set.tsv(3KB)
----pavle_rricha.yml(703B)
----data_preprocess.py(3KB)
----dataloader.py(3KB)