NNIA_Project:萨尔大学神经网络课程的最终项目

时间:2024-04-05 17:08:39
【文件属性】:

文件名称:NNIA_Project:萨尔大学神经网络课程的最终项目

文件大小:11KB

文件格式:ZIP

更新时间:2024-04-05 17:08:39

Python

CONLL POS分类 该项目读取一个串联的.conll文件,并写入一个包含令牌和语音相关部分(POS)注释的.tsv文件,以及一个包含有关数据集常规信息的.info摘要文件。 接下来,它使用BERT模型为语料库中的所有句子创建词嵌入,以用作人工神经网络进行POS分类的输入。 目录 基本信息 该项目的目标是最终根据英语单词标记的词性(POS)对其进行分类。 在此阶段,项目将从.conll输入文件中预处理带有POS注释的数据,并对数据集进行汇总。 此外,它还会加载从预处理步骤生成的.tsv文件,并使用BERT模型标记和创建句子的嵌入。 设置 该代码在连接的.conll文件上运行,该文件是通过首先在bash命令中运行以下命令而从.gold_conll文件集合中产生的: cat *.gold_conll >> dataset.conll 此命令将相关目录中所有扩展名为.gold_conll的文


【文件预览】:
NNIA_Project-main
----data_preprocess.py(6KB)
----load_dataset.py(7KB)
----README.md(6KB)
----tag_POS.py(12KB)
----environment.yaml(263B)

网友评论