MasterThesis_Tokenization

时间:2024-04-17 12:10:43
【文件属性】:

文件名称:MasterThesis_Tokenization

文件大小:50.57MB

文件格式:ZIP

更新时间:2024-04-17 12:10:43

Python

MasterThesis_Tokenization BIESX_Tag.py:使用flair.datasets从UD框架下载训练,文本,开发数据集,并添加边界标签并生成训练,文本,为此论文开发数据集,并在文件夹数据中输出 Typologic_Factor_Analysis.py:集群14种语言 BiLSTM_GL:语言组特定模型 BiLSTM_SL:语言特定的模型 BiLSTM_ML:多语言模型 输出为training_models BiLSTM_Evaluation.py:在测试数据集上评估结果,在文件夹结果中输出 functions.py:定义类BiLSTM和其他辅助函数


网友评论