文件名称:MasterThesis_Tokenization
文件大小:50.57MB
文件格式:ZIP
更新时间:2024-04-17 12:10:43
Python
MasterThesis_Tokenization BIESX_Tag.py:使用flair.datasets从UD框架下载训练,文本,开发数据集,并添加边界标签并生成训练,文本,为此论文开发数据集,并在文件夹数据中输出 Typologic_Factor_Analysis.py:集群14种语言 BiLSTM_GL:语言组特定模型 BiLSTM_SL:语言特定的模型 BiLSTM_ML:多语言模型 输出为training_models BiLSTM_Evaluation.py:在测试数据集上评估结果,在文件夹结果中输出 functions.py:定义类BiLSTM和其他辅助函数