代码混合文本语言识别中的词性标签分析-研究论文

时间:2024-06-30 03:44:18
【文件属性】:

文件名称:代码混合文本语言识别中的词性标签分析-研究论文

文件大小:409KB

文件格式:PDF

更新时间:2024-06-30 03:44:18

Language Identification Code

语言识别是检测书写文本的语言。 当作者不使用一种语言的本土文字时,这个问题就变得具有挑战性。 通常,这种文本是由社交媒体生成的,社交媒体是英语与作者母语的混合。 属于印度的社交媒体平台的用户使用混合印地语英语编写代码。 在这项工作中,我们将单词级语言识别作为一个分类问题来研究,以识别用罗Maven字书写的单词的语言。 我们在基于音译的方法中使用 POS 标签来准备印地语英语代码混合语料库。 我们对语料库本身进行评估,并观察到获得了显着的结果。


网友评论