文件名称:基于子词的位置特定后方格用于中文语音文档索引
文件大小:751KB
文件格式:PDF
更新时间:2024-04-20 02:11:31
语音文档检索; 语音文档索引; 子词PSPL; 词格; 子词后验概率
针对汉语语音文档检索中最优识别单元和检索单元替代的问题,提出一种基于子词(特定位置的后格,PSPL)的语音文档索引方法;该方法以词为识别单元对语音文档进行解码,得到PSPL:然后对PSPL进行子词切分,并根据子词弧与原始词弧的后验概率关系,将PSPL转换为相应的子词PSPL,以子词PSPL为索引进行查询项检索。 ,所提出的方法在利用丰富的语言信息的同时,解决了词解码器存在的边界分割不正确的问题,检索性能明显发生了目前普遍使用的识别单元和检索单元替换词的PSPL索引方法的问题。