04(1) 基于上下文相关的GMM-HMM声学模型1

时间:2021-11-11 12:19:02

1.上下文对音素发音的语谱轨迹的影响

受到上下文的影响,同一个音素的发音语谱轨迹不同

为提高识别准确率,对音素建模时应将这种上下文影响考虑在内

04(1) 基于上下文相关的GMM-HMM声学模型1

2.基于上下文相关的音素建模

注意,非单音素建模中,每个模型依旧代表一个音素,只是考虑了这个音素的上下文关系而已

1)双音素diphones

考虑上个音素/下个音素对当前音素的影响

04(1) 基于上下文相关的GMM-HMM声学模型1

对于ROCK:

04(1) 基于上下文相关的GMM-HMM声学模型1

两个??分别取决于ROCK的前一个单词的最后一个音素和后一个单词的第一个音素

灰色的边界单元为邻近单词所共享

04(1) 基于上下文相关的GMM-HMM声学模型1

为语法/词序列中观察到的前后音素的每个组合构建单独的基于双音素的单词模型

04(1) 基于上下文相关的GMM-HMM声学模型1

有时候,根据语法,同一个单词的不同模型的部分可以重叠

04(1) 基于上下文相关的GMM-HMM声学模型1

由于边界单元为邻近单词所共享,所以不再具有明确识别出的单词级HMM

无法区分哪些双音素是词内,哪些是跨词---单词边界不明确

因此可区分对待词内双音素与跨词双音素---共2xNxN个模型(N为单音素个数)

分别用词内训练数据和跨词训练数据进行训练

2)三音素triphones

考虑上个音素和下个音素对当前音素的影响

04(1) 基于上下文相关的GMM-HMM声学模型1

与双音素不同,不存在跨词共享的边界单元

与双音素相同,??与前一个音素和后一个音素相关,同一个单词对应多个单词模型

04(1) 基于上下文相关的GMM-HMM声学模型1

04(1) 基于上下文相关的GMM-HMM声学模型1

有时候,根据语法,出现部分重叠

04(1) 基于上下文相关的GMM-HMM声学模型1

三音素的情况变得更为复杂:

模型数更多,搜索更慢

04(1) 基于上下文相关的GMM-HMM声学模型104(1) 基于上下文相关的GMM-HMM声学模型1

基于单音素

04(1) 基于上下文相关的GMM-HMM声学模型1

基于三音素

04(1) 基于上下文相关的GMM-HMM声学模型104(1) 基于上下文相关的GMM-HMM声学模型104(1) 基于上下文相关的GMM-HMM声学模型104(1) 基于上下文相关的GMM-HMM声学模型1

3)多音素nphones

04(1) 基于上下文相关的GMM-HMM声学模型1

4)单音素vs双音素vs三音素vs多音素

04(1) 基于上下文相关的GMM-HMM声学模型104(1) 基于上下文相关的GMM-HMM声学模型104(1) 基于上下文相关的GMM-HMM声学模型104(1) 基于上下文相关的GMM-HMM声学模型1

04(1) 基于上下文相关的GMM-HMM声学模型1

04(1) 基于上下文相关的GMM-HMM声学模型1

04(1) 基于上下文相关的GMM-HMM声学模型1

3.基于上下文相关的声学模型训练

04(1) 基于上下文相关的GMM-HMM声学模型1

04(1) 基于上下文相关的GMM-HMM声学模型1

04(1) 基于上下文相关的GMM-HMM声学模型1

04(1) 基于上下文相关的GMM-HMM声学模型1的更多相关文章

  1. 04(2) 基于上下文相关的GMM-HMM声学模型2之参数共享

    1.三音素建模存在的问题 问题一:很多三音素在训练数据中没有出现(尤其跨词三音素) 问题二:在训练数据中出现过的三音素有相当一部分出现的频次较少 因此,三音素模型训练时存在较严重的数据不足问题 2.参 ...

  2. 上下文相关的GMM-HMM声学模型续:参数共享

    一.三音素建模存在的问题 问题一:很多三音素在训练数据中没有出现(尤其跨词三音素) 问题二:在训练数据中出现过的三音素有相当一部分出现的频次较少 因此,三音素模型训练时存在较严重的数据不足问题 二.参 ...

  3. 上下文相关的GMM-HMM声学模型

    一.上下文对音素发音的语谱轨迹的影响 受到上下文的影响,同一个音素的发音语谱轨迹不同 为提高识别准确率,对音素建模时应将这种上下文影响考虑在内 二.基于上下文相关的音素建模 注意,非单音素建模中,每个 ...

  4. [源码解析] PyTorch 分布式 Autograd (3) ---- 上下文相关

    [源码解析] PyTorch 分布式 Autograd (3) ---- 上下文相关 0x00 摘要 我们已经知道 dist.autograd 如何发送和接受消息,本文再来看看如何其他支撑部分,就是如 ...

  5. 语音识别传统方法(GMM+HMM+NGRAM)概述

    春节后到现在近两个月了,没有更新博客,主要是因为工作的关注点正从传统语音(语音通信)转向智能语音(语音识别).部门起了个新项目,要用到语音识别(准备基于Kaldi来做).我们之前做的传统音频已基本成熟 ...

  6. ubuntu16.04 安装 caffe cuda 相关流程

    不多说了,经历了很多莫名其妙的错误最后终于安装好了,直接放安装脚本: #!/bin/bash #安装时要注意有些库可能安装失败以及安装caffe有和protobuf相关错误时可能需要重新对protob ...

  7. 2014.04.28基于CPLD的LCOS场序彩色视频控制器设计

    基于CPLD的LCOS场序彩色视频控制器设计 作者:宋丹娜,代永平,刘艳艳,商广辉 发表刊物:液晶与显示,2009 学习时间:2014.04.28 文章讲述了-- (和上一篇论文有些相似之处) 1. ...

  8. 2018/04/25 基于 编译安装的 PHP7 安装 swoole 扩展

    在上一篇文章我们知道了如何去编译安装一个自己需要的 PHP 版本. 2018/04/25 PHP7的编译安装 这里还没有完,我们还需要安装我们的扩展,才算完成今天的任务. -- 下载扩展 还是官网下载 ...

  9. Ubuntu 16.04使用python3.x相关

    下载pip3 Python 3.x版本使用pip3,它会把你想下载的包放到usr/local/lib/python3.5/dist-packages/下,而非usr/local/lib/python2 ...

随机推荐

  1. 解决PowerDesigner 反向工程没有注释(备注)

    本文转载自:http://www.cnblogs.com/zhangxb/archive/2012/04/20/2458898.html 1. 列注释 原来代码: {OWNER, TABLE, S, ...

  2. httpclient源码分析之 PoolingHttpClientConnectionManager 获取连接

    PoolingHttpClientConnectionManager是一个HttpClientConnection的连接池,可以为多线程提供并发请求服务.主要作用就是分配连接,回收连接等.同一个rou ...

  3. appium定位h5

    1.手机安装Chrome浏览器 2.开启USB调试模式,并使用安装的Chrome浏览器打开待测H5页面 3.在电脑端的Chrome浏览器输入chrome://inspect               ...

  4. ZOJ - 3661 pam

    题意:给一个字符串,和每个字符代表的val,每个回文串的价值就是前半部分的val26进制%777777777,求价值第k小的回文串 题解:建个pam,然后dfs两边(0,1),统计价值sort一遍就好 ...

  5. Intellij IDEA使用Maven搭建spark开发环境(scala)

    如何一步一步地在Intellij IDEA使用Maven搭建spark开发环境,并基于scala编写简单的spark中wordcount实例. 1.准备工作 首先需要在你电脑上安装jdk和scala以 ...

  6. 作业一 031502140 博客地址yeze651521

    大一 上学期一开始对于这门课程是懵懵懂懂的,基本不知道自己会不会能够学好,经过了一个学期的努力和老师的教导得到了许多有益的地方,使得我在这门课程的学习上有了大概的掌握,一个学期的学习给予了我很大的能力 ...

  7. iOS 界面翻转切换动画

    [UIView  beginAnimations:nil context:NULL]; [UIView setAnimationCurve:UIViewAnimationCurveLinear]; [ ...

  8. Android 虚拟机访问本地服务器的地址

    http://10.0.2.2:8080/test/ 比如 localhost:8080 为 tomcat 地址,然后 test 是 tomcat 目录下 webapps 的子目录. 10.0.2.2 ...

  9. Python switch-case语句的实现 -- 字典模拟实现

    static void print_asru_status(int status, char *label) { char *msg = NULL; switch (status) { : msg = ...

  10. ExtJS4 自己主动生成控制grid的列显示、隐藏的checkbox

    因为某种原因.须要做一个控制grid列显示的checkboxgroup,尽管EXTJS4中的gridpanel自带列表能够来控制列的显示隐藏,可是有这种需求(须要一目了然) 以下先上图 waterma ...