周末到了,给大家送上一本重磅书籍,语音识别领域重要框架Kaldi配置的书籍,书为《Kaldi语音识别实践》。
本书内容
这是一本以Kaldi框架为工具,讲解语音识别中核心技术的书籍,书籍各章节目录和内容简介如下:
第1章 语音识别技术基础,简单介绍了语音识别的发展历史,从概率模型到神经网络的演变,以及语音识别中的一些基本概念。
第2章 Kaldi概要介绍,包括Kaldi诞生的历史,框架的设计思想以如何快速使用Kaldi完成一个demo。
第3章 数据整理,包括如何选择训练数据以及准备为正确的格式,这是所有的机器学习项目中至关重要的问题。
第4章 经典声学建模技术,包括基本的声学特征提取,经典的隐马尔可夫模型(HMM)。
第5章 构图与解码,这是在语音识别中比较具有特色的问题。
第6章 深度学习声学建模技术,重点讲解了基于神经网络的声学模型。
第7章 关键词搜索与语音唤醒,这是目前在音视频检索,语音助手中两个重要的应用。
第8章 说话人识别,这是语音识别在身份认证领域的重要应用,类似于图像中的人脸识别。
第9章 语音识别应用实践,简介了Kaldi工具的若干个语音技术模块,包括识别,检测,解码器等。