DisVoice:从语音信号中提取特征

时间:2024-05-27 09:26:49
【文件属性】:

文件名称:DisVoice:从语音信号中提取特征

文件大小:38.77MB

文件格式:ZIP

更新时间:2024-05-27 09:26:49

signal-processing prosody speech-analysis phonation articulation

话音 DisVoice是一个python框架,旨在从语音文件计算功能。 Disvoice使用自动编码器计算声门,发声,发音,韵律,语音和特征表示学习策略。 可以从持续的元音和连续的语音发声中计算出特征,目的是从语音中识别出实用的方面。 这些功能可用于分类器中,以识别不同语言障碍患者的情绪或交流能力,这些语言障碍包括具有功能性起源的疾病,例如Larinx癌或结节; 基于红唇面部的疾病,例如唇裂和developed裂引起的髋关节疾病; 或神经退行性疾病,例如帕金森氏症或洪廷顿氏病。 这些功能也适用于根据语音模式评估情绪问题,例如抑郁。 有关每种功能类型以及如何使用DisVoice的其他详细信息,请检查 安装 要安装需求,请运行 install.sh 必须预先安装Kaldi才能输出Kaldi 参考 如果出于研究目的使用Disvoice,请根据您使用的功能引用以下论文: 声门特征 [1]


网友评论