文件名称:手势到孟加拉语语音:基于视觉的系统中的深度学习,用于识别手势数字和生成孟加拉语语音-研究论文
文件大小:808KB
文件格式:PDF
更新时间:2024-06-30 06:50:06
论文研究
在深度神经网络的帮助下,计算机视觉领域的最新进展使我们探索和开发了许多现有的挑战,这些挑战曾经由于缺乏必要的技术而无人参与。 手势/手势识别是深度神经网络产生重大影响的重要领域之一。 在过去的几年里,已经进行了大量的研究来识别手势和手势,我们的目标是将其扩展到我们的母语孟加拉语(也称为孟加拉语)。 我们工作的主要目标是制作一个自动化工具来帮助无法说话的人。 我们开发了一个系统,可以自动检测基于手势的数字并用孟加拉语说出结果。 根据世界卫生组织 (WHO) 的报告,世界上有 15% 的人患有某种残疾。 其中,有语言障碍等沟通障碍的个体在社会交往中遇到了很大的障碍。 所提议的系统对于减轻这种障碍可能是无价的。 该系统的核心是使用基于卷积神经网络 (CNN) 的深度学习模型构建的。 该模型对基于手势的数字进行分类,准确率超过验证数据的 92%,确保它是一个高度值得信赖的系统。 在对数字进行分类后,结果输出被馈送到文本到语音引擎和翻译器单元,最终生成孟加拉语的音频输出。