attention-based-seq2seq

时间:2024-04-30 02:11:43
【文件属性】:

文件名称:attention-based-seq2seq

文件大小:10KB

文件格式:ZIP

更新时间:2024-04-30 02:11:43

Python

使用序列到序列模型的语音到文本转录 语音到文本的转录涉及处理记录的语音以获得其文本内容。 在深度学习时代,这项任务是使用神经网络(如LSTM和Transformers)完成的。 该项目旨在通过使用基于注意力的序列到序列神经网络来完成此任务。 所使用的网络基于“并且涉及用于语音发声的编码器和用于产生文本的解码器。 技术栈 语言和框架:Python,Pytorch 可视化: 计算平台:AWS EC2 模型 输入是作为语音记录分为13个频段提供的。 编码器是金字塔形的Bi-LSTM,可学习语音输入的嵌入。 该嵌入由语言模型解码器使用。 解码器使用从整个语音输入获得的注意力矩阵来增强嵌入。 然后,它学习从输入语音到输出文本的映射。 解码器经过了预训练,直觉认为预训练将使它能够学习字符如何用英语构建单词和句子。 改善模型性能的启发式方法包括教师强迫,层内正则化和模型压缩。 结果 该模型能够使Lev


【文件预览】:
attention-based-seq2seq-master
----util.py(1KB)
----dataloader.py(3KB)
----main.py(2KB)
----train_test.py(6KB)
----models.py(11KB)
----README.md(1KB)

网友评论