音频文件的处理问题~

时间:2022-05-25 19:46:23
如何比较两个音频文件的相似程度?注意比较的是文件所保存的音频内容,不涉及到关于文件的一些属性(比如歌手、专辑、流派、长度……);具体点儿,比如说,两个人说同样的话录下来,然后比较一下二者声音的相似程度……

暂且把音频文件定为.wav格式的吧,如果有能比较所有格式的方法更好~

我的想法是把文件读入到bytes[]数组里,然后再比较,不知这样可行否?大家有什么好的想法或者案例分享一下~~100分,不够再加~~

23 个解决方案

#1


帮顶...

#2


这个我也想知道.
音频的处理涉及到比较专业的内容的,这里懂的人肯能不太多.

#3


up

#4


汗!我正在学这个问题!还没看明白呢!等你的结果!

#5


这个比较专业吧?

#6


引用楼主 genius_tong 的帖子:
我的想法是把文件读入到bytes[]数组里,然后再比较,不知这样可行否?大家有什么好的想法或者案例分享一下~~100分,不够再加~~

文件内容并不都是音频,还有音高,时间序列等等参数,最简单的是midi文件,建议先从midi做起.

#7


嗯,这个感觉跟图片相似度比较有得比~
估计是要把字节流经过××变换,
然后在放入某个公式进行过滤
然后找出特征值,
然后在通过 数据分类 的方法进行 声音类型离散化,比较相似度。

。。。。。

#8


涉及专业知识吧!

可能需要较多数学知识!

#9


弄不来,我也在等高手解答呢!

#10


帮顶下

#11


up

#12


如果如同LZ说的那样,应该是比较说的内容,这时要用speech api(语音识别,语音输入之类的),将音频转成字串,比较字串。
如果是要比较两个人的声音的相似程度,比如都是男中音,或者都是女高音,这里需要对音频的模拟信号进行傅立叶变换成频域信号,在频域进行分析,如频宽,频率分布及功率谱分析等。

#13


引用 12 楼 ForestDB 的回复:
如果如同LZ说的那样,应该是比较说的内容,这时要用speech api(语音识别,语音输入之类的),将音频转成字串,比较字串。
如果是要比较两个人的声音的相似程度,比如都是男中音,或者都是女高音,这里需要对音频的模拟信号进行傅立叶变换成频域信号,在频域进行分析,如频宽,频率分布及功率谱分析等。


够专业

#14


引用 12 楼 ForestDB 的回复:
如果如同LZ说的那样,应该是比较说的内容,这时要用speech api(语音识别,语音输入之类的),将音频转成字串,比较字串。 
如果是要比较两个人的声音的相似程度,比如都是男中音,或者都是女高音,这里需要对音频的模拟信号进行傅立叶变换成频域信号,在频域进行分析,如频宽,频率分布及功率谱分析等。

哈哈,傅立叶,数学~~~专业知识要有的

#15


要比较声音的相似度~~

我学数学的,可是感觉这个很复杂哦

#16


引用 12 楼 ForestDB 的回复:
如果如同LZ说的那样,应该是比较说的内容,这时要用speech api(语音识别,语音输入之类的),将音频转成字串,比较字串。 
如果是要比较两个人的声音的相似程度,比如都是男中音,或者都是女高音,这里需要对音频的模拟信号进行傅立叶变换成频域信号,在频域进行分析,如频宽,频率分布及功率谱分析等。


能否提供一下speech api的使用案例?谢啦~~
PS:我的邮箱litonghui1990@gmail.com

#17


等待

#18


fft处理后做相似度比较吧 不过这个好像蛮麻烦的 

#19


等高手出现!

#20


建议LZ先到MSDN上搜索一下关于speech的主题。

#21


我最近也在研究这个问题 顶一下了 期望找到答案

#22


在C中可以读取语音的频率等信息吗?怎么对语音用FFT进行频谱分析?

#23


估计是要把字节流经过××变换,
然后在放入某个公式进行过滤
然后找出特征值,
然后在通过 数据分类 的方法进行 声音类型离散化,比较相似度。
如果如同LZ说的那样,应该是比较说的内容,这时要用speech api(语音识别,语音输入之类的),将音频转成字串,比较字串。
如果是要比较两个人的声音的相似程度,比如都是男中音,或者都是女高音,这里需要对音频的模拟信号进行傅立叶变换成频域信号,在频域进行分析,如频宽,频率分布及功率谱分析等。

#1


帮顶...

#2


这个我也想知道.
音频的处理涉及到比较专业的内容的,这里懂的人肯能不太多.

#3


up

#4


汗!我正在学这个问题!还没看明白呢!等你的结果!

#5


这个比较专业吧?

#6


引用楼主 genius_tong 的帖子:
我的想法是把文件读入到bytes[]数组里,然后再比较,不知这样可行否?大家有什么好的想法或者案例分享一下~~100分,不够再加~~

文件内容并不都是音频,还有音高,时间序列等等参数,最简单的是midi文件,建议先从midi做起.

#7


嗯,这个感觉跟图片相似度比较有得比~
估计是要把字节流经过××变换,
然后在放入某个公式进行过滤
然后找出特征值,
然后在通过 数据分类 的方法进行 声音类型离散化,比较相似度。

。。。。。

#8


涉及专业知识吧!

可能需要较多数学知识!

#9


弄不来,我也在等高手解答呢!

#10


帮顶下

#11


up

#12


如果如同LZ说的那样,应该是比较说的内容,这时要用speech api(语音识别,语音输入之类的),将音频转成字串,比较字串。
如果是要比较两个人的声音的相似程度,比如都是男中音,或者都是女高音,这里需要对音频的模拟信号进行傅立叶变换成频域信号,在频域进行分析,如频宽,频率分布及功率谱分析等。

#13


引用 12 楼 ForestDB 的回复:
如果如同LZ说的那样,应该是比较说的内容,这时要用speech api(语音识别,语音输入之类的),将音频转成字串,比较字串。
如果是要比较两个人的声音的相似程度,比如都是男中音,或者都是女高音,这里需要对音频的模拟信号进行傅立叶变换成频域信号,在频域进行分析,如频宽,频率分布及功率谱分析等。


够专业

#14


引用 12 楼 ForestDB 的回复:
如果如同LZ说的那样,应该是比较说的内容,这时要用speech api(语音识别,语音输入之类的),将音频转成字串,比较字串。 
如果是要比较两个人的声音的相似程度,比如都是男中音,或者都是女高音,这里需要对音频的模拟信号进行傅立叶变换成频域信号,在频域进行分析,如频宽,频率分布及功率谱分析等。

哈哈,傅立叶,数学~~~专业知识要有的

#15


要比较声音的相似度~~

我学数学的,可是感觉这个很复杂哦

#16


引用 12 楼 ForestDB 的回复:
如果如同LZ说的那样,应该是比较说的内容,这时要用speech api(语音识别,语音输入之类的),将音频转成字串,比较字串。 
如果是要比较两个人的声音的相似程度,比如都是男中音,或者都是女高音,这里需要对音频的模拟信号进行傅立叶变换成频域信号,在频域进行分析,如频宽,频率分布及功率谱分析等。


能否提供一下speech api的使用案例?谢啦~~
PS:我的邮箱litonghui1990@gmail.com

#17


等待

#18


fft处理后做相似度比较吧 不过这个好像蛮麻烦的 

#19


等高手出现!

#20


建议LZ先到MSDN上搜索一下关于speech的主题。

#21


我最近也在研究这个问题 顶一下了 期望找到答案

#22


在C中可以读取语音的频率等信息吗?怎么对语音用FFT进行频谱分析?

#23


估计是要把字节流经过××变换,
然后在放入某个公式进行过滤
然后找出特征值,
然后在通过 数据分类 的方法进行 声音类型离散化,比较相似度。
如果如同LZ说的那样,应该是比较说的内容,这时要用speech api(语音识别,语音输入之类的),将音频转成字串,比较字串。
如果是要比较两个人的声音的相似程度,比如都是男中音,或者都是女高音,这里需要对音频的模拟信号进行傅立叶变换成频域信号,在频域进行分析,如频宽,频率分布及功率谱分析等。