【文件属性】:
文件名称:matlab精度检验代码-VGGVox-PyTorch:在PyTorch中为VoxCeleb1数据集实现VGGVox
文件大小:64.8MB
文件格式:ZIP
更新时间:2021-05-21 22:18:36
系统开源
matlab精度检验代码VGGVox-PyTorch
在PyTorch中为VoxCeleb1数据集实现VGGVox。
火车
pip
install
-r
requirements.txt
python3
train.py
--dir
./data/
用--dir指定数据目录
笔记
81.79%Top-1和93.17
Top-5测试装置的准确性,非常令人满意。
在中查找详细信息。
V100的培训每个时期需要4分钟。
模型
运行python3
vggm.py进行模型架构。
上载最佳模型权重
到目前为止,我所做的是:
所有数据都完全按照作者的matlab代码进行了预处理。
在Matlab上在线检查和验证
随机3s裁剪段进行训练。
复制所有超参数...
LR,优化器参数,作者网络中的批处理大小。
稳定PyTorch的BatchNorm和测试版本。
改善结果的比例很小。
尝试按照作者的github上提到的单边频谱图输入。
从matlab移植作者网络并进行培训。
Matlab模型具有1300个输出尺寸,稍后将对其进行测试。
从matlab网络复制权重并进行测试。
参考和引用:
linhdvu14的
【文件预览】:
VGGVox-PyTorch-master
----.gitignore(60B)
----requirements.txt(75B)
----data()
--------iden_split.txt(4.68MB)
--------vox1_meta.csv(40KB)
--------val.pkl(378KB)
----signal_utils.py(2KB)
----models()
--------VGGM300_BEST_140_81.99.pth(68.37MB)
----LICENSE(1KB)
----model_test.py(2KB)
----vggm.py(2KB)
----results.txt(2KB)
----README.md(2KB)
----test.wav(348KB)
----train.py(6KB)