DFT的matlab源代码-MachineLearningDOC:图像、人脸、OCR、语音相关算法整理下载

【文件属性】：

文件名称：DFT的matlab源代码-MachineLearningDOC:图像、人脸、OCR、语音相关算法整理

文件大小：46KB

文件格式：ZIP

更新时间：2024-06-14 21:52:13

系统开源

DFT的matlab源代码图像、人脸、OCR、语音相关算法整理 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 概述-图像语音机器学习（Outline-Image & Audio & Machine Learning）图像： 1. 变换(Transform)，分为旋转、放缩、平移、仿射、投影 Rotation和Scale可以看做是一个SVD分解，对于二维图像，对应2x2矩阵。 Translate为了支持矩阵相加，需要扩充一列，所以前三者结合变成一个2x3或3x3矩阵。 Affine加上了翻转和斜切，保持点的共线性和直线的平行性，共有6个*度dof。 Projection变换不是线性的，共有8个*度。可参考。通过对变换做处理，可用于变形OCR的纠正，比如。 2. 卷积(convolution)，分为一阶、二阶一阶算子有Roberts、Sobel、Prewitt，由于只求了一阶导数，所以一次只能检测一个方向的边缘。二阶算子有Laplace、LoG、DoG，是角点检测的第一步，不抗噪。卷积其实就是信号处理里面的求积再求和

立即下载

【文件预览】：
MachineLearningDOC-master
----图像人脸OCR语音算法模型整理.docx(36KB)
----README.md(29KB)

秒客网

DFT的matlab源代码-MachineLearningDOC:图像、人脸、OCR、语音相关算法整理

网友评论

相关文章