文件名称:DFT的matlab源代码-MachineLearningDOC:图像、人脸、OCR、语音相关算法整理
文件大小:46KB
文件格式:ZIP
更新时间:2024-06-14 21:52:13
系统开源
DFT的matlab源代码 图像、人脸、OCR、语音相关算法整理 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 概述-图像语音机器学习(Outline-Image & Audio & Machine Learning) 图像: 1. 变换(Transform),分为旋转、放缩、平移、仿射、投影 Rotation和Scale可以看做是一个SVD分解,对于二维图像,对应2x2矩阵。 Translate为了支持矩阵相加,需要扩充一列,所以前三者结合变成一个2x3或3x3矩阵。 Affine加上了翻转和斜切,保持点的共线性和直线的平行性,共有6个*度dof。 Projection变换不是线性的,共有8个*度。 可参考。 通过对变换做处理,可用于变形OCR的纠正,比如。 2. 卷积(convolution),分为一阶、二阶 一阶算子有Roberts、Sobel、Prewitt,由于只求了一阶导数,所以一次只能检测一个方向的边缘。 二阶算子有Laplace、LoG、DoG,是角点检测的第一步,不抗噪。 卷积其实就是信号处理里面的求积再求和
【文件预览】:
MachineLearningDOC-master
----图像人脸OCR语音算法模型整理.docx(36KB)
----README.md(29KB)