1. SVM
1.1 优点
- SVM在解决小样本,非线性以及高维特征中表现出许多特有的优势。
- SVM基于有限的样本信息在模型的复杂度和模型准确性之间寻求最佳折中,以获得最好的预测效果。
1.2 缺点
- 在数据量大的情况下运算复杂度高,不适合处理过大的数据。
- 模型稳定性低,输入的微小变化会使得模型难以收敛。
- SVM仅直接适用于二分类任务。因此,必须应用将多类任务减少到几个二元问题的算法。
1.3 适用场景
目前SVM主要应用在模式识别领域中的文本识别,中文分类,人脸识别等,同时也应用到信息过滤等方面。
2. 朴素贝叶斯
2.1 优点
- 算法逻辑简单,易于实现
- 分类过程中时空开销小(假设特征相互独立,只会涉及到二维存储)
- 对缺失数据不太敏感,算法也比较简单,常用于文本分类,欺诈检测。
2.2 缺点
- 理论上,朴素贝叶斯模型与其他分类方法比具有最小的误差率,但实际上并非总是如此,这是因为朴素贝叶斯模型假设属性之间的相互独立,这个假设在实际应用中往往是不成立的,在属性个数比较多或者属性之间相关性较大时,分类效果不好,而在属性相关性较小时,朴素贝叶斯性能最为良好。
2.3 适用场景
垃圾邮件分类等