机器学习实战-使用朴素贝叶斯分类器来做垃圾邮件分类
coding: from numpy import *import redef loadDataSet(): postingList = [['my', ' dog', 'has', 'flea', 'problem', 'help', 'please'], ...
文本处理之贝叶斯垃圾邮件分类
本文所讲解的是如何通过Python将文本读取,并且将每一个文本生成对应的词向量并返回. 文章的背景是将50封邮件(包含25封正常邮件,25封垃圾邮件)通过贝叶斯算法对其进行分类. 主要分为如下几个部分: ①读取所有邮件; ②建立词汇表; ③生成没封邮件对应的词向量(词集模型); ④用sklea...