文件名称:论文研究-基于信息增益的软件特征技术.pdf
文件大小:594KB
文件格式:PDF
更新时间:2022-08-11 15:01:01
特征提取,特征选择,信息增益,特征频率
在传统的k-gram方法提取的特征的基础上,为了选出更加有效的特征,提出了一种新的特征选择方法——信息增益。由于针对信息增益方法中未对特征碎片的词频给予足够重视,从而导致特征分布不均的问题,将特征频率应用于信息增益方法上,提出了一种基于信息增益的改进方法。实验表明,该方法有很好的可信性和鲁棒性,与同类方法相比有明显优势,是对软件特征技术有意义的探索。