读书笔记之8文本特征提取之word2vec

时间:2021-12-23 05:21:03
【文件属性】:

文件名称:读书笔记之8文本特征提取之word2vec

文件大小:115KB

文件格式:DOCX

更新时间:2021-12-23 05:21:03

NLP

文本预处理:分词,取出停用词,过滤低频词汇,编码归一化等; 文本向量化:如使用向量空间模型VSM(Vector Space Model)或者概率统计模型对文本进行表示,使计算机能够理解计算,用的方法基于集合论模型。基于代数轮模型。基于频率统计模型等等; 文本特征提取和选择:特征提取对应着特征项的选择和特征权重的计算。


网友评论