短文本分析B组1

时间:2022-08-08 22:26:25
【文件属性】:

文件名称:短文本分析B组1

文件大小:1.12MB

文件格式:DOCX

更新时间:2022-08-08 22:26:25

聚类 算法 互联网 twitter

2.2 短文本的特点稀疏性:每条短文本形式信息的长度都比较短,都在 200 字以内,因此所包含的有效信息也就非常少,造成样本的特征非常稀疏,并且特征集的维数非常


网友评论