文件名称:读书笔记之7TF-IDF算法实现关键词抽取
文件大小:78KB
文件格式:DOCX
更新时间:2021-12-23 05:19:39
NLP
TF-IDF(term frequency –inverse document frequency)频率—反文档频率,是一种用于咨询检索与咨询探勘的常用加权技术。TF_IDF是一种统计方法,用以评估一字词对于一个文件集成或一个语料库中的其中一份文件的重要程度。字词的重要性随着他在文件中出现的次数呈正比地增加,但同时也会随着它在语料库中出现的频率呈反比地下降。