文件名称:KE2014:NTUST 知识工程 2013 秋季 - 作业 #1 #2
文件大小:42.25MB
文件格式:ZIP
更新时间:2024-07-24 06:06:49
JavaScript
#KE2014 NTUST Knowledge Engineering 2013 Fall - Homework #1 #2 Homework #1 Requirements 实作七项主题 影剧娱乐、运动、两岸、财经、保健、政治、社会 列出每一主题的前50名关键词 列举2~8字词 需移除含数字或特殊字元者,并移除子关键词 列出排名、关键词、tf、df、tf-idf 依序存在一个Excel 中 Homework #2 Requirements Extract keywords using Homework #1 n-gram approach with tf-idf, and extract at least 200 keywords for each topic Use keywords to tag every document Use VSM to get the cosine si