文件名称:自然语言处理实验 字串处理
文件大小:50.94MB
文件格式:RAR
更新时间:2024-06-27 07:00:44
自然语言处理 汉字的熵 字串
实验 字串处理 1)汉字字频统计 1. 给出前100个汉字高频字的频率统计结果; 2. 分别给出前1、20、100、600、2000、3000汉字的字频总和; 3. 计算汉字的熵值; 2)英文词频统计 1. 给出前100个高频单词的频率统计结果; 2. 分别给出前1、20、100、600、2000、3000单词的词频总和; 3. 计算单词的熵值; 3)针对不同规模语料重复上述实验;