文件名称:VB高频词汇提取技术示例源程序
文件大小:12KB
文件格式:RAR
更新时间:2024-05-27 00:23:19
VB源代码 字符处理
内容索引:VB源码,字符处理,词汇提取 VB擂台赛获奖作品——高频词汇提取技术示例源程序可,第一步:预处理 先读入原始数据; 把原始数据中的每个单词出现位置及长度记录到数组中; 为每个单词生成哈希表; 生成单词表,即原始数据中所有出现过的单词,并记录在原始数据中第一次出现的位置 第二步:短语频率统计 定义一个短语表来存放所有可能出现的短语,记录它在原始数据中出现的位置; 定义一个次数统计表,来存放短语的出现次数 根据短语的单词个数取得单词表中各单词的序号,组合成标记,并由标记生成哈希值; 根据标记哈希值来判断是否相同的短语; 第三步:
【文件预览】:
okbase.net
----phrase()
--------clsWord_v2.8.cls(19KB)
--------phrase.vbp(963B)
--------Q32编程思路.txt(2KB)
--------mod_APIOPen.bas(2KB)
--------phrase.vbw(113B)
--------MSSCCPRJ.SCC(191B)
--------frmMain.frm(8KB)
--------frmMain.frx(1KB)