刨丁解羊HTMl网页信息抽取器

时间:2013-09-19 15:19:50
【文件属性】:

文件名称:刨丁解羊HTMl网页信息抽取器

文件大小:14KB

文件格式:RAR

更新时间:2013-09-19 15:19:50

信息抽取 搜索引擎 网络蜘蛛 网络爬虫 分词索引

刨丁解羊HTMl网页信息抽取器,是制作搜索引擎、网络蜘蛛、网络爬虫、分词索引的核心组件。采用人工智能启发式算法、高斯积分去噪算法,对HTML格式的源代码网页进行抽取,通过过滤无用的HTM标签、主题相悖信息,抽取出核心正文信息。DLL及OCX调用请联系QQ(601069289)。


【文件预览】:
刨丁解羊HTMl网页信息抽取器
----HTM2TXT.exe(52KB)
----软件说明.txt(248B)

网友评论

  • 没有代码啊,不过还是可以参考一下,非常感谢。
  • 额,不会用啊
  • 晕,根本不是代码。没意思!
  • 只有程序,没有源码。。确实如此
  • 只有程序,没有源码。。