文件名称:信息采集系统(老紫竹搜索引擎0.4 测试版 包括了部分B/S程序 )
文件大小:6.96MB
文件格式:RAR
更新时间:2016-06-21 01:40:28
搜索引擎 B/S程序
1 完全基于人工收录,每个被收录的帖子都是我们认为不错的。 2 任何人都可以加入,别人也可以分享到你加入的内容 3 收录的内容,不是简单的抓取,而是只收录里面最有用的部分,比如主题,内容,作者,发言时间等 4 由于上一个的原因,所以不是任何网站都能加入,后面有目前支持的网站列表。 5 增加新的网站支持,需要写3个正则表达式,进行帖子内容的精确匹配 6 使用Lucene进行存储和查询 7 开源,可以在自己的机器上部署一个,拥有自己的收藏和搜索工具。 8 同样,由于对网站进行了控制,所以可以避免一些比不要的麻烦。 (版权归老紫竹所有)