由于要处理的数据量比较大,一般每次要处理700~1000个网页源文件,每个网页源文件如果保存为txt文件大约100~200K,以前用instr、left、right的方法,完成整个分析提取过程大约要10~16分钟(是实时访问网站,包括连接、接收数据的时间),以前使用正则表达式处理的数据量都不大,速度不是问题,但现在这数据量有点担心。。。
有没有哪位以前试过比较过的?
3 个解决方案
#1
......测试后再说吧,这个说不清楚=_=
#2
测试后证明:没有显著区别,估计主要拖漫速度的还是网络。。。
#3
蹭点分,嘿嘿
#1
......测试后再说吧,这个说不清楚=_=
#2
测试后证明:没有显著区别,估计主要拖漫速度的还是网络。。。
#3
蹭点分,嘿嘿