直接上代码,主要函数
ignore_user_abort(true);
这个函数忽略了终端被关闭(打开的网页被关闭),后面
getfiles()这函数是执行采集任务的自定义函数,后面又配置了下路径
打开写好的页面,关闭,后面发现任务都能执行完成,有兴趣的可以试试。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
|
<?php
//设置忽略是否关闭终端窗口
ignore_user_abort(true);
ini_set ( 'max_execution_time' , '0' );
//采集页面函数,看不懂执行百度curl php
function getfiles( $url , $name ){
$name = $name . ".txt" ;
$ch = curl_init( "$url" );
$fp = fopen ( "$name" , "w" );
curl_setopt( $ch , CURLOPT_FILE, $fp );
curl_setopt( $ch , CURLOPT_HEADER, 0);
curl_exec( $ch );
curl_close( $ch );
fclose( $fp );
sleep(5);
echo '<script>window.close();</script>' ;
}
//配置需要采集的页面路径数组
$urls = array (
'http://www.cnblogs.com/jianqingwang/p/6373168.html' ,
'http://www.cnblogs.com/jianqingwang/p/6148644.html' ,
'http://www.61916.com/news_view_2423.html' ,
'http://blog.sina.com.cn/s/blog_8e326c350102w1ah.html' ,
'http://www.w3school.com.cn/php/func_misc_ignore_user_abort.asp' ,
'http://xinwen.eastday.com/a/170219205305597.html' ,
'http://society.huanqiu.com/article/2017-02/10162630.html?from=bdwz' ,
'http://www.cankaoxiaoxi.com/roll10/bd/20170220/1699670.shtml' ,
'http://news.china.com/socialgd/10000169/20170220/30266284.html' ,
'http://news.k618.cn/society/201702/t20170220_10368740.html' ,
'http://fj.qq.com/a/20170218/029521.htm'
);
//遍历数组
foreach ( $urls as $key => $val ){
getfiles( $val , $key );
}
?>
|
以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,同时也希望多多支持服务器之家!
原文链接:http://www.cnblogs.com/jianqingwang/p/6420602.html