;
pos1= urlContent.indexOf(strAreaBegin)+strAreaBegin.length();
pos2=urlContent.indexOf(strAreaEnd,pos1);
ContentArea=urlContent.substring(pos1,pos2);
}
//以下两个函数获得网址应该要包含的关键字及不能包含的关键字
//这里只做初步的实验。后期,保护的关键字及不能包含的关键字应该是不只一个的。
public void getStringInUrl(String stringInUrl)
...{
this.stringInUrl=stringInUrl;
}
public void getStringNotInUrl(String stringNotInUrl)
...{
this.stringNotInUrl=stringNotInUrl;
}
//获取采集规则
//获取url网址
public void getUrl()
...{
}
public String getRegex()
...{
return regex;
}
class UrlAndTitle
...{
String myURL;
String title;
}
}