java在网页上面抓取邮件地址的方法

时间:2021-08-03 05:59:28

本文实例讲述了java网页上面抓取邮件地址的方法。分享给大家供大家参考。具体实现方法如下:

 

复制代码代码如下:
import java.io.BufferedReader;  
import java.io.InputStreamReader;  
import java.net.URL;  
import java.util.regex.Matcher;  
import java.util.regex.Pattern;  
  
public class h1  
{  
   public static String   getWebCon(String domain)  
   {  
    System.out.println("开始抓取邮件地址..("+domain+")");  
    StringBuffer sb=new StringBuffer();  
    try  
    {  
     java.net.URL url=new java.net.URL(domain);  
     BufferedReader in=new BufferedReader(new InputStreamReader(url.openStream()));  
     String line;  
     while((line=in.readLine())!=null)  
     {  
      parse(line);  
     }  
     in.close();  
    }  
    catch(Exception e)  
    {  
     sb.append(e.toString());  
     System.err.println(e);  
      
    }  
    return sb.toString();  
   }  
   public static void main(String[] args)  
   {  
    String s;  
    s=h1.getWebCon("http://post.baidu.com/f?kz=34942387"); //这是要抓取的网页,自己可以试下.  
    //System.out.println(s);  
   }  
   private static void parse(String line)  
   {  
    Pattern p=Pattern.compile("[\\w[.-]]+@[\\w[.-]]+\\.[\\w]+");//邮箱的正则表达式  
    Matcher m=p.matcher(line);  
    while(m.find())  
    {  
     System.out.println(m.group());  
    }  
   }  
}

 

希望本文所述对大家的Java程序设计有所帮助。