解析html文件获得P标签的文本信息

时间:2022-11-01 07:24:46
我使用BufferedReader获得了页面的字符串,然后我想通过截取或者通过数据流来解析。可是我不知道具体步骤看了网上一些解析出A标签或者其它标签的。我是新手求具体damo谢谢了!

10 个解决方案

#1


#2


引用 1 楼 rui888 的回复:
jsoup
百度给的参考代码不详细呀,有没有例子给一个谢了。因为我不知道导什么包

#3


引用 2 楼 u014633558 的回复:
Quote: 引用 1 楼 rui888 的回复:

jsoup
百度给的参考代码不详细呀,有没有例子给一个谢了。因为我不知道导什么包
看看api文档

#4


包下载下来拷贝进去

地址1
地址2

#5


引用 3 楼 awajwgluiawa 的回复:
Quote: 引用 2 楼 u014633558 的回复:

Quote: 引用 1 楼 rui888 的回复:

jsoup
百度给的参考代码不详细呀,有没有例子给一个谢了。因为我不知道导什么包
看看api文档
 public static void main(String[] args) throws IOException {

     Document doc = Jsoup.parse("http://www.jtxx0551.com/hfwsslkiframe.action", "GDK");
     //Element content = doc.getElementsByClass("gs_bluezi");
     try {

         Elements links = doc.getElementsByTag("p");
         for (Element link : links) {
           String linkText = link.text();
           System.out.println(linkText+"");
         }
} catch (Exception e) {
// TODO: handle exception
}
    }这是我根据列子写的怎么不行啊

#6



							     

#7


	Document doc = Jsoup.connect("http://www.jtxx0551.com/hfwsslkiframe.action").get();
Elements links = doc.select("p");
      for (Element link : links) {
         String linkText = link.text();
         System.out.println(linkText+"");
       }

#8


引用 7 楼 rui888 的回复:
	Document doc = Jsoup.connect("http://www.jtxx0551.com/hfwsslkiframe.action").get();
Elements links = doc.select("p");
      for (Element link : links) {
         String linkText = link.text();
         System.out.println(linkText+"");
       }

解决了,谢谢你红领巾。加个QQ好友可以吗

#9


公司上不了。有问题就发帖。

#10


方法调用的不对啊
/*
 * To change this license header, choose License Headers in Project Properties.
 * To change this template file, choose Tools | Templates
 * and open the template in the editor.
 */
package test;

import java.io.IOException;
import java.util.logging.Level;
import java.util.logging.Logger;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

/**
 *
 * @author Administrator
 */
public class DecodeHtml {

    public static void main(String[] args) {
        try {
            Document doc = Jsoup.connect("http://www.jtxx0551.com/hfwsslkiframe.action").get();
            //Element content = doc.getElementsByClass("gs_bluezi");
            try {
                Elements links = doc.getElementsByTag("p");
                for (Element link : links) {
                    String linkText = link.text();
                    System.out.println(linkText + "");
                }
            } catch (Exception e) {
// TODO: handle exception
            }
        } catch (IOException ex) {
            Logger.getLogger(DecodeHtml.class.getName()).log(Level.SEVERE, null, ex);
// TODO: handle exception
        }
    }
}

#1


#2


引用 1 楼 rui888 的回复:
jsoup
百度给的参考代码不详细呀,有没有例子给一个谢了。因为我不知道导什么包

#3


引用 2 楼 u014633558 的回复:
Quote: 引用 1 楼 rui888 的回复:

jsoup
百度给的参考代码不详细呀,有没有例子给一个谢了。因为我不知道导什么包
看看api文档

#4


包下载下来拷贝进去

地址1
地址2

#5


引用 3 楼 awajwgluiawa 的回复:
Quote: 引用 2 楼 u014633558 的回复:

Quote: 引用 1 楼 rui888 的回复:

jsoup
百度给的参考代码不详细呀,有没有例子给一个谢了。因为我不知道导什么包
看看api文档
 public static void main(String[] args) throws IOException {

     Document doc = Jsoup.parse("http://www.jtxx0551.com/hfwsslkiframe.action", "GDK");
     //Element content = doc.getElementsByClass("gs_bluezi");
     try {

         Elements links = doc.getElementsByTag("p");
         for (Element link : links) {
           String linkText = link.text();
           System.out.println(linkText+"");
         }
} catch (Exception e) {
// TODO: handle exception
}
    }这是我根据列子写的怎么不行啊

#6



							     

#7


	Document doc = Jsoup.connect("http://www.jtxx0551.com/hfwsslkiframe.action").get();
Elements links = doc.select("p");
      for (Element link : links) {
         String linkText = link.text();
         System.out.println(linkText+"");
       }

#8


引用 7 楼 rui888 的回复:
	Document doc = Jsoup.connect("http://www.jtxx0551.com/hfwsslkiframe.action").get();
Elements links = doc.select("p");
      for (Element link : links) {
         String linkText = link.text();
         System.out.println(linkText+"");
       }

解决了,谢谢你红领巾。加个QQ好友可以吗

#9


公司上不了。有问题就发帖。

#10


方法调用的不对啊
/*
 * To change this license header, choose License Headers in Project Properties.
 * To change this template file, choose Tools | Templates
 * and open the template in the editor.
 */
package test;

import java.io.IOException;
import java.util.logging.Level;
import java.util.logging.Logger;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

/**
 *
 * @author Administrator
 */
public class DecodeHtml {

    public static void main(String[] args) {
        try {
            Document doc = Jsoup.connect("http://www.jtxx0551.com/hfwsslkiframe.action").get();
            //Element content = doc.getElementsByClass("gs_bluezi");
            try {
                Elements links = doc.getElementsByTag("p");
                for (Element link : links) {
                    String linkText = link.text();
                    System.out.println(linkText + "");
                }
            } catch (Exception e) {
// TODO: handle exception
            }
        } catch (IOException ex) {
            Logger.getLogger(DecodeHtml.class.getName()).log(Level.SEVERE, null, ex);
// TODO: handle exception
        }
    }
}