为什么用Jsoup 解析不到 <tr> 下面的<td>

来源:互联网 发布:12306网络订票时间 编辑:程序博客网 时间:2024/06/11 14:36
import org.jsoup.Jsoup;import org.jsoup.nodes.Document;import org.jsoup.nodes.Element;import org.jsoup.select.Elements;/** * @author Administrator * */public class Test {    /**     * @param args     */    public static void main(String[] args) {        Document pasedDoc=Jsoup.parse("<tr><td>hello</td></tr>");        Elements cells=pasedDoc.getElementsByTag("td");        System.out.println(cells.toString());    }}

这是我用Jsoup解析Html的一个demo, 但是为什么解析不了下面的呢?

如果解析

下面的就很成功啊。

换成如下代码,就可以顺利出来结果:

public class Test {    /**     * @param args     */    public static void main(String[] args) {        Element pasedDoc=Jsoup.parse("<table><tr><td>hello</td></tr></table>");        Elements cells=pasedDoc.getElementsByTag("tr");        System.out.println(cells.toString());    }}

是没有 table 的tr和td 都是没意义的,所以被忽略了
做法就是用select改写一下吧。曲线救国。
或者得到的String再进行分割

0 0
原创粉丝点击