JSoup HTML解析器

来源:互联网 发布:慈溪行知职高财贸系 编辑:程序博客网 时间:2024/06/09 17:00

JSoup

jsoup Cookbook(中文版)

入门

  1. 解析和遍历一个html文档

输入

  1. 解析一个html字符串
  2. 解析一个body片断
  3. 根据一个url加载Document对象
  4. 根据一个文件加载Document对象

数据抽取

  1. 使用dom方法来遍历一个Document对象
  2. 使用选择器语法来查找元素
  3. 从元素集合抽取属性、文本和html内容
  4. URL处理
  5. 程序示例:获取所有链接

数据修改

  1. 设置属性值
  2. 设置元素的html内容
  3. 设置元素的文本内容

html清理

  1. 消除不受信任的html (来防止xss攻击)


http://www.open-open.com/jsoup/