程序博客网 > java线程安全的集合

BeautifulSoup及lxml使用小记

来源：互联网发布：java线程安全的集合编辑：程序博客网时间：2024/06/02 17:19

Bs4中常用findall与class_来寻找节点

book_cover=soup.find_all("div",class_='cover')

得到的结果是存在列表中的bs4 tree，仍旧可以用findall遍历

遇到有些只有标签的，没有任何属性的，想要的到标签中的内容，可以寻找兄弟节点

如find_next_siblings()找下一个兄弟节点

还有find_parent()找父节点

find_all_next()找到与当前元素靠近的所有对象。而find_next()找到离当前元素最接近的对象。

这些都与previous相对应

2.lxml中可以用cssselect和xpath寻找节点

books=html.cssselect('div.covera')

3. 获得属性的值：

两者都可以用get("属性名")的方法

也可以用soup.tagName['属性名']

4. 获得标签包含的文本：

定位到节点后使用 .text属性

5.注意区别find与findall，find找到的结果只有一个，以树结构返回，findall找到所有满足条件的，以列表形式返回

6.在抓取内容时，注意观察，有规律的话找到所有包含想要信息的树块，然后循环在一个树块中找

0 0

java线程安全的集合

java线程安全的集合

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子刻录机多少钱一台光雕刻录机如何使用dvd刻录机买刻录机外置刻录机刻录机什么牌子好刻录机怎么用刻录机和光驱的区别 dvd刻录机 lg外置刻录机外置刻录机怎么用刻录机价格监控刻录机价格 dvd刻录机价格笔记本光盘刻录机刻录机 dvd dvd thinkpad外置刻录机刻成语刻的成语情侣手环刻字刻什么好刻斗士通灵宝玉上刻的字国宝玉玺明朝玉玺攻城略地玉玺争夺战详细攻略尼勒克玉玺酒店奥运玉玺拍卖价是多少西安玉玺公交卡男士发型刻痕申请刻公章刻私章多少钱一个刻一个私章要多少钱满洲里刻章长沙刻章附近哪里有刻章店福州刻章店长沙刻章店深圳刻章店瓦房店刻章杭州刻章店