-
安装
pip install bs4
-
初始化
from bs4 import BeautifulSoup
soup = BeautifulSoup(html, "html.parser")
- 查找元素
p_list = soup.find_all("p")
- 删除元素 [只删除标签,不删除标签内的子树]
tags = soup("a")
for tag in tags:
if tag.get("class") != ['read-link']:
tag.unwrap()
- 销毁元素 [销毁标签和子树]
tags = soup("a")
for tag in tags:
if tag.get("class") != ['read-link']:
tag.decompose()