Python-bs4解析html

Beautiful Soup简介(简称bs4)

它是一个可以从HTML或XML文件中提取数据的Python库,它能够通过你喜欢的转换器实现惯用的文档导航、查找、修改文档的方式,节省工作时间

 所有对象可以归纳为4种:

Tag:标签对象,例如<p class=”title”><b>yoyoketang</b></p>,这就是一个标签

NavigableString:字符对象,如:这里是我的微信公众号:yoyoketagn

BeautifulSoup:就是整个html对象

Comment:注释对象,如:!-- for HTML5 --,它其实就是一个特殊NavigableString

安装pip install beautifulsoup4

猜你喜欢

转载自www.cnblogs.com/python-lll/p/11745811.html