BeautifulSoup使用方法 - 代码天地

BeautifulSoup使用方法

其他 2019-02-19 19:41:24 阅读次数: 0

先上实例代码：

1 from urllib.request import urlopen
2 from bs4 import BeautifulSoup
3 
4 html = urlopen("http://www.pythonscraping.com/pages/page1.html")
5 bs0bj = BeautifulSoup(html.read())
6 print(bs0bj.h1)
7 print(bs0bj.html.body.h1)
8 print(bs0bj.body.h1)
9 print(bs0bj.html.h1)

BeautifulSoup的作用，如官网所言：

Beautiful Soup提供一些简单的、python式的函数用来处理导航、搜索、修改分析树等功能。它是一个工具箱，通过解析文档为用户提供需要抓取的数据，因为简单，所以不需要多少代码就可以写出一个完整的应用程序。

Beautiful Soup自动将输入文档转换为Unicode编码，输出文档转换为utf-8编码。你不需要考虑编码方式，除非文档没有指定一个编码方式，这时，Beautiful Soup就不能自动识别编码方式了。然后，你仅仅需要说明一下原始编码方式就可以了。

Beautiful Soup已成为和lxml、html6lib一样出色的python解释器，为用户灵活地提供不同的解析策略或强劲的速度。

简单而言，就是解析网页结构，将html代码格式化。

待续...

猜你喜欢

转载自www.cnblogs.com/zhliu/p/10402963.html

BeautifulSoup使用方法

BeautifulSoup中select的使用方法

BeautifulSoup4的使用方法

Python获取网页指定内容(BeautifulSoup工具的使用方法)

Python网络爬虫 BeautifulSoup库的使用方法

python爬虫——爬取酷狗音乐top500(BeautifulSoup使用方法)

BeautifulSoup 使用select方法详解

python爬虫：BeautifulSoup 使用select方法的使用

使用BeautifulSoup方法抓取豆瓣电影信息

python爬虫：BeautifulSoup 使用select方法详解

pymongo使用方法

Pycharm使用方法

snprintf的使用方法

Navicat使用方法

线程的使用方法

Markdown - 使用方法

PageHelper使用方法

NCBI使用方法

ZoomIt使用方法

Mongodb使用方法

postman使用方法

Hibernate使用方法

this 基础使用方法

as 和 is 使用方法

select使用方法

RecyclerView 使用方法

keytool使用方法

ENDNOTE使用方法

cocoaPods 使用方法

iscroll使用方法

今日推荐

周排行

Leetcode简单题61~80

解决zookeeper磁盘IO高的问题

多线程相关方法详解

Maven-setting.xml文件详解

Maven 项目的 classpath 理解

渊亭科技大数据笔试题

配置JVM内存分配

计算机网络个人学习笔记（三）网络层：第三部分连载

js中两个等号(==)和三个等号(===)的区别

用C程序自动打开电脑上的程序

每日归档

更多

2024-09-18(0)

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)

2024-09-09(0)