Python爬虫精简步骤4 如何读HTML - 代码天地

Python爬虫精简步骤4 如何读HTML

编程语言 2020-02-20 10:23:34 阅读次数: 0

随便开一个网站。（我这里就不截图了，每个网站都大同小异）

按之前博文写的方法，右键检查调出源程序。

网页头中定义了编码、选项卡之类的内容。点击三角符号折叠。
里面的< style>元素可以定义一些样式。
（style属性可以用来定义网页文本的样式，比如字体大小、颜色、间距、对齐方式等等）

然后看网页体，点击三角符号折叠
网页体有三大部分，< div id=“header”>元素的部分，< div id=“article”>元素的部分，和< div id=“footer”>元素的部分。
分别是：顶部的标题、中间的内容、以及底部。
首个< div>元素是网页的顶部标题：id=“header”

然后是< div id=“article”>元素，它对应的是中间的正文部分。

底部对应< div id=“footer”>。

细看中间正文部分。
< div id=“article”>元素分为两部分，它包含着两个< div>元素，分别对应着网页中间的左边栏和正文部分。

其实将鼠标放在相应的代码位置，左侧网页相应部分就会被标亮。慢慢自己摸索，就很快知道哪块对应哪块。

如图甚至可以把网页改了。试着让首页后面再加一个页字，成功改动。在这里插入图片描述
当然这样的修改只是本地修改，而服务器上的源文件是修改不了的，所以，这些改动仅供自娱自乐。

（后期会持续更新~ 欢迎点赞关注~）

发布了4 篇原创文章 · 获赞 48 · 访问量 8163

私信关注

猜你喜欢

转载自blog.csdn.net/LoraRae/article/details/104389769

Python爬虫精简步骤4 如何读HTML

Python爬虫精简步骤2 HTML基础（上）

Python爬虫精简步骤3 HTML基础（下）网页头和网页体

Python爬虫精简步骤1 获取数据

如何丧心病狂的使用python爬虫读小说

Python爬虫精简步骤5 用BeautifulSoup解析数据

Python爬虫精简步骤6 用BeautifulSoup提取数据

网络爬虫——小例子补充（爬虫完整步骤及爬虫如何处理html文件）

如何使用bs4爬虫解析html

Python爬虫开发与项目实战 4: HTML解析大法

python爬虫系列三：html解析大法-bs4

Python爬虫 —— 使用BeautifulSoup4解析HTML文档

初读「Python基础教程」自学Python完全读不懂该如何是好？

HTML/CSS: 如何制作未读信息图标

python MySQLdb 如何设置读超时read_timeout

【python爬虫】动态html

如何入门爬虫而系统学习？python爬虫实战基础学习(使用BeautifulSoup4等)

爬虫精简

(python)Xpath如何提取html标签（HTML标签和内容）

学习python爬虫步骤

Python爬虫之基于bs4库的HTML内容查找方法

2-4-1 基于 HTML 的爬虫，Python（Beautifulsoup）实现（版本：py3）——学习笔记

2-4 基于 HTML 的爬虫，Python（Beautifulsoup）实现（版本：py3）

python爬虫-通过bs4和xpath分析html代码

Python从零开始写爬虫-4 解析HTML获取小说正文

python爬虫之下载盗墓笔记（bs4解析HTML）

Python爬虫六基于bs4库的html内容查找方法

Python爬虫学习（五）基于bs4库的HTML内容检索

如何用Python从数据库里面获取数据？4个步骤就能轻松实现

python爬虫系列之 html页面解析：如何写 xpath路径

今日推荐

周排行

AIZU 2224 Save your cats(并查集)

HTTP响应头状态码详解

Python socket编程（2）

MaxCompute Studio使用心得系列7—作业对比

Supervisor安装使用

LeetCode 164. Maximum Gap

mysql面试题: 一张表里面有ID自增主键，当insert了17条记录之后，删除了第15,16,17条记录，再把mysql重启，再insert一条记录，这条记录的ID是18还是15

nutch1.2 DeleteDuplicates IndexMerger 详解

OC - @property与setter,getter方法

SpringBoot @Transactional的rollbackFor属性

每日归档

更多

2024-09-19(0)

2024-09-18(0)

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)