解析网页源码

背景

最近在学爬虫的时候,需要分析网页源码,但里面很多缩写有点看不懂,就去查了一下,记录于此

结构 <><>

参考html代码
CSS?都是采用双标签<header> </header> 前者表示开始,后者结束
主体框架如下图所示

#主体框架
<html>
    <header>
	</header>
	<body>
	</body>
</html>

一般会在body标签中展开,标签中的结构一般是 (name,attrs,text)即名字、属性、文本

#body
<body>
	<div id='gift1' class="gift">
	</div>
</body>

一般

<span></span>中间一般是文本,且一般是末端
<div></div>中间也可以放文本,但还可以嵌套其他子单元

简写说明

参考html页面特效代码大全

表格table

在这里插入图片描述
tr = table row
th = table header
td = table data

其他

<a href='url'>
<img src=''>
<br> 换行 ?row
<B> 加粗 Block
<l>斜体 

猜你喜欢

转载自blog.csdn.net/shuyueliang1/article/details/86714764