6-29学习记录

其他 2018-06-29 23:19:33 阅读次数: 2

Python

---小白121的记录笔记

Beautifulsoup

beautifulsoup 是爬虫的一个第三方库，主要用于过滤出有用的数据

pip和ide工具都可以进行安装

BeautifulSoup 将 HTML 分成四个对象

Tag
NavigableString
BeautifulSoup
Comment

创建 Beautifulsoup 对象

soup = BeautifulSoup(html)

打印soup对象的内容

print（soup.prettify()

打印 Tag

print(soup.html.encode('utf-8'))
print(soup.title.encode('utf-8'))
print(soup.head.encode('utf-8'))
print(soup.a.encode('utf-8'))
print(soup.p.encode('utf-8'))

所以 Tag 即使 HTML 里面的各种标签

对于Tag来说，有两个重要的属性

name
attrs

print(soup.title.name)
print(soup.a.attrs)

name 输入当前标签名字

attrs 把a标签的所以属性打印出来

Navigablestring

print(soup.a.string)

显示当前标签的内容

单词

sibling 兄弟姐妹

with 等待

element 要素

document 文档

previous 以前的

猜你喜欢

转载自www.cnblogs.com/forever121812/p/9245690.html

6-29学习记录

6-29

6-29晚间练习

6-29日试题整理

6-29 十进制转换二进制 (10分

6-29 水上飞机(*) (20分)多重继承

IMX6学习记录(29)-开机信息显示在屏幕上面

C++语言程序设计（第4版）习题6-29：运行下面的程序，观察执行结果，指出该程序是如何通过指针造成安全性隐患的，思考如何避免这种情况的发生。

C#学习记录（29）事件（2）

Python学习之路—2018/6/29

2018-6-29 问题解决记录

jquery学习记录6

js学习记录6

Linux(6)_学习记录

学习记录6

web 学习记录6

nodemcu学习记录6

C++语言学习记录-29：文件处理

【数据结构学习记录29】——基数排序

6月29日学习总结 Django自带的用户认证

从零开始学习--Beautifulsoup 6月29日

菜鸟笔记-算法 6月29日学习(冒泡排序)

ES6学习记录

6-24学习记录

6-25学习记录

6-27学习记录

PHP日常学习记录-6

ECMAScript 6学习记录（一）

ECMAScript 6学习记录（二）

ES6 学习记录

今日推荐

周排行

Leetcode简单题61~80

解决zookeeper磁盘IO高的问题

多线程相关方法详解

Maven-setting.xml文件详解

Maven 项目的 classpath 理解

渊亭科技大数据笔试题

配置JVM内存分配

计算机网络个人学习笔记（三）网络层：第三部分连载

js中两个等号(==)和三个等号(===)的区别

用C程序自动打开电脑上的程序

每日归档

更多

2024-09-18(0)

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)

2024-09-09(0)