day18笔记

18.01_Python语言基础(排列)(了解)

在python中使用iterTools模块来完成排列
从n不同的元素中去m个元素，会按照特定的顺序排成一列—–》排列
格式：
- iterTools.permutations(序列，排列个数)
[1,2,3,4] 2

排列案例：

#
import itertools
mylst = list(itertools.permutations([1,2,3,4],2))#12
print(mylst)
mylst = list(itertools.permutations([1,2,3,4],3))#24
print(mylst)

排列可能出现的次数

n!/(n-m)!

18.02_Python语言基础(组合)(了解)

itertolls模块
combinations(序列，组合的数量)

组合案例

import itertools

mylist = list(itertools.combinations([1,2,3,4,5],3))
print(mylist)
"""
m    n
5    5   1
5    4   5
5    3   10
5    2   10

n！/（m!*(n-m)!）

18.03_Python语言基础(破解密码)(练习)

破解数字和字母组成的六位数的密码

生成6为数字密码

import itertools

list02 = itertools.product("012345", repeat=6)
list03 = list(list02)
# print((list03))
count = 0
str = ""
for l in list03:
    # print(l)
    count += 1
    str = "".join(l)
    print(str)
print(count)
print(str)
print(type(str))

生成字母和数字组成密码

# 获取六位字符
# 6789qweryuiopasdfghjklzxcvbnmqwerqQWERTYUIOPASDFGHJKLZXCVBNM
password = list(itertools.product("012345", repeat=6))
print(type(password))
# 定义密码字符变量
password_str = ""
# 开始破解
for i in password:
    password_str = "".join(i)
    # 如果找到则破解完成
    if password_str == "543210":
        break
print(password_str)

18.04_Python语言基础(正则表达式的概述)(重点)

开发中会有大量的字符串的处理，字符串的格式化的校验
- 场景：
  - 判断一个字符串否是手机号
文件中，查找以qianfeng开头的语句
定义：
- 正则表达式： regex re
python 内置模块 re —->正则表达式

18.05_Python语言基础(re模块的基本操作)(重点)

Python中内置re模块
在python中需要通过对正则表达式对字符串进行匹配，需要使用re模块

re模块的使用案例：

#
#导入re模块
# import re
#使用match方法进行匹配
“””
match 格式：
match(正则表达式（Match），需要匹配的字符串(object))

"""
# reslut = re.match(正则表达式，需要匹配的字符串)
#提取数据  group（）函数
# reslut.group()

说明：
re.match()用来进行正则表达式匹配检查方法，

如果字符串匹配正则，match方法返回的是匹配的对象（MAtch,object）

否则返回None(注意不是”“)

#
import re
reslut = re.match(“qianfeng”,”qianfeng.com”)
reslut1 = re.match(“haha”,”qianfeng.com”)
print(reslut.group())
print(reslut1)

18.06_Python语言基础(表示字符)(重点)

正则表达式的单个字符匹配

字符      功能
.        匹配任意1个字符（除\n）
[]       匹配[]中列举的字符
\d       匹配数字（0~9）
\D       匹配非数字，即不是数字
\s       匹配空白   空格  tab
\S       匹配非空白
\w       匹配单词字符，a~z A~Z 0~9 _
\W       匹配非单词字符

正则表达式的单个字符匹配案例：

#
import re

ret = re.match(".","a")
print(ret.group())

ret = re.match(".","M")
print(ret.group())

ret = re.match(".","1.0")
print(ret.group())

#如果hello的首字母小写，那么正在表达式的匹配需要小写吗？
ret = re.match("h","hello python")
print(ret.group())
ret = re.match("H","Hello python")
print(ret.group())

ret = re.match("[hH]","hello python")
print(ret.group())

ret = re.match("[hH]","Hello python")
print(ret.group())

#匹配0~9的数字
ret = re.match("[0123456789]","7hello python")
print(ret.group())
ret = re.match("[0-9]","7hello python")
print(ret.group())
ret = re.match("\d","5hello python")
print(ret.group())

ret = re.match("嫦娥1号","嫦娥1号发射成功")
print(ret.group())
ret = re.match("嫦娥2号","嫦娥2号发射成功")
print(ret.group())
ret = re.match("嫦娥3号","嫦娥3号发射成功")
print(ret.group())

ret = re.match("嫦娥\d号","嫦娥1号发射成功")
print(ret.group())
ret = re.match("嫦娥\d号","嫦娥2号发射成功")
print(ret.group())
ret = re.match("嫦娥\d号","嫦娥3号发射成功")
print(ret.group())

18.07_Python语言基础(转义字符和原始字符)(重点)

转义字符和原始字符案例：

import re
mm = r"c:\a\b\c"
print(mm)
mm = "c:\\a\\b\\c"
print(mm) 

reslut = re.match("c:\\\\",mm).group()
print(reslut)#c:\

reslut1 = re.match("c:\\\\a",mm).group()
print(reslut1)#c:\a

reslut = re.match(r"c:\\", mm).group()
print(reslut)  

reslut1 = re.match("c:\\\\a", mm).group()
print(reslut1)  

"""
python中字符串前面加上r表示原生字符串
”\“:转义字符
"""
ret = re.match("c:\\\\a", mm).group()   
print(ret)

18.08_Python语言基础(表示数量)(重点)

表示数量

字符        功能
*      表示匹配前一个字符出现0次或者无限次，即可有可无
+      表示匹配前一个字符出现1次或者无限次，即至少一次
？     表示匹配前一个字符出现1次或则0次,即，要么一次，要么没有

{m}    表示匹配前一个字符出现m次
{m,}   表示前一个字符至少出现m次
{m,n}   表示匹配字符出现从m到n次

案例：
需求：一个字符串第一个字母为大写字符，后面都是小写并且这些小写字母可有可无

表示数量案例：

import re
ret = re.match("[A-Z][a-z]*","Mm").group()
print(ret)
ret1 = re.match("[A-Z][a-z]*","Aabcdef").group()
print(ret1)

"""
匹配变量名是否有效
"""

ret2 = re.match("[a-zA-Z_]+[\w_]*","name1").group()
print(ret2)


ret3 = re.match("[a-zA-Z_]+[\w]*","m_name").group()
print(ret3)

"""
案例：
匹配0~99之间的数字
"""
ret4 = re.match("[1-9][\d]*","5").group()
print(ret4)

18.09_Python语言基础(表示边界)(重点)

#
字符功能
^ 匹配字符串的开头
$ 匹配字符串的结尾
\b 表示匹配一个单词的边界

匹配@XXX.com邮箱地址

#
result = re.match(“[\w]{4,20}@126.com”, “[email protected]”)
print(result.group())

result = re.match("[\w]{4,20}@126\.com$", "[email protected]")
print(result.group())

result = re.match("[\w]{4,20}@126\.com$", "[email protected]")
print(result.group())


#\b--匹配单词--ver
ret2 = re.match(r".*\bver\b","ho ver abc").group()
print(ret2)

# 报错
# ret3 = re.match(r".*\bver\b", "ho verabc").group()
# print(ret3)

# 报错
ret4 = re.match(r".*\bver\b", "hover abc").group()
print(ret4)

18.10_Python语言基础(匹配分组)(重点)

#
字符功能
| 匹配左右任意一个表达式
(ab) 将括号中字符作为分组
\num 引用分组num匹配到字符串

匹配分组案例

import re
# | 连接表达式
#需求匹配0~100之间的数字
result = re.match("100|[0-9]?\d", "90").group()
print(result)
result = re.match("100|[0-9]?\d", "100").group()
print(result)
result = re.match("100|[0-9]?\d$", "100").group()
print(result)
result = re.match("100|[0-9]?\d$", "110").group()
print(result)

匹配邮箱案例：

#案例：匹配163 /  126 / qq  邮箱之间的数字
#()
result = re.match("\w{6,20}@(hotmail|126|163|qq)\.com", "[email protected]").group()
print(result)

result = re.match("[\w\d]{6,20}@(hotmail|126|163|qq)\.com", "[email protected]").group()
print(result)

匹配html标签

# haha11_#$%^
“””

<>

“””
result = re.match(“<[a-zA-Z]>.

18.11_Python语言基础(re模块的高级用法)(了解)

字符串的切割

#
import re
str01 = “life is short and i use Python!”
# 字符串的切割
result = re.split(“\s*”, str01)
print(result)
result = re.split(” *”, str01)
print(result)
result = re.split(” +”, str01)
print(result)

#
#findall()
“””
格式：
findall(pattern，String,flags=0)

pattern:匹配的正则表达式
string：需要匹配的字符串

功能findall：查找所有元素得到一个列表

findall使用案例：

str01 = "life is short and i use Python! life life"

result = re.findall("life", str01)
print(result)

字符串的替换和修改

sub(pattern,rep1,string,count = 0)
subn(pattern,rep1,string,count = 0)
pattern:正则表达式
rep1：指定用来替换的字符串
string：目标字符串
count：最多替换的次数

功能：
在目标字符串中以正则的方式匹配字符串，
匹配完成后在替换成指定的字符串，可以指定替换的次数，如果不写表示替换全部

替换内容案例：

#
str1 = “life is short and i use Python!”
ret1 = re.sub(r”(i)”, “we”, str1)
print(ret1)

# 显示替换次数
ret2 = re.subn(r"(i)", "oo", str1)
print(ret2)

sub返回的是一个被替换的字符串
subn返回的是一个元祖，第一个元素是一个被替换的字符串，
第二个元素被替换的次数

18.12_Python语言基础(re模块运行原理)(掌握)

re模块做两个事
- 1.编译正则：如果正则本身不合法，报错
- 2.用编译后的正则表达式去匹配对象

compile(pattern,flags=0)

#编译正则
pat = r"\w{4,20}@(126|163|qq)\.com"
ret3 = re.compile(pat)
print(ret3.match("XXXXXX"))

re对象的调用
re.match(pattern,string,flags= 0)
ret3.match(string)

compile使用案例：

# compile(pattern,flags=0)

result = re.match("\w{4,20}@(126|163|qq)\.com", "[email protected]").group()
print(result)
print("*" * 20)
pat = r"\w{4,20}@(126|163|qq)\.com"
ret03 = re.compile(pat)
result = ret03.match("[email protected]")
print(result)

search使用案例：

result = ret3.search("[email protected]")
print(result)

result = ret3.findall("[email protected]")
print(result)

result = ret3.finditer("[email protected]")
print(result)