一、文件的基本操作
bytes就当成二进制看。
1.什么是文件:
文件是操作系统为应用程序或者用户提供的一种操作硬盘的虚拟单位
强调:
文件是操作系统提供的虚拟单位
应用程序或者用户对文件的读写操作其实都是向操作系统发送指令
2.为什么用文件:
文件对应的硬盘空间,如果需要考虑永久保存数据就必须使用文件
3.如何用文件:
路径问题
绝对路径:总是从根文件中开始
win C:\a\b\c\d.txt
linux /a/b/c/d.txt
相对路径:相对于当前执行文件所在的文件夹
/a/b/c.txt
二、文件操作的方法:读写相关的方法
Ⅰ.打开文件
f=open(r'D:\脱产\day09\a.txt,mode='r',encoding='utf-8') # 路径前面加r是因为反斜杠会有特殊含义,路径前面加r,后面的路径就为纯文本模式了。
print(f)
Ⅱ.读/写文件
data=f.read()
print(data)
f.write()
Ⅲ.关闭文件
f.close() #向操作系统发送指令,令操作系统关闭打开的文件,回收操作系统资源。读写内容应该在文件关闭之前进行操作
print(f)
上下文管理的方法:
with open('a.txt',mode='rt',encoding='utf-8') as f:
data=f.read()
print(data)
三、文件的打开模式:rwa、bt #尤其重要!
1.基本介绍
控制文件读写操作的模式
r (默认)
w
a
控制文件读写内容的模式(不能单独使用,必须与r,w,a连用)
t(默认)
b
2.详细介绍
控制文件读写操作的模式
r (默认):只读模式,以该模式打开文件,当文件不存在时,会报错;当文件存在时文件指针在文件开头
with open('a.txt',mode='rt',encoding='utf-8') as f:
w:只写模式,以该模式打开文件,当文件不存在时,创建一个空文档;当文件存在时,清空文件。文件指针在文件开头。(创建空文档,(如果有)旧文档就会覆盖)
with open('b.txt',mode='wt',encoding='utf-8') as f:
print(f.readable())
print(f.writable())
# 在打开文件不关闭的情况下,连续的写入,新写的内容总是在老内容之后;关闭后在打开就会覆盖上次。
f.write('你瞅啥\n')
f.write('瞅你咋地\n')
f.write('吧啦啦啦...\n')
a:只追加写模式,以该模式打开文件,当文件不存在时,创建一个空文档;当文件存在时,不清空文件。文件指针跳到文件末尾。
with open('c.txt',mode='at',encoding='utf-8') as f:
f.write('hello\n')
f.write('good boy\n')
f.writelines(['a','1'])
控制文件读写内容的模式(不能单独使用,必须与r,w,a连用)
t(默认):无论读写都是以字符为单位的,只能操作文本文件,必须指定encoding参数。
b:无论读写都是以bytes为单位的,可以操作所有文件,一定不能指定encoding参数。
with open('a.txt',mode='rb') as f:
data=f.read()
print(data,type(data))
print(data.decode('utf-8'))
with open('01.mp4',mode='rb') as f:
data=f.read()
print(data,type(data))
表格:文件模式
模式 | 描述 |
---|---|
r | 以只读方式打开文件。文件的指针放在文件的开头,这是默认模式 |
rb | 以二进制格式打开一个文件用于只读。文件的指针放在文件的开头,这是默认模式 |
r+ | 打开一个文件用于读写。文件的指针放在文件的开头 |
rb+ | 以二进制格式打开一个文件用于读写。文件的指针放在文件的开头 |
w | 打开一个文件只用于写入。文件已存在则覆盖,不存在则创建新文件 |
wb | 以二进制格式打开一个文件只用于写入。文件已存在则覆盖,不存在则创建新文件 |
w+ | 打开一个文件用于读写。文件已存在则覆盖,不存在则创建新文件 |
wb+ | 以二进制格式打开一个文件用于读写。文件已存在则覆盖,不存在则创建新文件 |
a | 打开一个文件用于追加。文件已存在,文件指针就会放在文件的末尾,不存在则创建新文件 |
ab | 以二进制格式打开一个文件用于追加。文件已存在,文件指针就会放在文件的末尾,不存在则创建新文件 |
a+ | 打开一个文件用于读写。文件已存在,文件指针就会放在文件的末尾,不存在则创建新文件 |
ab+ | 以二进制格式打开一个文件用于追加。文件已存在,文件指针就会放在文件的末尾,不存在则创建新文件 |
print(f.readable())
print(f.writable())
print(f.readline())
print(f.readline(),end=' ')
for line in f:
print(line)
print(f.readlines()) #存成列表,此处可以测试一下
拷贝文件小程序
with open('01.mp4',mode='rb',) as read_f,\
open(r'D:\1111.mp4',mode='wb') as write_f:
data=read_f.read()
write_f.write(data)
了解
+:不能单独使用,必须与raw连用,r+,w+,a+
with open('c.txt',mode='at',encoding='utf-8') as f:
print(f.readable())
print(f.writable())
import os # 导入os模块
os.remove(file_name) # file_name为需要删除的文件名,如文件不在当前目录下,则文件名需要使用绝对路径
4、文件修改的两种方式 #尤其重要!
方式一:
1.以读的方式打开源文件
2.将文件内容一次性全读入内存,在内存中完成修改
3.以写的方式打开源文件,然后将修改后的文件一次性写入源文件。
总结:
优点:在文件修改过程中只存在一份数据
缺点:浪费内存
with open('b.txt',mode='rt',encoding='utf-8') as f1:
msg=f1.read()
new_msg=msg.replace('alex','kevin')
with open('b.txt',mode='wt',encoding='utf-8') as f2:
f2.write(new_msg)
方式二:
1.以读的方式打开源文件,以写的方式打开一个临时文件
2.读取源文件的一行内容到内存中,将修改的结果写入临时文件,循环往复直到改
3.删除源文件,将临时文件重命名为源文件名。
优点:同一时间在内存中只有文件的一行内容,更节省内存
缺点:在文件修改过程中硬盘存在两份数据
import os
with open('b.txt',mode='rt',encoding='utf-8') as read_f,\
open('.b.txt.swap',mode='wt',encoding='utf-8') as write_f:
for line in read_f:
write_f.write(line.replace('kevin','alex'))
os.remove('b.txt')
os.rename('.b.txt.swap','b.txt')