Python学习笔记三:字符串

字符串基本特点

很多人初学编程时,总是担心自己数学不行,潜意识里认为数学好才能编程。实际上,大多数程序员大及哦啊的哦啊做多的是“字符串”而不是“数字”。因为,编程是用来解决现实问题的,因此逻辑思维的重要性远远超过数学能力。

字符串的本质是:字符序列。Python 的字符串时不可变的,我们无法对原字符串做任何修改,但,可以将字符串的一部分复制到新创建的字符串,达到“看起来修改”的效果。

Python 不支持单字符类型,单字符也是作为一个字符串使用的。

字符串的编码

Python 3 直接支持 Unicode ,可以表示世界上任何书面语言的字符。Python 3 的字符默认就是 16 问Unicode 编码,ASCII 码是 Unicode 编码的子集

使用内置函数 ord()可以把字符转换成 对应的 Unicode 码;
使用内置函数char()可以把十进制数字转换成对应的字符。

        >>> ord('A')
        65
        >>> ord('高')
        39640
        >>> chr(66)
        'B'
        >>> ord('淇')
        28103

引号创建字符串

我们可以通过单引号或双引号创建字符串。例如:a=’abc’; b=”sxt”
使用两种引号的好处是可以创建本身就包含引号的字符串,而不用使用转义字符。例如:

       >>> a = "I'm a teacher!"
        >>> print(a)
        I'm a teacher!
        >>> b = 'my_name is "TOM"'
        >>> print(b)
        my_name is "TOM"

连续三个单引号或三个双引号,可以帮助我们创建多行字符串。例如:

>>> resume = ''' name="gaoqi"
 company="sxt"   age=18
lover="Tom"'''
>>> print(resume)
name="gaoqi"
company="sxt"   age=18
lover="Tom"

空字符串 和 len()函数

Python 允许空字符串的存在,不包含任何字符且长度为0。例如:

>>> c = ''
>>> len(c)
0

len()用于计算字符串含有多少字符。例如:

>>> d = 'abc尚学堂'
>>> len(d)
    6

转义字符

我们可以使用 “\+特殊字符”,实现某些难以用字符表示的效果。比如:换行等。常见的转义字符有这些:

在这里插入图片描述

【操作】测试转义字符是使用

        >>> a = 'I\nlove\nU'
        >>> a
        'I\nlove\nU'
        >>> print(a)
        I
        love
        U
        >>> print('aaabb\
        cccddd')
        aaabbcccddd

字符串拼接

  1. 可以使用 + 将多个字符串拼接起来。例如:‘aa’+‘bb’ ===>‘aabb’。
    (1)如果 + 两边都是字符串,则拼接。
    (2)如果 + 两边都是数字,则加法运算。
    (3)如果 + 两边类型不同,则抛出异常。

  2. 可以将多个字面字符直接放到一起实现拼接。例如 :’aa’’bb’==>’aabb’

【操作】字符串的拼接操作

        >>> a = 'sxt'+'gaoqi'        
        >>> a
        'sxtgaoqi'
        >>> b = 'sxt''gaoqi'
        >>> b
        'sxtgaoqi'

字符串复制

使用 * 可以实现字符串复制。
【操作】字符串复制操作

        >>> a = 'Sxt'*3        
        >>> a
        'SxtSxtSxt'

不换行打印

我们前面调用print时,会自动打印一个换行符。有时,我们不想换行,不想自动添加换行符。我们可以自己通过 参数 end = “任意字符串”。实现末尾添加任何内容:

建立源文件 mypy_06.py:

        print("sxt",end=' ')        
        print("sxt",end='##')
        print("sxt")

运行结果:

sxt sxt##sxt

从控制台读取字符串

我们可以使用 input()从控制台读取键盘输入的内容。

        >>> myname = input("请输入名字:")        
        请输入名字:高淇
        >>> myname
        '高淇'

str()实现数字转型字符串

str()可以帮助我们将其他数据类型出转换为 字符串。例如:

str(5.20) > ‘5.20’ str(3.14e2)>’314.0’ str(True) ==> ‘True’

当我们调用 print()函数时,解释器自动调用了 str()函数将非字符串的对象转成了字符串。我们在面向对象章节中详细讲解这部分内容。

使用[] 提取字符

字符串的本质就是字符序列,我们可以通过在字符串后面添加 [],在[]里面指定偏移量,可以提取该位置的单个字符。

正向搜索:

最左侧第一个自字符,偏移量是 0,第二个偏移量是1,以此类推。直到 len(str)-1为止。

反向搜索:

最右侧第一个字符,偏移量是 -1,倒数第二个偏移量是-2,以此类推,直到 -len(str)为止。

【操作】使用[] 提取字符串中的字符

        >>> a = 'abcdefghijklmnopqrstuvwxyz'        
        >>> a
        'abcdefghijklmnopqrstuvwxyz'
        >>> a[0]
        'a'
        >>> a[3]
        'd'
        >>> a[26-1]
        'z'
        >>> a[-1]
        'z'
        >>> a[-26]
        'a'
        >>> a[-30]
        Traceback (most recent call last):
          File "<pyshell#91>", line 1, in <module>
            a[-30]
        IndexError: string index out of range

replace()实现字符串替换

字符串是“不可改变”的,我们通过【】可以获取字符串指定位置的字符。但是我们不能高边字符串。我们尝试改变字符串中某个字符,发现报错了:

        >>> a = 'abcdefghijklmnopqrstuvwxyz'        
        >>> a
        'abcdefghijklmnopqrstuvwxyz'
        >>> a[3]='高'
        Traceback (most recent call last):
          File "<pyshell#94>", line 1, in <module>
            a[3]='高'
        TypeError: 'str' object does not support item assignment

字符串不可改变。但是,我们确实有时候需要替换某些字符。这时,只能通过创建新的字符串来实现。

        >>> a = 'abcdefghijklmnopqrstuvwxyz'        
        >>> a
        'abcdefghijklmnopqrstuvwxyz'
        >>> a = a.replace('c','高')
        'ab高defghijklmnopqrstuvwxyz'

整个过程中,实际上我们是创建了新的字符串对象,并指向了变量a ,而不是修改了以前的字符串。内存图如下:

在这里插入图片描述

字符串切片slice 操作

切片slice 操作可以让我们快速的提取子字符串。标准格式为:

[起始偏移量start:终止偏移量end:步长step]

典型操作(三个量为正数的情况下)如下:

在这里插入图片描述

其他操作(三个量为负数)的情况:
在这里插入图片描述

切片操作时,起始偏移量和终止偏移量不在【0,字符串长度-1】这个范围,也不会报错。起始偏移量小于0则会当做0,终止偏移量大于 “长度-1”会被当成 -1。例如;

>>> "abcdefg"[3:50]    
'defg'

我们发现正常输出了结果 ,没有报错。

【操作】

  1. 将”to be or not to be”字符串倒序输出

  2. 将”sxtsxtsxtsxtsxt”字符串中所有的s输出

split()分割和join()合并

split()可以基于指定分隔符将字符串分隔成多个子字符串(存储到列表中)。如果不指定分隔符。则默认使用空白字符(换行符/空格/制表符)。示例代码如下:

        >>> a = "to be or not to be"        
        >>> a.split()
        ['to', 'be', 'or', 'not', 'to', 'be']
        >>> a.split('be')
        ['to ', ' or not to ', '']

join()的作用和 split()作用正好相反,用于将一系列子字符串拼接起来。示例代码如下:

        >>> a = ['sxt','sxt100','sxt200']        
        >>> '*'.join(a)
        'sxt*sxt100*sxt200'

拼接字符串要点:
使用字符串拼接符 + ,会生成新的字符串对象,因此不推荐使用 + 来拼接字符串,推荐使用join函数,因为 join 函数在拼接字符串之前会计算所有字符串的长度,然后注意拷贝,仅新建一次对象。

【操作】测试+ 拼接符 和 join(),不同的效率(mypy07.py

        import time        
          
        time01 = time.time()  #起始时刻
        a = ""
        for i in range(1000000):
            a += "sxt"
          
        time02 = time.time()   #终止时刻
          
        print("运算时间:"+str(time02-time01))
          
          
        time03 = time.time()   #起始时刻
        li = []
        for i in range(1000000):
            li.append("sxt")
          
        a = "".join(li)
          
        time04 = time.time()   #终止时刻
          
        print("运算时间:"+str(time04-time03))

字符串驻留机制和字符串比较

字符串驻留: 仅保存一份相同且不可变字符串的方法,不同的值被存放在字符串驻留池中。

Python 支持字符串驻留机制,对于符合标识规则的字符串(仅包含下划线(_)、字母和数字)会启用字符串驻留机制。

        >>> a = "abd_33"        
        >>> b = "abd_33"
        >>> a is b
        True
        >>> c = "dd#"
        >>> d = "dd#"
        >>> c is d
        False
        >>> str1 = "aa"
        >>> str2 = "bb"
        >>> str1+str2  is "aabb"
        False
        >>> str1+str2 == "aabb"
        True

字符串比较和同一性

我们可以直接使用==,!=对字符串进行比较,是否含有相同的字符。

我们使用 is not is ,判断两个对象是否同一个对象。比较的是对象的地址,即 id(obj1)是否和 id(obj2)相等。

成员操作符

in/not in 关键字,判断某个字符(子字符串)是否存在于字符串中。

字符串常用方法汇总

字符串有很多常用的方法,我们需要熟悉,我们通过表格将这些方法汇总起来,方便大家查阅。希望大家针对每个方法都做一次测试。

常用查找方法

我们以一段文本作为测试:
a=’’‘我是高淇,今年18岁了,我在北京尚学堂科技上班。我的儿子叫高洛希,他6岁了。我是一个编程教育的普及者,希望影响6000万学习编程的中国人。我儿子现在也开始学习编程,希望他18岁的时候可以超过我’’’

在这里插入图片描述

去除首尾信息

我们可以通过 strip()去除字符串首尾指定信息。通过 lstrip()去除字符串左边指定信息,rstrip()去除字符串右边指定信息。

【操作】去除字符串首尾信息

>>> "*s*x*t*".strip("*")        
 's*x*t'
>>> "*s*x*t*".lstrip("*")
 's*x*t*'
>>> "*s*x*t*".rstrip("*")
'*s*x*t'
>>> "  sxt  ".strip()
 'sxt'

大小写转换

编程中关于字符串大小写转换的情况,经常遇到。我们将相关方法汇总到这里。为了方便学习,先设定一个测试变量:

a = “gaoqi love programming, love SXT”

在这里插入图片描述

格式排版

center()、ljust()、rjust()这三个函数用于对字符串实现排版。

其他方法

  1. isalnum()是否为字母或数字
  2. isalpha()检测字符串是否只由字母组成(含汉字)。
  3. isdigit()检测字符串是否由数字组成。
  4. isspace()检测是否为空白符。
  5. isupper()是否为大写字母。
  6. islower()是否为小写字母。
>>> "sxt100".isalnum()        
True
>>> "sxt尚学堂".isalpha()
True
>>> "234.3".isdigit()
False
>>> "23423".isdigit()
True
>>> "aB".isupper()
False
>>> "A".isupper()
True
>>> "\t\n".isspace()
True

字符串的格式化

format()基本用法

Python 2.6开始,新增了一种格式化字符串的函数str.format(),他增强了字符串格式化的功能。

基本语法是通过 {} 和:来替代以前的 %

format 函数可以接受不限参数个数。位置可以不按顺序。

我们通过示例进行格式化的学习。

>>> a = "名字是:{0},年龄是:{1}"        
>>> a.format("高淇",18)
 '名字是:高淇,年龄是:18'
>>> a.format("高希希",6)
 '名字是:高希希,年龄是:6'
>>> b = "名字是:{0},年龄是{1}。{0}是个好小伙"
>>> b.format("高淇",18)
'名字是:高淇,年龄是18。高淇是个好小伙'
>>> c = "名字是{name},年龄是{age}"
>>> c.format(age=19,name='高淇')
'名字是高淇,年龄是19'

我们可以通过 {索引}/{参数名},直接映射参数值,实现对字符串的格式化,非常方便。

填充与对齐

填充常跟对齐一起使用

^、<、>分别是居中、左对齐、右对齐,后面带宽度
:号后面带填充的字符,只能是一个字符,不指定的话默认是用空格填充

>>> "{:*>8}".format("245")        
 '*****245'
>>> "我是{0},我喜欢数字{1:*^8}".format("高淇","666")
'我是高淇,我喜欢数字**666***'

数字格式化

浮点数通过 f ,整数通过 d 进行需要的格式化。案例如下:

>>> a = "我是{0},我的存款有{1:.2f}"        
>>> a.format("高淇",3888.234342)
 '我是高淇,我的存款有3888.23'

其他格式:

在这里插入图片描述

可变字符串

在Python 中,字符串属于不可变的对象,不支持原地修改,日过需要修改其中的值,智能创建新的字符串对象。但是,经常我们确实需要原地修改字符串,可以使用 io.StringIO 对象或者 array 模块。

>>> import io        
>>> s = "hello, sxt"
>>> sio = io.StringIO(s)
>>> sio
<_io.StringIO object at 0x02F462B0>
>>> sio.getvalue()
'hello, sxt'
>>> sio.seek(7)
7
>>> sio.write("g")
1
>>> sio.getvalue()
'hello, gxt'

猜你喜欢

转载自blog.csdn.net/weixin_44626569/article/details/89633129