切片
切片(slice)的功能类似于R语言中的取数或者访问数据对象元素,但R中对象都是向量、矩阵数据框,在Py里面我们切片的作用对象是list、tuple或者dict等数据对象类型。假设一个list如下:
L=['Durant','Curry','Green','James','Erving']
如果我们想取用前3个元素,可以通过list的索引来做,但一旦元素个数过多,通过索引访问的方法就行不通了。当然我们也可以通过写for循环来遍历对象的每个元素。但通常这些方法比起切片来都过于繁琐:
>>> L=[0:3] ['Durant','Curry','Green']
L[0:3]表示从索引0开始取,到索引3为止,但不包括索引3 的元素。如果第一个索引是0,还可以简写为:
>>> L=[:3] ['Durant','Curry','Green']
当然和之前一样,我们也可以倒着访问list对象:
>>> L=[-2:0] ['James','Erving']
切片除了可以作用于list、tuple等对象类型,还可以对字符串等进行切片操作,在字符串中,切片的作用类似于一些字符处理函数,这里就不举例说明了。这样一来,有了切片操作以后,就无需去写循环语句了。
迭代
如果我们通过for循环来遍历一个list或者tuple对象,这种遍历过程就可以称之为迭代。只要for循环可以作用的对象类型,我们都可以对其进行迭代操作,如list、tuple或者dict,这些都可以称作可迭代对象。如何判断一个对象是否可迭代?我们可以通过导入collections模块中的Iterable类型进行判断:
>>> from collections import Iterable >>> isinstance('abc',Iterable) True >>> isinstance([1,2,3],Iterable) True >>> isinstance(123,Iterable) False
任何可迭代对象都可作用于for循环,包括我们自定义的数据对象,只要可以作用于for循环,都是可迭代对象。
列表生成式
列表生成式(list comprehensions),是Py内置的 一种简单而又非常强大的创建列表的生成式。比方说我们可以用list(range(1:11))来生成1:11的数字列表:
>>> list(range(1:11)) [1,2,3,4,5,6,7,8,9,10]
但如果我们要生成[1x1,2x2,3x3...,10x10]这样的列表又该如何写命令呢?一种方法就是写循环:
>>> L =[] >>> for x in range(1:11): ... L.append(x*x) ... >>> L [1,4,9,16,25,36,49,64,81,100]
但正如我们前面所说,循环太繁琐,能不用尽量不用,比竟Py的核心要义是简洁,能一行代码完成的事情绝对不用五行。上述循环用列表生成式语句一行即可搞定:
>>> [x * x for x in range(1:11)] [1,4,9,16,25,36,49,64,81,100]
for循环后面还可加上if条件判断进行结果筛选:
>>> [x * x for x in range(1:11) if x%2==0] [4,16,36,64,100]
生成器
列表生成器虽然方便,但占用内存比较大,很多时候我们都不需要完整list进行分析,因而Py中还有一种边循环边计算的机制,称之为生成器:Generator。创建另一个生成器的方法有很多,但主要还是通过如下两种方法:(1)直接创建法。(2)通过修改Py函数的print命令为yield。
直接创建法很简单,只需将列表生成式中的[ ]符号改成()即可:
>>> g = (x * x for x in range(10)) >>> g <generator object <genexpr> at 0x34031fh479>
输出g的结果表明对象g已经是一个generator了。我们可以通过for循环来访问和调用generator的每一个元素
>>> g= (x * x for x in range(10)) >>> for n in g: ... print(n) ...
另一种创建生成器的方式为修改Py函数中print命令为yield命令即可。例如我们创建一个斐波那契数列表,但列表生成器无法直接生成,编写函数则较为方便:
def fibonacci(max): i, a, b = 0, 0, 1 while i < max: print(b) a, b = b, a + b i = i + 1 return 'done'
我们修改上面函数定义中的print命令:
def fibonacci(max): i, a, b = 0, 0, 1 while i < max: yield b a, b = b, a + b i = i + 1 return 'done'
这样一修改,fibonacci就不再是一个普通的函数了,而是一个generator了:
>>> f = fibonacci(6) >>> f <generator object fibonacci at 0x104feaaa0>
迭代器
由前述我们知道,可以直接作用于for循环的对象我们称之为可迭代对象:Iterable。使用collections模块中的isinstance函数可以判断一个对象是否可迭代。而生成器不但可以作用于for循环,还可以通过next()函数不断返回下一个值,这样的对象我们称之为迭代器,Iterator。
生成器都是迭代器,但list、tuple、dict等对象虽然是可迭代的(Iterable),但却并不是迭代器(Iterator),如要将其变成迭代器,我们可以使用iter函数。我们可以写一个关于杨辉三角的生成器(迭代器):
def triangles():
L = [1]
while True:
yield L
L.append(0)
L = [L[i-1] + L[i] for i in range(len(L))]
n = 0
for m in triangles():
print(m)
n = n + 1
if n == 10:
break
[1]
[1, 1]
[1, 2, 1]
[1, 3, 3, 1]
[1, 4, 6, 4. 1]
[1, 5, 10, 10, 5, 1]
[1, 6, 15, 20, 15, 6, 1]
[1, 7, 21, 35, 35, 21, 7, 1]
[1, 8, 28, 56, 70, 56, 28, 8, 1]
[1, 9, 36, 84, 126, 126, 84, 36, 9, 1]