嗯哈,小伙伴们, 昨天看爬虫代码的时候,遇到了个 关键字,给我整蒙了,这是个啥,怎么能这样乱来?
先贴一下我昨天看到了什么:
def parse_one_page(html):
pattern = re.compile('')
items = re.findall(pattern,html)
for item in items:
yield{
'index': item[0],
'image': item[1],
'title': item[2].strip(),
'actor': item[3].strip()[3:] if len(item[3])>3 else '',
'time': item[4].strip()[5:] if len(item[4])>5 else '',
'score': item[5].strip() + item[6].strip()
}
看到没, 第五行,对,就是那个东西 yield !!!!!!!!!!
yield yield yield yield yield yield yield yield yield yield yield yield yield yield
thiS IS WHAT ????
嗯,老规矩,先说直觉上 ,yield是个什么、
yield 就是个 return, 但是他和return又有所不同。
如果我们在一个函数中遇到了 return,我们就直接结束了那个函数调用,得到该返回值。
但 yield 确不一样,如果我们用 yield作为替代 return作为返回关键字的存在时, 它会一次一次的进行返回。
没错!!!!!!!
对, 就像挤牙膏,你和他要一次,他就给你一点。
def getnum():
for i in range(3):
yield i
for num in getnum():
print(num)
getnum的返回值i 是有 yield指定的, 由上面我们知道, 我们想要获得 getnum()函数所有的返回值,得耐心一些慢慢挤牙膏,一步一步来。
getnum()函数一共会返回三次,分别是 0 1 2,ok
在下面的for 代码中,我们的数据来源是getnum()函数,每遍历这个函数一次,就相当于 我们从getnum()要了一次由yield指定的返回值,所以下面的for 输出为 0 1 2.
注意:每次从getnum()中得到yield指定输出时, 函数的执行顺序总是 从前一次的yield 终止处开始,达到下一次yield输出为止。
就像我们第一次调用getnum()函数,一开始是在第二行,然后在第三行yield指定处返回,此时函数终止。
第二次再需要getnum()的值时,由于上一次 第三行的for执行完毕了,此时又从第二行开始执行,然后又执行完yield 输出为止。
ok。。。。。。。。这便是只觉了。
正统的解法 应该是在告诉你 什么是生成器, 什么是迭代器之类的, 我认为看那些会比较好,这篇毕竟只是只觉得内容,入门会用而已。~~~~
88