一、
运行selenium自动化爬取内容
安装Chrome driver 需要权限
http://blog.csdn.net/u012359618/article/details/52556127
二、Scrapy框架
安装scrapy
三、Python3 默认utf-8
四、For只能用于容器
五、Lambda简化代码结构
f( lambda x:x+100,100)
六、list 数组
list=[1,2,3]
for I in list:
print (i)
用range模拟for
Range(x)à[0,x-1]
Range(x,y)__>[x,y-1]
Range(x,y,z)à[x,x+z,…<y-1]
For I in range(len(li))
负数索引提高代码效率
List[-1]
For I in range(3,-1,-1)
Print(i)
申明:
List=[]
List.append(1)
按元素添加数组
Li=[1,2]
Li2=[3,4,5]
li.append(li2)
[1, 2, [3, 4]]
用extend,li.extend(li2)
[1, 2, [3, 4], 3, 4]
删除
Li.pop()删除最后一个元素
Li.pop(2)删除指定元素
排序
必须先排序再输出
list.sort()
print (list)
利用lambda帮助排序
七、Set
不重复
八、字典
Dictionary
For k in di:
Print(di[k])
For k , v in di.items():
Print(k,v)
九、切片
数组切片
数组
字符串是一个特殊的数组
#加字符串
li=list(str)
li[0]='x'
str=''.join(li)
print(str)
str='-'.join(li)
print(str)
#切片
s='asd,sdd,dsf'
p1,p2,p3=s.split(',')
print(p1,p2,p3)
十、object
用type 查看对象类型
用dir查看属性和方法
Print(dir(list))
申明成员函数的时候,第一个参数一定是self
鸭子类型:Dark type
十一、 读取文件两个方法,一般用with
f=open('t_sales_sum.csv','r')
#print(f.readline())
for linein f.readlines():
print(line.strip())
withopen('t_sales_sum.csv') as f:
for line in f.readlines():
print(line)
上级的文件一个个读,read(start,offset,size)
十二、 多线程
多线程重复
有多少cpu启多少线程
十三、 错误和异常处理