目录
课程目标:
1、熟练掌握python语法和常用数据结构;
2、熟练掌握数据分析相关库的运用;
3、对数据分析相关流程和常用方法比较了解;
4、能够完成数据分析相关工作。
Python数据分析基础:
1、Python使用入门:Python3安装、基本操作使用和语法;
2、Python基本运用:数据类型、数据结构和控制语句(if、else和循环语句等);
3、Python进阶运用:函数编写、json结构数据解析、字符串处理和高级函数的运用;
4、Python数据分析常用库:介绍数据分析常用库,Numpy,pandas,Matplotlip以及scikit-learn
如何进一步提高python编程能力?
1、学好python语法,即掌握非库功能,练好内功;
2、学好python领域,数据分析、web开发、人工智能、找准了深入学;
3、学好计算机专业知识,构建“系统”是本领,需要专业计算机知识。
计算机专业知识:数据结构、算法、计算机网络、组成原理、操作系统、网络安全、体系结构、软件工程.....
第一章 Python数据分析基础
1、python关键字查看
import keyword
print(keyword.kwlist)
#>>> ['False', 'None', 'True', 'and', 'as', 'assert', 'async', 'await', 'break', 'class', 'continue', 'def', 'del', 'elif', 'else', 'except', 'finally', 'for', 'from', 'global', 'if', 'import', 'in', 'is', 'lambda', 'nonlocal', 'not', 'or', 'pass', 'raise', 'return', 'try', 'while', 'with', 'yield'] /n
在进行变量命名时,我们不能使用上面所列出来的关键字作为变量名称。
2、type()语法查看字符类型
a = 1
print(type(a))
# <class 'int'>
b = 5.0
print(type(b))
# <class 'float'>
c = 'student'
print(type(c))
# <class 'str'>
d = False
print(type(d))
# <class 'str'>
3、python中语法左开右闭
a = 'python'
print(a[:1]) # 取最后一位字母
print(a[0:3]) # 取第一位到第三位字母
4、None的介绍
a = None # None在python语法中表示空值的意思
print(a)
# >>>None
if a is None:
b = 4
else:
b = 5
print(b)
# >>> 4
5、数据结构之列表(序列类数据结构)
# 数据结构常用如下:
# 列表:是一种不同数据类型元素的有序集合
# 元组:元组是一种有序列表,但元组中的变量不能改变
# 集合:集合是一系列无序的、不重复的组合体
# 字典:存放无序的键/值(key/value)映射类型数据的容器
序列类数据结构:结构是按顺序排放的结构称为序列类数据结构。
语法(a表示列表) | 解释 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
索引函数 |
a.insert(a,'b') | 嵌入函数,a表示嵌入第几位函数,b表示嵌入函数的内容 |
a.remove('') | 移除元素函数 |
a.reverse() | 翻转列表 |
a.sort() | 对列表a进行排序,默认正序排序 |
max(a) | 计算列表最大值 |
min(a) | 计算列表最小值 |
len(a) | 计算列表的长度(如果列表为空,则返回0) |
a = [1,2] b = [3,4] a + b = [1,2,3,4] |
列表的拼接,两个列表相加合成一个列表 |
a * 3 | 将列表中的内容复制三次 |
6、数据结构之元组和集合(序列类数据结构)
元组:元组是一种有序列表,但元组中的变量不能改变
列表和元组的区别:
(1)列表为方括号形式[],元组为圆括号形式();
(2) 列表可以被修改,元组内的元素不可以被修改
(3)在python中,元组的使用频率没有列表的高
元组讲解 | |
语法(a_tuple表示元组) | 解释 |
a_tuple = () |
创建元组 |
a = tuple([1,2,3,4]) | 将列表转换为元组 |
a_tuple = [0] | 查看元组第一个元素 |
a_tuple = [0:3] | 查看元组前三位元素 |
a_tuple[::-1] | 反向索引元组 |
del a_tuple | 删除整个元组 |
a = (1,2) b = (3,4) a + b = (1,2,3,4) |
元组拼接 |
a * 3 | 将元组中的内容复制三次 |
集合讲解(里面不能由重复元素) | |
语法(a_set、b_set表示集合) | 解释 |
a_set = {1,2,3,4} | 创建集合 |
a_set.add(5) | 增加元素 |
a_set.remove(1) | 删除集合里的指定元素 |
{1,2}.issubset(a_set) | 判断一个集合是否在指定的集合中 |
b_set = set([1,2,3,4,4,5]) | 将列表转换为集合(默认删除重复值4) |
type() | 查看集合类型 |
a_set - b_set a_set.difference(b_set) |
差集 |
a_set | b_set a_set.union(b_set) |
并集 |
a_set & b_set a_set.intersection(b_set) |
交集 |
a_set < b_set | 判断子集 |
a_set ^ b_set a_set.symmetric_difference(b_set) |
两个集合的并集减去交集 |
7、数据结构之字典(无序类型数据结构)
语法(dict_1表示字典) | 解释 |
dict_1 = {'name': 'Tom', 'age': '18' 'id': '1101'} | 创建字典 |
dict_1['city'] = 'guangzhou' | 增加键值对 |
del dict_a['city'] | 删除键值对 |
dict_1.pop('city'] | 删除键值对 |
dict_1 | 查看字典 |
dict_1.get('32',1) | 判断32这个键是否在字典中,如果没有返回1 |
dict_1['name'] | 通过键来查看字典中的值 |
len(dict_1) | 查看字典长度 |
键 in 字典 | 判断键是否在字典中 |
dict_1.keys() | 返回字典中的所有键 |
dict_1.values() | 返回字典中的所有值 |
dict_1.items() | 返回字典中的所有键值对 |
for key in dict_1.keys(): print(dict_1[key]) |
通过字典中的键打印所有相应的值 |
dict_1.clear() | 清空字典中的所有内容 |