个人觉得数据框合并最简单的莫过于join,一个小函数却有大作用。具体介绍:
DataFrame.join(other, on=None, how='left', lsuffix='', rsuffix='', sort=False)
other:一个DataFrame、Series(要有命名),或者DataFrame组成的list。
on:列名,包含列名的list或tuple,或矩阵样子的列
(如果是多列,必须有MultiIndex)。
跟上面的几种方法一样,用来指明依据哪一列进行合并。
如果没有赋值,则依据两个数据框的index合并。
how:合并方式, {‘left’, ‘right’, ‘outer’, ‘inner’},
默认 ‘left’调用函数的数据框。
lsuffix:字符串。用于左侧数据框的重复列。
把重复列重新命名,原来的列名+字符串。
【如果有重复列,必须添加这个参数。】
rsuffix:同上。右侧。
sort:布尔型,默认False。如果为True,将链接键(on的那列)按字母排序。
其实,在应用过程中,挺简单的。
只有index一致,直接用 df1.join(df2) 就OK了!