pip install missingno
import missingno as msno
无效矩阵的数据密集显示
msno.matrix(data, labels=True)
条形图,msno.bar
是列的无效的简单可视化:
msno.bar(data)
缺失性相关性热图
missingno
相关性热图措施无效的相关性:一个变量的存在或不存在如何强烈影响的另一个的存在:
msno.heatmap(data)
树状图
树形图使用层次聚类算法通过它们的无效性相关性(根据二进制距离测量)将变量彼此相加。在树的每个步骤,基于哪个组合最小化剩余簇的距离来分割变量。变量集越单调,它们的总距离越接近零,并且它们的平均距离(y轴)越接近零。
msno.dendrogram(data)