“实践是检验真理的唯一标准。”
“复现是学习生信的最好办法。”
DOI: 10.1016/j.cell.2020.05.032
这篇2020年发表在cell
上关于新冠的组学文章里面有大量的生信内容。今天带大家复现其中的一个分析:随机森林分类模型的构建以及对重要变量的选择及其简约模型
。
随机森林简介
数据准备
数据预处理
构建随机森林模型
训练集测试
训练集分类可视化(复现图2D)
绘制训练集ROC
使用测试集评估
训练集分类可视化
测试集ROC
十折交叉验证
特征选取(复现2A)
简约随机森林分类模型的构建
训练集测试及分类可视化
测试集测试及分类可视化
代码数据获取及微信答疑群
往期内容
本文内容干货较多(12000字),所以尝试一下付费。文末有微信交流群,交流科研相关问题。