作者:Joseph Rickert
翻译:黄小伟,10年资深数据矿工。目前就职杭州有赞数据分析团队,欢迎加入!
2019年7月份,176个R新包收录于CRAN(6月份收录136个,环比增长29.4%),累计收录14,808个R包!由于CRAN会不定时进行R包增删,所以具体数量会随时间略有变化。
此次整理了十二个类别,分别为数据、数据科学、金融、基因组学、机器学习、数学、医学、统计学、时间序列、拓扑数据分析、工具和可视化。
以下是本期(总第32期)R新包的功能简介:
一. 数据
1. eia: 提供API接口,支持访问美国能源信息管理局(EIA)的数据.
2. litteR: 支持以一致和可复制的方式分析垃圾数据,包括:海滩垃圾、河岸垃圾、漂浮垃圾、海底垃圾等.
3. rSymbiota: 实现Symbiota门户的接口,允许用户查询包含植物、动物和真菌的自然历史集合.
二. 数据科学
1. bdpar: 提供一种工具,可轻松构建自定义数据流,以处理来自不同来源的大量信息.
2. modeLLtest: 支持进行Desmarais和Harden(2014)的交叉验证平均值(CVDM)测试和Desmarais和Harden(2012)的交叉验证中位数拟合(CVMF)测试.
三. 金融
1. lazytrade: 利用算法交易的思想,提供一套学习和实践数据科学的功能和方法.
2. RPEIF: 计算Zhang and Martin (2017)以及Chen and Martin (2018)提出的风险和绩效指标回报的影响函数时间序列.
四. 基因组学
1. MGDrivE: 提供一个利用基因驱动干预蚊子传播疾病控制的试验平台.
2. PACVr: 提供可视化完整质体基因组覆盖深度的功能,以及与圆形、四部分基因组结构和单个基因位置相关的反向重复区域的相等性.
五. 机器学习
1. forestRK: 提供计算随机森林中用于分类问题的常见分裂标准类型的函数,以及基于单个树或Forest-R.K进行预测的函数.
2. greenclust: 实现一种迭代折叠列联表的行的方法(一次两行),方法是选择组合生成具有最小卡方损失的新表的类别对,如Greenacre(1988)所述.
3. imgrec: 实现与谷歌图像识别系统VISION AI的接口.
4. mlr3: 为机器学习任务提供R6面向对象的编程构建块.
六. 数学
1. odin: 提供使用特定领域语言(DSL)生成常微分方程(ODE)系统并将其集成的函数.
2. pCODE: 包含Ramsay,J.O.、Hooker,G.、Campbell,D.和Cao,J.(2007)的参数级联方法的实现,用于估计缺少或完整观测的常微分方程模型.
七. 医学
1. MBNMAdose: 通过模拟不同的剂量反应函数,提供适合Bayesian剂量反应、基于模型的网络荟萃分析(MBNMA)的功能,该分析将多种剂量合并到一种药剂中.
2. qMRI: 实现了Weiskopf等人(2013)描述的定量图的估算方法.
八. 统计学
1. borrowr: 提供函数,通过从补充数据源来估计主要数据源的总体平均治疗效果。因果估计可以选择用贝叶斯线性模型或贝叶斯加性回归树(BART)来调整混杂度.
2. emax.glm: 对一般线性模型实现期望最大化(EM)回归.
3. kosel: 支持使用重新访问的仿冒程序对许多类型的L1正则化回归执行变量选择.
4. mipred: 使用多重插补校正预测的广义线性模型和Cox回归模型,以解释预测因子中的缺失值.
5.MixMatrix: 使用EM算法为矩阵变量法向t和反向t分布提供采样和密度函数.
6. sdcSpatial: 提供创建隐私保护光栅地图的功能,可以从空间点数据创建光栅地图.
九. 时间序列
1. distanta: 提供评估多变量时间序列之间差异的工具.
2. samurais: 提供各种统计潜在变量模型和无监督学习算法,以分割和表示单变量和多变量时间序列数据.
3. simts: 实现了一个支持时间序列分析课程的工具系统,包括一种称为小波矩的广义方法(GMWM).
十. 拓扑数据分析
1. BallMapper: 提供使用dlotko(2019)中描述的算法以抽象图的形式计算拓扑上精确的数据汇总的函数.
2. kernelTDA: 提供在标准统计学习算法中利用拓扑信息的工具,实现在持久性图空间上定义的内核,并为基于C ++ LIBSVM的内核支持向量机提供解算器,并使用C ++ HERA库计算Wasserstein距离的函数.
十一. 工具
1. babelwhale: 提供与docker和singularity容器交互的统一接口,允许用户在容器内执行命令.
2. fastmap: 提供键值存储的快速实现,通过在C ++中使用数据结构来避免常见的内存泄漏问题.
3. modelsummary: 利用gt和broom包为统计模型创建可自定义的、可发布的汇总表.
4. readwritesqlite: 提供向SQLite数据库读取和写入数据帧的功能.
5. rolldown: 提供基于JavaScript库的R Markdown输出格式.
6. rray: 提供一个工具包,通过使用广播和新的数组类,以一致、强大和直观的方式操作数组.
7. wyz.code.offensiveProgramming: 如攻击性编程手册中所述,提供代码以简化从防御性编程到攻击性编程的过渡.
十二. 可视化
1. altair: 实现Altair的接口,Altair本身是Vega-Lite的Python接口.
2. animint2: 提供在R代码中定义动画、交互式数据可视化以及在网页上呈现的功能.
3. apexcharter: 为apexcharts.js提供htmlwidgets接口,apexcharts.js是一个现代JavaScript图表库,可使用简单的API构建交互式图表和可视化.
4. ggparty: 将ggplot2功能扩展到partykit包,该包提供了为类方的树对象创建结构化和高度可定制的可视化的工具.
5. metadynminer3d: 提供从Plumed读取,分析和可视化Metadynamics 3D HILLS文件的工具.
说明:限于个人水平,错误之处难免,烦请批评指正,共同交流~
往期Top 40 R包介绍:
—————————————
往期精彩: