这篇文章将持续更新。
首先,当我们拥有如下数据集b:
> b
V1 V2 V4
1 7063b3d0c075a4d276c5f06f4327cf4a effb071415be51f11e845884e67c0f8c 1
2 0db66c0dd3993fd3504bb98c3beb15b3 f87ff481d85d2f95335ab602f38a7655 1
3 f8c065dc140ec74c6e44144164e618e3 8a27d9a6c59628c991c154e8d93f412e 2
4 2c6082cf0d68e244f2a10325e8d1b85b ecea5fe33e6817d09c395f2910479728 3
5 2c6082cf0d68e244f2a10325e8d1b85b 31a3d0420d89c9b121bb55dbdbbeda6b 3
我们希望统计以V1分组,每一组的V4变量各指标的计数,在Excel的透视表里我们需要这样做:
而在R中要达到同样效果,我们的代码如下:
> dcast(tmp,V1~V4)
Using V4 as value column: use value.var to override.
Aggregation function missing: defaulting to length
V1 1 2 3
1 0db66c0dd3993fd3504bb98c3beb15b3 1 0 0
2 2c6082cf0d68e244f2a10325e8d1b85b 0 0 2
3 7063b3d0c075a4d276c5f06f4327cf4a 1 0 0
4 f8c065dc140ec74c6e44144164e618e3 0 1 0
输出为Data.frame格式。(dcast函数需要载入reshape2包)