一:group 分组统计
语法:
{
key:<>, #统计的字段
cound:{} #筛选条件
reduce:function(current,result){} #对文档进行聚合的函数 current(分组统计过程中的一个文档),result(聚合结果文档)
initial:{} #初始化聚合结果文档(先于reduce执行)
finalize:function(){} #reduce函数执行完之后,返回之前执行的函数。可以用来修改result的值
}
准备数据:
db.stu.insert({'name':'zhangsan',sex:'男',age:18});
db.stu.insert({'name':'lisi',sex:'男',age:22});
db.stu.insert({'name':'lucy',sex:'女',age:16});
db.stu.insert({'name':'lilei',sex:'男',age:17});
db.stu.insert({'name':'hanmeimei',sex:'女',age:17});
db.stu.insert({'name':'mayun',sex:'男',age:51});
db.stu.insert({'name':'tony',sex:'男',age:48});
db.stu.insert({'name':'dinglei',sex:'男',age:46});
db.stu.insert({'name':'dengzhiqi',sex:'女',age:33});
db.stu.insert({'name':'liuyifei',sex:'女',age:31});
db.stu.insert({'name':'zhangchaoyang',sex:'男',age:52});
db.stu.insert({'name':'zhangxiaolong',sex:'男',age:38});
db.stu.insert({'name':'panxiaoting',sex:'女',age:40});
db.stu.insert({'name':'dingjunhui',sex:'男',age:41});
db.stu.insert({'name':'yaoming',sex:'男',age:39});
db.stu.insert({'name':'gaoyuanyuan',sex:'女',age:37});
db.stu.insert({'name':'yangmi',sex:'女',age:35});
db.stu.insert({'name':'zhaowei',sex:'女',age:39});
db.stu.insert({'name':'shengteng',sex:'男',age:37});
db.stu.insert({'name':'mali',sex:'女',age:35});
根据性别分组统计学生数量
db.stu.group({
key:{sex:1},
cond:{},
initial:{num:0},
reduce:function(current,result){
result.num += 1;
}
});
按性别统计年龄大于30的总年纪数
db.stu.group({
key:{sex:1},
cond:{age:{$gt:30}},
initial:{sum:0},
reduce:function(current,result){
result.sum += current.age;
}
});
按性别显示最大的年龄
db.stu.group({
key:{sex:1},
cond:{},
initial:{max:0},
reduce:function(current,result){
if(current.age>result.max){
result.max = current.age;
}
}
});
按性别统计年龄大于30的平均年龄
db.stu.group({
key:{sex:1},
cond:{age:{$gt:30}},
initial:{sum:0,num:0},
reduce:function(current,result){
result.sum += current.age;
result.num += 1;
},
finalize:function(result){
result.avg = result.sum/result.num;
}
});
官方文档:https://docs.mongodb.com/v2.6/reference/command/group/
注意:group 不支持分片集群,不能进行分布式运算。
二:aggregate 简单聚合
语法:
准备数据:同group
根据性别分组统计学生数量
db.stu.aggregate([{$group:{_id:'$sex',total:{$sum:1}}}]);
根据性别分组统计年龄大于30的学生数量
db.stu.aggregate([{$match:{age:{$gt:30}}},
{$group:{_id:'$sex',total:{$sum:1}}}]);
根据性别分组统计年龄大于30,且总数大于7的学生数量
db.stu.aggregate([{$match:{age:{$gt:30}}},
{$group:{_id:'$sex',total:{$sum:1}}},
{$match:{total:{$gt:7}}}]);
按性别统计总年龄数
db.stu.aggregate([{$group:{_id:'$sex',total:{$sum:'$age'}}}]);
按性别统计总年龄数,且按年龄总数降序排序,且只取前一行数据
db.stu.aggregate([{$group:{_id:'$sex',total:{$sum:'$age'}}},
{$sort:{total:-1}},
{$limit:1}]);
按性别统计总年龄数,且按年龄总数降序排序
db.stu.aggregate([{$group:{_id:'$sex',total:{$sum:'$age'}}},
{$sort:{total:-1}}]);
按性别统计平均年龄,且从高到低排序
db.stu.aggregate([{$group:{_id:'$sex',avg:{$avg:'$age'}}},
{$sort:{avg:-1}}]);
官方文档:https://docs.mongodb.com/manual/reference/command/aggregate/index.html
https://docs.mongodb.com/manual/reference/operator/aggregation-pipeline
三:Map Reduce
#原始数据 db.orders.insert({cust_id:"A123",amount:500,status:"A"}); db.orders.insert({cust_id:"A123",amount:250,status:"A"}); db.orders.insert({cust_id:"B212",amount:200,status:"A"}); db.orders.insert({cust_id:"A123",amount:300,status:"D"});
#按照cust_id分组统计amount之 且只统计 status是A的 db.orders.mapReduce( function(){emit(this.cust_id,this.amount);}, function(key,values){return Array.sum(values)}, { query:{status:"A"}, out:"orders_totals" } )
注意:
1,Map 函数必须调用emit(key,value) 返回键值对。
2,Reduce 函数接受的参数已经按照键聚合过一次,将Map返回的键值序列组合成{key,[value1,value2,...,valuen]}传递给Reduce,Reduce函数对values统计。
参考官网文档:https://docs.mongodb.com/manual/core/map-reduce
https://docs.mongodb.com/manual/reference/command/mapReduce/#dbcmd.mapReduce