- 聚合aggregate
- 聚合是基于数据处理的聚合管道,每个文档通过一个由多个阶段组成的管道,可以对每个阶段的管道进行分组,过滤等功能,然后经过一系列的处理,输出相应的结果。
- 在管道中,一个管道的输出作为下一个管道的输入。
db.collection.aggregate({管道:{表达式}})
表达式
- 语法:表达式:’$列名’
- 常用表达式:
- $ sum: 计算总和,$sum:1表示以一倍计数
- $avg:计算平均值
- $min:最小值
- $max:最大值
- $push:在结果文档插入值到第一个数组中
- $first:根据资源文档的排序获取第一个文档数据
- $last:根据资源文档的排序获取最后一个文档数据
常用管道
- $group
- 将集合中的文档分组,可用于统计结果
- _id表示分组的依据,使用某个字段的格式为’$字段’
- 取某个字段的值需要用$符合来取
例:统计男士,女生的总人数
db.stu.aggregate({
$group:{'_id':'$gender','count':{$sum:1}}
})
$sum等于表示每个记录算一条,然后把该组下的所有记录相加求和。
同时对多个字段进行分组:
db.stu.aggregate(
{$group:{_id:{country:'$country',province:'$province'}}}
)
去字典嵌套的字典中的值:'$_id.country'
查询整个集合的记录数以及平均年龄
db.stu.aggregate({
$group:{_id:null,count:{$sum:1},avag:{$avg:"$age"}}
})
- $project
- 修改输入文档结构,如重命名,增加,删除字段,创建计算结果
- 例:查询学生的姓名,年龄
db.stu.aggregate({
{$project:{_id:0,name:1,age:1}}
})
为0不显示,为1显示
db.stu.aggregate(
{$group:{_id:'$gender',counter:{$sum:1}}},
{$project:{_id:0,counter:1}}
)
- $match
- 用于过滤数据,只输出符合条件的文档
- 使用MongoDB的标准查询操作
查询年龄大于20的学生
db.stu.aggregate(
{$match:{age:{$gt:20}}}
)
选择年龄大于20的学生,观察男性和女性有多少人
db.stu.aggregate(
{$match:{$age:{$gt:20}}},
{$group:{_id:'$gender',count:{$sum:1}}},
{$project:{_id:0,gender:'$_id',count:1}}
)
- $sort
例1:查询学生信息,按年龄升序
db.stu.aggregate({$sort:{age:1}})
例2:查询男生,女士人数,按人数降序
db.stu.aggregate(
{$group:{_Id:'$gender',counter:{$sum:1}}},
{$sort:{counter:-1}}
)
- $limit
例:查询2条学生信息
db.stu.aggregate({$limit:2})
- $skip
例:查询从第3条开始的学生信息
db.stu.aggregate(
{$skip:2}
)
- $unwind
- 将文档中的某一个数组类型字段拆分成多条,每条包含数组中的一个值。
- 语法:db.collection.aggregate({
unwind:′字段名称’})
db.clothes.insert({_id:1,item:'shirt',size:['S','M','L']})
db.clothes.aggregate({$unwind:'$size"})
输出:
{"_id":1,"item":"shirt","size":"S"}
{"_id":1,"item":"shirt","size":"M"}
{"_id":1,"item":"shirt","size":"L"}
添加一个属性防止当要拆分的属性为空时丢失数据:
db.collection.aggregate({
$unwind:{
path:'$字段名称',
preserveNullAndEmptyArrays: Boolean //为true保留属性值为空的文档
})