转自:
https://blog.csdn.net/mchdba/article/details/50456784
背景
关系型数据库中分组去重一般都是group by … having(count(1)>1)…筛选出来重复的记录组,一条sql搞定,但是在mongodb里面,没有这么方便了,需要自己写脚本来实现,可以通过aggregate、group、match来操作处理。
实现
1. 先统计分组记录数
按分组求记录数,并按记录数倒序出结果
执行窗口如下:
var group = (
[
{
$group : {
_id : { fenceId: "$fenceId"},
count: { $sum: 1 }
}
},
{
$sort : {
count : -1
}
}
]
)
2. 定义对结果的过滤
var match = {
$match : {
count : {
$gt : 1
}
}
}
3. 将过滤条件加到group的管道中
group.push(match)
4. 执行最终aggregate操作
db.stu.aggregate(group);