1.安装
sudo apt-get install -y mongodb-org
https://docs.mongodb.com/manual/tutorial/install-mongodb-on-ubuntu/ #官方文档
2. 开启关闭数据库的命令
2.1.服务端mongodb的启动
- 查看帮助:mongod –help
- 启动:sudo service mongod start
- 停止:sudo service mongod stop
- 重启:sudo service mongod restart
- 查看是否启动成功:ps -ef|grep mongod
- 配置文件的位置:/etc/mongod.conf,
- 默认端⼝:27017
- 日志的位置:/var/log/mongodb/mongod.log
2.2. 客户端mongo启动
- 启动本地客户端:mongo
- 查看帮助:mongo –help
- 退出:exit或者ctrl+c
2.3. 服务端mongodb无法启动的解决方法
sudo mongod --config /etc/mongod.conf & # & 表示在后台运行
mongodb的官方文档
位置:https://docs.mongodb.com/manual/introduction/
3. 数据库操作
3.1 数据库的命令
- 查看当前的数据库:db
- 查看所有的数据库:show dbs /show databases
- 新建数据库:use 新建的dbname , 如果不插入数据,show dbs并不会显示,插入数据之后就会显示了
- 切换数据库:use db_name
- 删除当前的数据库:use 要删除的数据库 --> db.dropDatabase() 删除当前所在的数据库
3.2 集合的命令
- 不手动创建集合: 向不存在的集合中第⼀次加⼊数据时, 集合会被创建出来
- 手动创建结合:
db.createCollection(name,options)
db.createCollection("stu")
db.createCollection("sub", { capped : true, size : 10 } )
- 参数capped: 默认值为false表示不设置上限,值为true表示设置上限
- 参数size: 当capped值为true时, 需要指定此参数, 表示上限⼤⼩,当⽂档达到上限时, 会将之前的数据覆盖, 单位为字节
- 查看集合:
show collections
- 删除集合:
db.集合名称.drop()
4.mongodb中常见的数据类型
4.1 常见类型
- Object ID: ⽂档ID
- String: 字符串, 最常⽤, 必须是有效的UTF-8
- Boolean: 存储⼀个布尔值, true或false
- Integer: 整数可以是32位或64位, 这取决于服务器
- Double: 存储浮点值
- Arrays: 数组或列表, 多个值存储到⼀个键
- Object: ⽤于嵌⼊式的⽂档, 即⼀个值为⼀个⽂档
- Null: 存储Null值
- Timestamp: 时间戳, 表示从1970-1-1到现在的总秒数
- Date: 存储当前⽇期或时间的UNIX时间格式
4.2 注意点
- 创建⽇期语句如下 :参数的格式为YYYY-MM-DD new Date(‘2017-12-20’)
- 每个⽂档都有⼀个属性, 为_id, 保证每个⽂档的唯⼀性
可以⾃⼰去设置id插⼊⽂档,如果没有提供, 那么MongoDB为每个⽂档提供了⼀个独特的id, 类型为objectID - objectID是⼀个12字节的⼗六进制数,每个字节两位,一共是24 位的字符串: 前4个字节为当前时间戳 接下来3个字节的机器ID 接下来的2个字节中MongoDB的服务进程id 最后3个字节是简单的增量值
5. mongodb的增删改查
- 插入
- insert() 插入数据,_id相同会报错
- save() _id相同会更新
- 删除
- db.collection.remove({条件},{justOne:flase}) #全部删除满足条件的数据
- 更新
- db.collection.update({条件},{$set:{name:10086}},{multi:true})
5.1 插入
- db.集合名称.insert(document)
db.stu.insert({name:'gj',gender:1})
db.stu.insert({_id:"20170101",name:'gj',gender:1})
插⼊⽂档时, 如果不指定_id参数, MongoDB会为⽂档分配⼀个唯⼀的ObjectId
5.2 保存
命令:db.集合名称.save(document)
如果⽂档的id已经存在则修改, 如果⽂档的id不存在则添加
5.3 简单查询
命令:db.集合名称.find()
5.4 更新
命令:db.集合名称.update(<query> ,<update>,{multi: <boolean>})
-
参数query:查询条件
-
参数update:更新操作符
-
参数multi:可选, 默认是false,表示只更新找到的第⼀条记录, 值为true表示把满⾜条件的⽂档全部更新
db.stu.update({name:‘hr’},{name:‘mnc’}) 覆盖更新
db.stu.update({name:‘hr’},{KaTeX parse error: Expected 'EOF', got '}' at position 17: …et:{name:'hys'}}̲) 更新一条 db.…set:{gender:0}},{multi:true}) 更新全部
注意:“multi update only works with $ operators”
5.5 删除集合里的数据
命令:db.集合名称.remove(<query>,{justOne: <boolean>})
- 参数query:必选,删除的⽂档的条件
- 参数justOne:可选, 如果设为true或1, 则只删除⼀条, 默认false, 表示删除多条
6.高级查询
6.1 数据查询
- ⽅法find(): 查询
db.集合名称.find({条件⽂档})
- ⽅法findOne():查询,只返回第⼀个
db.集合名称.findOne({条件⽂档})
- ⽅法pretty(): 将结果格式化
db.集合名称.find({条件⽂档}).pretty()
6.2 比较运算符
可以使用以下数据进行练习,插入多条数据可以把多条数据放在一个列表里面,即可一次插入
{"name" : "郭靖", "hometown" : "蒙古", "age" : 20, "gender" : true }
{"name" : "⻩蓉", "hometown" : "桃花岛", "age" : 18, "gender" : false }
{"name" : "华筝", "hometown" : "蒙古", "age" : 18, "gender" : false }
{"name" : "⻩药师", "hometown" : "桃花岛", "age" : 40, "gender" : true }
{"name" : "段誉", "hometown" : "⼤理", "age" : 16, "gender" : true }
{"name" : "段王爷", "hometown" : "⼤理", "age" : 45, "gender" : true }
{"name" : "洪七公", "hometown" : "华⼭", "age" : 18, "gender" : true }
- 等于: 默认是等于判断, 没有运算符
- ⼩于:
$lt
(less than) - ⼩于等于:
$lte
(less than equal) - ⼤于:
$gt
(greater than) - ⼤于等于:
$gte
- 不等于:
$ne
例如:
查询年龄大于18的所有学生
db.stu.find({age:{$gte:18}})
6.3 逻辑运算符
逻辑运算符主要指与、或逻辑
- and:在json中写多个条件即可
查询年龄⼤于或等于18, 并且性别为true的学⽣
db.stu.find({age:{$gte:18},gender:true})
- or:使⽤
$or
, 值为数组, 数组中每个元素为json
查询年龄⼤于18, 或性别为false的学⽣
db.stu.find({$or:[{age:{$gt:18}},{gender:false}]})
查询年龄⼤于18或性别为男⽣, 并且姓名是郭靖
db.stu.find({$or:[{age:{$gte:18}},{gender:true}],name:'gj'})
6.4 范围运算符
使⽤$in
, $nin
判断数据是否在某个数组内
查询年龄为18、 28的学⽣
db.stu.find({age:{$in:[18,28,38]}})
6.5 ⽀持正则表达式
使⽤//
或$regex
编写正则表达式
查询sku以abc开头的数据
db.products.find({sku:/^abc/})
查询sku以789结尾的数据
db.products.find({sku:{$regex:'789$'}})
{ "_id" : 100, "sku" : "abc123", "description" : "Single line description." }
{ "_id" : 101, "sku" : "abc789", "description" : "First line\nSecond line" }
{ "_id" : 102, "sku" : "xyz456", "description" : "Many spaces before line" }
{ "_id" : 103, "sku" : "xyz789", "description" : "Multiple\nline description" }
6.6 skip和limit
- ⽅法limit(): ⽤于读取指定数量的⽂档
db.集合名称.find().limit(NUMBER)
db.stu.find().limit(2)
#查询前2条学⽣信息 - ⽅法skip(): ⽤于跳过指定数量的⽂档
db.集合名称.find().skip(NUMBER)
db.stu.find().skip(2)
#跳过前2条学⽣信息 - 同时使用 , 先skip再limit效率比较高
db.stu.find().limit(4).skip(5)
或
db.stu.find().skip(5).limit(4)
#建议使用此种,效率比较高
注意:先使用skip在使用limit的效率要高于前者
6.7 自定义查询*了解
由于mongo的shell是一个js的执行环境 使⽤$where后⾯写⼀个函数, 返回满⾜条件的数据
查询年龄⼤于30的学⽣
db.stu.find({
$where:function() {
return this.age>30;}
})
6.8 投影
在查询到的返回结果中, 只选择必要的字段
命令:db.集合名称.find({},{字段名称:1,...})
#前面的{}放筛选条件,后面的{}放需要显示的字段
参数为字段与值, 值为1表示显示, 值为0不显 特别注意: 对于_id列默认是显示的, 如果不显示需要明确设置-id=0
db.stu.find({},{_id:0,name:1,gender:1})
6.9 排序
⽅法sort(), ⽤于对 集进⾏排序
命令:db.集合名称.find().sort({字段:1,...})
参数1为升序排列 参数-1为降序排列
根据性别降序, 再根据年龄升序
db.stu.find().sort({gender:-1,age:1})
6.10 统计个数
⽅法count()⽤于统计结果集中⽂档条数
命令:db.集合名称.find({条件}).count()
命令:db.集合名称.count({条件})
db.stu.find({gender:true}).count()
db.stu.count({age:{$gt:20},gender:true})
db.stu.count() 同级所有
6.11 消除重复
⽅法distinct()对数据进⾏去重
命令:db.集合名称.distinct('去重字段',{条件})
db.stu.distinct('hometown',{age:{$gt:18}})
7.聚合操作
7.1 聚合是什么
聚合(aggregate)是基于数据处理的聚合管道,每个文档通过一个由多个阶段(stage)组成的管道,可以对每个阶段的管道进行分组、过滤等功能,然后经过一系列的处理,输出相应的结果。
语法:
db.集合名称.aggregate({管道:{表达式}})
8.常用管道和表达式
8.1 常用管道命令
在mongodb中,⽂档处理完毕后, 通过管道进⾏下⼀次处理 常用管道命令如下:
$group
: 将集合中的⽂档分组, 可⽤于统计结果$match
: 过滤数据, 只输出符合条件的⽂档$project
: 修改输⼊⽂档的结构, 如重命名、 增加、 删除字段、 创建计算结果$sort
: 将输⼊⽂档排序后输出$limit
: 限制聚合管道返回的⽂档数$skip
: 跳过指定数量的⽂档, 并返回余下的⽂档
8.2 常用表达式
表达式:处理输⼊⽂档并输出 语法:表达式:’$列名’ 常⽤表达式:
-$sum
: 计算总和,{$sum:1}
表示以⼀倍计数 ,{$sum:"$age"}
表示计算age的总和
$avg
: 计算平均值$min
: 获取最⼩值$max
: 获取最⼤值$push
: 在结果⽂档中插⼊值到⼀个数组中
8.3 管道命令之$group
按照某个字段进行分组
$group
是所有聚合命令中用的最多的一个命令,用来将集合中的文档分组,可用于统计结果
使用示例如下
db.stu.aggregate(
{$group:
{
_id:"$gender",
counter:{$sum:1}
}
} )
其中注意点:
db.db_name.aggregate
是语法,所有的管道命令都需要写在其中_id
表示分组的依据,按照哪个字段进行分组,需要使用$gender
表示选择这个字段进行分组$sum:1
表示把每条数据作为1进行统计,统计的是该分组下面数据的条数
group by null
当我们需要统计整个文档的时候,$group 的另一种用途就是把整个文档分为一组进行统计
使用实例如下:
db.stu.aggregate(
{$group:
{
_id:null,
counter:{$sum:1}
}
}
)
其中注意点:
- _id:null 表示不指定分组的字段,即统计整个文档,此时获取的counter表示整个文档的个数
数据透视
正常情况在统计的不同性别的数据的时候,需要知道所有的name,需要逐条观察,如果通过某种方式把所有的name放到一起,那么此时就可以理解为数据透视
使用示例如下:
- 统计不同性别的学生
db.stu.aggregate(
{$group:
{
_id:null,
name:{$push:"$name"}
}
}
)
- 使用$$ROOT可以将整个文档放入数组中
db.stu.aggregate(
{$group:
{
_id:null,
name:{$push:"$$ROOT"}
}
}
)
动手
对于如下数据,需要统计出每个country/province下的userid的数量(同一个userid只统计一次)
{ "country" : "china", "province" : "sh", "userid" : "a" }
{ "country" : "china", "province" : "sh", "userid" : "b" }
{ "country" : "china", "province" : "sh", "userid" : "a" }
{ "country" : "china", "province" : "sh", "userid" : "c" }
{ "country" : "china", "province" : "bj", "userid" : "da" }
{ "country" : "china", "province" : "bj", "userid" : "fa" }
参考答案
db.tv3.aggregate(
{$group:{_id:{country:'$country',province:'$province',userid:'$userid'}}},
{$group:{_id:{country:'$_id.country',province:'$_id.province'},count:{$sum:1}}}
8.4 管道命令之$match
$match
用于进行数据的过滤,是在能够在聚合操作中使用的命令,和find区别在于$match
操作可以把结果交给下一个管道处理,而find不行
使用示例如下:
- 查询年龄大于20的学生
db.stu.aggregate(
{$match:{age:{$gt:20}}
)
{ "_id" : ObjectId("5c416f8fea98ce04531787f0"), "name" : "⻩药师", "hometown" : "桃花岛", "age" : 40, "gender" : true }
{ "_id" : ObjectId("5c416f8fea98ce04531787f2"), "name" : "段王爷", "hometown" : "⼤理", "age" : 45, "gender" : true }
- 查询年龄大于20的男女学生的人数
db.stu.aggregate(
{$match:{age:{$gt:20}}
{$group:{_id:"$gender",counter:{$sum:1}}}
)
8.5 管道命令之$project
$project
用于修改文档的输入输出结构,例如重命名,增加,删除字段
使用示例如下:
- 查询学生的年龄、姓名,仅输出年龄姓名
db.stu.aggregate(
{$project:{_id:0,name:1,age:1}}
)
- 查询男女生人生,输出人数
db.stu.aggregate(
{$group:{_id:"$gender",counter:{$sum:1}}}
{$project:{_id:0,counter:1}}
)
动手练习
对于如下数据:统计出每个country/province下的userid的数量(同一个userid只统计一次),结果中的字段为{country:"",province:"",counter:"*"}
{ "country" : "china", "province" : "sh", "userid" : "a" }
{ "country" : "china", "province" : "sh", "userid" : "b" }
{ "country" : "china", "province" : "sh", "userid" : "a" }
{ "country" : "china", "province" : "sh", "userid" : "c" }
{ "country" : "china", "province" : "bj", "userid" : "da" }
{ "country" : "china", "province" : "bj", "userid" : "fa" }
参考答案
db.tv3.aggregate(
{$group:{_id:{country:'$country',province:'$province',userid:'$userid'}}},
{$group:{_id:{country:'$_id.country',province:'$_id.province'},count:{$sum:1}}},
{$project:{_id:0,country:'$_id.country',province:'$_id.province',counter:'$count'}}
)
8.6 管道命令之$sort
$sort用于将输入的文档排序后输出
使用示例如下:
- 查询学生信息,按照年龄 升序( 1
db.stu.aggregate({$sort:{age:1}})
- 查询男女人数,按照人数 降序( -1
db.stu.aggregate(
{$group:{_id:"$gender",counter:{$sum:1}}},
{$sort:{counter:-1}}
)
8.7 管道命令之$skip 和 $limit
- $limit限制返回数据的条数
- $skip 跳过指定的文档数,并返回剩下的文档数
- 同时使用时先使用skip在使用limit 执行效率比较高
使用示例如下:
- 查询2条学生信息
db.stu.aggregate(
{$limit:2}
)
- 查询从第三条开始的学生信息
db.stu.aggregate(
{$skip:3}
)
- 统计男女生人数,按照人数升序,返回第二条数据
db.stu.aggregate(
{$group:{_id:"$gender",counter:{$sum:1}}},
{$sort:{counter:-1}},
{$skip:1},
{$limit:1}
)