import sys import importlib importlib.reload(sys) #需要xlwt库的支持 from xlwt import * #指定file以utf-8的格式打开 file = Workbook(encoding='utf-8') #指定打开的文件名 table = file.add_sheet('data') ldata = [] from pymongo import MongoClient #建立MongoDB数据库连接 client = MongoClient('10.255.73.102', 27017) #用户验证 db = client.admin db.authenticate("mongoadmin", "secret") #连接所用集合,也就是我们通常所说的表 collection=db.post i=0 #接下里就可以用collection来完成对数据库表的一些操作 #接下来可实现提取想要的字段内的数据 # 写入到excel # 随机取出数据 for item in collection.aggregate([ {'$sample': {'size':2000}}]): # print(item['post_content']) if 'post_content' in item: # 取取出空格,回车键 content = str(item['post_content']).strip().replace(' ','').replace('\r\n','') #写入excel 第1列和第二列 try: table.write(i,1,content) table.write(i, 0, item['post_time']) i += 1 except: print('') file.save('F:\\work\\week11\\data\\data2.xls') # 写入到txt中 #接下里就可以用collection来完成对数据库表的一些操作 with open ('F:/work/week11/data/data1.txt', 'wb') as f: #接下来可实现提取想要的字段内的数据 for item in collection.find({},{'post_content':1,'_id':0}): # print(item['post_content']) if 'post_content' in item: content =bytes(item['post_content'],encoding='utf-8') f.write(content) f.write('\r\n'.encode(encoding='utf-8'))
python mongodb 随机抽取数据
猜你喜欢
转载自blog.csdn.net/weixin_41281987/article/details/81486282
今日推荐
周排行