python爬取数据保存为MySQl格式 - 代码天地

python爬取数据保存为MySQl格式

其他 2018-08-31 14:18:29 阅读次数: 0

#encoding:'utf-8'
import urllib.request
from bs4 import BeautifulSoup
import os
import time
import pymysql
import xlwt

def getDatas():
   # url="https://movie.douban.com/top250"
   url="file:///E:/scrapy/2018-04-27/movie/movie.html"
   header={'User-Agent': "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.1 (KHTML, like Gecko) Chrome/22.0.1207.1 Safari/537.1"}
   ret=urllib.request.Request(url=url,headers=header)
   res=urllib.request.urlopen(ret)
   # 转化格式
   response=BeautifulSoup(res,'html.parser')
   # 找到想要数据的父元素
   datas=response.find_all('div',{'class':'item'})
   # print(datas)
   con=pymysql.connect(host="localhost",user="root",passwd="123456",db="douban0424",port=3306,charset="utf8")
   if con:
       print("链接成功++++++++++++")
       #获取游标
       for item in datas:
           cur=con.cursor()
           if cur:
               print("游标获取成功=============")
               # print(item)
               dict1={}
               dict1['rank']=item.find('div',{'class':'pic'}).find('em').get_text()
               dict1['title']=item.find('div',{'class':'info'}).find('div',{'class':'hd'}).find('a').find('span',{'class':'title'}).get_text()
               dict1['picUrl']=item.find('div',{'class':'pic'}).find('a').find('img').get('src')
               #创建添加数据sql语句
               sql="insert into doubanInfo value(null,%s,%s,%s)"
               cur.execute(sql,(dict1['rank'],dict1['title'],dict1['picUrl']))
               # 提交数据
               con.commit()
           # 关闭游标
               cur.close()
   con.close()
# if __name__=="__main__":
getDatas()

猜你喜欢

转载自blog.csdn.net/zhanghl150426/article/details/82022534

python爬取数据保存为MySQl格式

python爬取数据保存为txt格式

python爬取数据保存为Json格式

python用akshare批量爬取金融数据并保存为excel格式

python爬取数据保存为图片

python爬取中国天气网天气并保存为word格式文件

python爬取中国天气网天气并保存为csv格式文件

Python 爬取数电教案并保存为pdf

python爬取多个网页表格并保存为csv

python爬取昵称并保存为vss

【Python爬虫】使用美味汤BeautifulSoup爬取数据并保存为Excel文件

Python爬虫之bilibili视频弹幕爬取并保存为JSON格式（详解分析+代码实现）

Spark读取MySQL(Oracle)数据保存为libsvm格式

python 将数据保存为excel的xls格式

利用requests和BeautifulSoup爬取菜鸟教程的代码与图片并保存为markdown格式

Python爬取全国最新房价信息保存为CSV文件,进行简单的数据分析

python--爬取豆瓣热门国产电视剧保存为文件

python中Scrapy实战之爬取网页并保存为json文件

python爬取安居客地图页信息，并保存为csv文件

Android爬虫Jsoup爬取某招聘网站数据并保存为exceL文件

Vue组件-爬取页面表格中的数据并保存为csv文件

爬取表格类网站数据并保存为excel文件

python 利用scrapy爬取豆瓣TOP250部电影信息分别保存为csv、json、存入mysql、下载海报图片

Matlab将mat格式数据保存为txt格式

python入门访问网站并将爬回来的数据保存为csv文件

Python爬虫学习笔记(2) _豆瓣电影TOP250(2)爬取详细数据，保存为CSV文件【urllib、request、bs4、error、CSV】

python爬36选7并保存为.csv

【解决】Python数据保存为csv再读取后部分数据的格式被更改

python代码红外温度矩阵、温度数据转为图片保存为PNG格式

python | 将列表数据按行保存为txt格式并进行读取

今日推荐

周排行

Access的四舍五入取整

8.23 前端学习过程

入门学习过程方向与漏洞复现总结：

操作分布式文件之八：如何批量并行读写远程文件和事务补偿处理

应邀出个教程（搭建tensorflow跑网络环境）

Kubernetes之Pod控制器应用进阶

14-[mysql内置功能]--

HDU6212 区间dp 好题

VS2015生成代码图

验证手机号的工具类

每日归档

更多

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)

2024-10-12(0)