任何应用都离不开数据,所以在学习python的时候,当然也要学习一个如何用python操作数据库了。MySQLdb就是python对mysql数据库操作的模块。官方Introduction : MySQLdb is an thread-compatible interface to the popular MySQL database server that provides the Python database API. 它其实相当于翻译了对应C的接口。
使用这种数据库接口大多是就是执行连接数据库->执行query->提取数据->关闭连接 这几个步骤。MySQLdb提供比较关键的对象,分别是Connection、Cursor、Result。具体使用步骤很简单先不写了,先写一些个人认为比较重要、值得注意的地方。
1、虽然在MySQLdb.Connect(host ,user , passw , db)函数中,我们经常使用的只是这几个参数,但是其实里面还有很多比如字符集、线程安全、ssl等也都是很重要的参数,使用时要身份注意。
2、当使用Connection.query()函数进行query后,connection 对象可以返回两种result,分别是store_result和use_result,store_result 将结果集存回client端,而use_result则是结果集保存在server端,并且维护了一个连接,会占用server资源。此时,不可以进行任何其他的查询。建议使用store_result,除非返回结果集(result set)过大或是无法使用limit的情形。
3、提取(fetch)数据的返回形式大多有三种情形。 as a tuple(how=0) ;as dictionaries, key=column or table.column if duplicated(how=1);as dictionaries, key=table.column (how=2)
4、每次fetch,在result内部都会产生数据位置的移动,也就是说假如有10行数据,执行result.fetch_row(3,0),会得到前三行,再执行result.fetch_row(3,0),则会得到中间的三行,所以说fetch会导致position的移动。另外值得注意的是,如果使用use_result,也就是数据存储在server时,在fetch所有的条目之前,不能进行任何的query操作。
5、mysql本身不支持游标(Cursor),但是MySQLdb对Cursor进行了仿真。重要的执行query方法有execute 和 executemany 。execute方法,执行单条sql语句,调用executemany方法很好用,数据库性能瓶颈很大一部分就在于网络IO和磁盘IO将多个insert放在一起,只执行一次IO,可以有效的提升数据库性能。游标cursor具有fetchone、fetchmany、fetchall三个方法提取数据,每个方法都会导致游标游动,所以必须关注游标的位置。游标的scroll(value, mode)方法可以使得游标进行卷动,mode参数指定相对当前位置(relative)还是以绝对位置(absolute)进行移动。
6、MySQLdb提供了很多函数方法,在官方指南里没有完全罗列,使用者可以用help去看看,里面提供了很多方便的东西。
7、对于mysql来说,如果使用支持事务的存储引擎,那么每次操作后,commit是必须的,否则不会真正写入数据库,对应rollback可以进行相应的回滚,但是commit后是无法再rollback的。commit() 可以在执行很多sql指令后再一次调用,这样可以适当提升性能。
8、executemany处理过多的命令也不见得一定好,因为数据一起传入到server端,可能会造成server端的buffer溢出,而一次数据量过大,也有可能产生一些意想不到的麻烦。合理,分批次executemany是个不错的办法。
最后,我自己写了个pyMysql模块,主要是对MySQLdb提供的常用方法进行了简单的再次封装,也借此机会好好学习下MySQLdb,以及练习python的编码。该程序使用的数据库表,采用myisam引擎,所以没加上commit(),一般最好还是要加上的。
代码如下:PyMysql.py
#-*- encoding:gb2312 -*-_
'''
Created on 2012-1-12
@author: xiaojay
'''
import
MySQLdb
import
MySQLdb.cursors
STORE_RESULT_MODE
=
0
USE_RESULT_MODE
=
1
CURSOR_MODE
=
0
DICTCURSOR_MODE
=
1
SSCURSOR_MODE
=
2
SSDICTCURSOR_MODE
=
3
FETCH_ONE
=
0
FETCH_MANY
=
1
FETCH_ALL
=
2
class
PyMysql:
def
__init__(
self
):
self
.conn
=
None
pass
def
newConnection(
self
,host,user,passwd,defaultdb):
"""
建立一个新连接,指定host、用户名、密码、默认数据库
"""
self
.conn
=
MySQLdb.Connect(host,user,passwd,defaultdb)
if
self
.conn.
open
=
=
False
:
raise
None
def
closeConnnection(
self
):
"""
关闭当前连接
"""
self
.conn.close()
def
query(
self
,sqltext,mode
=
STORE_RESULT_MODE):
"""
作用:使用connection对象的query方法,并返回一个元组(影响行数(int),结果集(result))
参数:sqltext:sql语句
mode=STORE_RESULT_MODE(0) 表示返回store_result,mode=USESTORE_RESULT_MODE(1) 表示返回use_result
返回:元组(影响行数(int),结果集(result)
"""
if
self
.conn
=
=
None
or
self
.conn.
open
=
=
False
:
return
-
1
self
.conn.query(sqltext)
if
mode
=
=
0
:
result
=
self
.conn.store_result()
elif
mode
=
=
1
:
result
=
self
.conn.use_result()
else
:
raise
Exception(
"mode value is wrong."
)
return
(
self
.conn.affected_rows(),result)
def
fetch_queryresult(
self
,result,maxrows
=
1
,how
=
0
,moreinfo
=
False
):
"""
参数:result: query后的结果集合
maxrows: 返回的最大行数
how: 以何种方式存储结果
(0:tuple,1:dictionaries with columnname,2:dictionaries with table.columnname)
moreinfo 表示是否获取更多额外信息(num_fields,num_rows,num_fields)
返回:元组(数据集,附加信息(当moreinfo=False)或单一数据集(当moreinfo=True)
"""
if
result
=
=
None
:
return
None
dataset
=
result.fetch_row(maxrows,how)
if
moreinfo
is
False
:
return
dataset
else
:
num_fields
=
result.num_fields()
num_rows
=
result.num_rows()
field_flags
=
result.field_flags()
info
=
(num_fields,num_rows,field_flags)
return
(dataset,info)
def
execute(
self
,sqltext,args
=
None
,mode
=
CURSOR_MODE,many
=
False
):
"""
作用:使用游标(cursor)的execute 执行query
参数:sqltext: 表示sql语句
args: sqltext的参数
mode:以何种方式返回数据集
CURSOR_MODE = 0 :store_result , tuple
DICTCURSOR_MODE = 1 : store_result , dict
SSCURSOR_MODE = 2 : use_result , tuple
SSDICTCURSOR_MODE = 3 : use_result , dict
many:是否执行多行操作(executemany)
返回:元组(影响行数(int),游标(Cursor))
"""
if
mode
=
=
CURSOR_MODE :
curclass
=
MySQLdb.cursors.Cursor
elif
mode
=
=
DICTCURSOR_MODE :
curclass
=
MySQLdb.cursors.DictCursor
elif
mode
=
=
SSCURSOR_MODE :
curclass
=
MySQLdb.cursors.SSCursor
elif
mode
=
=
SSDICTCURSOR_MODE :
curclass
=
MySQLdb.cursors.SSDictCursor
else
:
raise
Exception(
"mode value is wrong"
)
cur
=
self
.conn.cursor(cursorclass
=
curclass)
line
=
0
if
many
=
=
False
:
if
args
=
=
None
:
line
=
cur.execute(sqltext)
else
:
line
=
cur.execute(sqltext,args)
else
:
if
args
=
=
None
:
line
=
cur.executemany(sqltext)
else
:
line
=
cur.executemany(sqltext,args)
return
(line , cur )
def
fetch_executeresult(
self
,cursor,mode
=
FETCH_ONE,rows
=
1
):
"""
作用:提取cursor获取的数据集
参数:cursor:游标
mode:执行提取模式
FETCH_ONE: 提取一个; FETCH_MANY :提取rows个 ;FETCH_ALL : 提取所有
rows:提取行数
返回:fetch数据集
"""
if
cursor
=
=
None
:
return
if
mode
=
=
FETCH_ONE :
return
cursor.fetchone()
elif
mode
=
=
FETCH_MANY :
return
cursor.fetchmany(rows)
elif
mode
=
=
FETCH_ALL :
return
cursor.fetchall()
if
__name__
=
=
"__main__"
:
print
help
(PyMysql)
|
测试代码:
#-*- encoding:gb2312 -*-
import
PyMysql
"""
authors 这张表很简单。
+--------------+-------------+------+-----+---------+----------------+
| Field | Type | Null | Key | Default | Extra |
+--------------+-------------+------+-----+---------+----------------+
| author_id | int(11) | NO | PRI | NULL | auto_increment |
| author_last | varchar(50) | YES | | NULL | |
| author_first | varchar(50) | YES | MUL | NULL | |
| country | varchar(50) | YES | | NULL | |
+--------------+-------------+------+-----+---------+----------------+
本文主要的所有操作都针对该表。
"""
def
printAuthors(res,mode
=
0
,lines
=
0
):
"""
格式化输出
"""
print
"*"
*
20
,
" lines: "
,lines ,
" "
,
"*"
*
20
if
mode
=
=
0
:
for
author_id , author_last , author_first , country
in
res :
print
"ID : %s , Author_last : %s , Author_First : %s , Country : %s"
\
%
(author_id , author_last , author_first , country )
else
:
for
item
in
res :
print
"-----------"
for
key
in
item.keys():
print
key ,
" : "
,item[key]
#建立连接
mysql
=
PyMysql.PyMysql()
mysql.newConnection(
host
=
"localhost"
,
user
=
"root"
,
passwd
=
"peterbbs"
,
defaultdb
=
"bookstore"
)
""
#定义sql语句
sqltext
=
"select * from authors order by author_id "
#调用query方法,得到result
lines , res
=
mysql.query(sqltext, mode
=
PyMysql.STORE_RESULT_MODE)
#提取数据
data
=
mysql.fetch_queryresult(res, maxrows
=
20
, how
=
0
, moreinfo
=
False
)
#打印
printAuthors(data,
0
,lines)
#演示多行插入
sqltext
=
"insert into authors (author_last,author_first,country) values (%s,%s,%s)"
args
=
[(
'aaaaaa'
,
'bbbbbb'
,
'cccccc'
),(
'dddddd'
,
'eeeeee'
,
'ffffff'
),(
'gggggg'
,
'hhhhhh'
,
'iiiiii'
)]
lines ,cur
=
mysql.execute(sqltext,args,mode
=
PyMysql.DICTCURSOR_MODE,many
=
True
)
print
"*"
*
20
, lines ,
"行被插入 "
,
"*"
*
20
sqltext
=
"select * from authors order by author_id "
#调用cursor.execute方法,得到result
lines ,cur
=
mysql.execute(sqltext,mode
=
PyMysql.DICTCURSOR_MODE)
#提取数据
data
=
mysql.fetch_executeresult(cur, mode
=
PyMysql.FETCH_MANY, rows
=
20
)
#打印
printAuthors(data,
1
,lines)
#关闭连接
mysql.closeConnnection()
|
测试输出:
******************** lines: 5 ********************
ID : 1 , Author_last : Greene , Author_First : Graham , Country : United Kingdom
ID : 4 , Author_last : Peter , Author_First : David , Country : China
ID : 5 , Author_last : mayday , Author_First : Feng , Country : France
ID : 6 , Author_last : zhang , Author_First : lixin , Country : France
ID : 9 , Author_last : zhang111 , Author_First : lixin , Country : France
******************** 3 行被插入 ********************
******************** lines: 8 ********************
-----------
country : United Kingdom
author_id : 1
author_first : Graham
author_last : Greene
-----------
country : China
author_id : 4
author_first : David
author_last : Peter
-----------
country : France
author_id : 5
author_first : Feng
author_last : mayday
-----------
country : France
author_id : 6
author_first : lixin
author_last : zhang
-----------
country : France
author_id : 9
author_first : lixin
author_last : zhang111
-----------
country : cccccc
author_id : 53
author_first : bbbbbb
author_last : aaaaaa
-----------
country : ffffff
author_id : 54
author_first : eeeeee
author_last : dddddd
-----------
country : iiiiii
author_id : 55
author_first : hhhhhh
author_last : gggggg