SQL语句及其关键字总结(二)
1.LIKE
LIKE 是另一个在 WHERE 子句中会用到的指令。基本上,LIKE 能让我们依据一个套式 (pattern) 来找出我们要的资料。相对来说,在运用 IN 的时候,我们完全地知道我们需要的条件;在运用 BETWEEN 的时候,我们则是列出一个范围。 LIKE 的语法如下:
FROM "表格名"
WHERE "栏位名" LIKE {套式};
{套式} 经常包括野卡 (wildcard). 以下是几个例子:
- 'A_Z': 所有以 'A' 起头,另一个任何值的字原,且以 'Z' 为结尾的字串。 'ABZ' 和 'A2Z' 都符合这一个模式,而 'AKKZ' 并不符合 (因为在 A 和 Z 之间有两个字原,而不是一个字原)。
- 'ABC%': 所有以 'ABC' 起头的字串。举例来说,'ABCD' 和 'ABCABC' 都符合这个套式。
- '%XYZ': 所有以 'XYZ' 结尾的字串。举例来说,'WXYZ' 和 'ZZXYZ' 都符合这个套式。
- '%AN%': 所有含有 'AN' 这个套式的字串。举例来说, 'LOS ANGELES' 和 'SAN FRANCISCO' 都符合这个套式。
我们将以上最后一个例子用在我们的 Store_Information 表格上:
Store_Information 表格
Store_Name | Sales | Txn_Date |
LOS ANGELES | 1500 | 05-Jan-1999 |
SAN DIEGO | 250 | 07-Jan-1999 |
SAN FRANCISCO | 300 | 08-Jan-1999 |
BOSTON | 700 | 08-Jan-1999 |
我們打入,
FROM Store_Information
WHERE Store_Name LIKE '%AN%';
結果:
Store_Name | Sales | Txn_Date |
LOS ANGELES | 1500 | Jan-05-1999 |
SAN FRANCISCO | 300 | Jan-08-1999 |
SAN DIEGO | 250 | Jan-07-1999 |
2.ORDER BY
事实上,我们经常需要能够将抓出的资料做一个有系统的显示。这可能是由小往大 (ascending) 或是由大往小 (descending)。在这种情况下,我们就可以运用 ORDER BY这个指令来达到我们的目的。
ORDER BY 的语法如下:
FROM "表格名"
[WHERE "条件"]
ORDER BY "栏位名" [ASC, DESC];
[ ] 代表 WHERE 是一定需要的。不过,如果 WHERE 子句存在的话,它是在 ORDER BY 子句之前。ASC 代表结果会以由小往大的顺序列出,而 DESC 代表结果会以由大往小的顺序列出。如果两者皆没有被写出的话,那我们就会用 ASC。
我们可以照好几个不同的栏位来排顺序。在这个情况下,ORDER BY 子句的语法如下(假设有两个栏位):
若我们对这两个栏位都选择由小往大的话,那这个子句就会造成结果是依据 "栏位一" 由小往大排。若有好几笔资料 "栏位一" 的值相等,那这几笔资料就依据 "栏位二" 由小往大排。
举例来说,若我们要依照 Sales 栏位的由大往小列出 Store_Information 表格中的资料,
Store_Information 表格
Store_Name | Sales | Txn_Date |
Los Angeles | 1500 | 05-Jan-1999 |
San Diego | 250 | 07-Jan-1999 |
San Francisco | 300 | 08-Jan-1999 |
Boston | 700 | 08-Jan-1999 |
我们就打入,
FROM Store_Information
ORDER BY Sales DESC;
结果:
Store_Name | Sales | Txn_Date |
Los Angeles | 1500 | Jan-05-1999 |
Boston | 700 | Jan-08-1999 |
San Francisco | 300 | Jan-08-1999 |
San Diego | 250 | Jan-07-1999 |
在以上的例子中,我们用栏位名来指定排列顺序的依据。除了栏位名外,我们也可以用栏位的顺序 (依据 SQL 句中的顺序)。在 SELECT 后的第一个栏位为 1,第二个栏位为 2,以此类推。在上面这个例子中,我们打以下这一句 SQL 可以达到完全一样的效果:
FROM Store_Information
ORDER BY 2 DESC;
3.函数(AVG,COUNT,MIN,MAX,SUM)
既然数据库中有许多资料都是已数字的型态存在,一个很重要的用途就是要能够对这些数字做一些运算,例如将它们总合起来,或是找出它们的平均值。SQL 有提供一些这一类的函数。它们是:
- AVG (平均)
- COUNT (计数)
- MAX (最大值)
- MIN (最小值)
- SUM (总合)
运用函数的语法是:
FROM "表格名";
举例来说,若我们要由我们的示范表格中求出 Sales 栏位的总合,
Store_Information 表格
Store_Name | Sales | Txn_Date |
Los Angeles | 1500 | 05-Jan-1999 |
San Diego | 250 | 07-Jan-1999 |
Los Angeles | 300 | 08-Jan-1999 |
Boston | 700 | 08-Jan-1999 |
我们就打入,
结果:
SUM(Sales) |
2750 |
COUNT 是函数之一。由于它的使用广泛,我们在这里特别提出来讨论。基本上,COUNT 让我们能够数出在表格中有多少笔资料被选出来。它的语法是:
FROM "表格名";
举例来说,若我们要找出我们的示范表格中有几笔 store_name 栏不是空白的资料时,
Store_Information 表格
Store_Name | Sales | Txn_Date |
Los Angeles | 1500 | 05-Jan-1999 |
San Diego | 250 | 07-Jan-1999 |
Los Angeles | 300 | 08-Jan-1999 |
Boston | 700 | 08-Jan-1999 |
我们就打入,
FROM Store_Information
WHERE Store_Name IS NOT NULL;
结果:
COUNT (Store_Name) |
4 |
"IS NOT NULL" 是 "这个栏位不是空白" 的意思。
COUNT 和 DISTINCT 经常被合起来使用,目的是找出表格中有多少笔不同的资料 (至于这些资料实际上是什么并不重要)。举例来说,如果我们要找出我们的表格中有多少个不同的 store_name,我们就打入,
FROM Store_Information;
结果:
COUNT (DISTINCT Store_Name) |
3 |
4.ORDER BY
如果我们的需求变成是要算出每一间店 (Store_Name) 的营业额 (Sales),那怎么办呢?在这个情况下,我们要做到两件事:第一,我们对于 Store_Name 及 Sales 这两个栏位都要选出。第二,我们需要确认所有的 Sales 都要依照各个 Store_Name 来分开算。这个语法为:
FROM "表格名"
GROUP BY "栏位1";
在我们的示范上,
Store_Information 表格
Store_Name | Sales | Txn_Date |
Los Angeles | 1500 | 05-Jan-1999 |
San Diego | 250 | 07-Jan-1999 |
Los Angeles | 300 | 08-Jan-1999 |
Boston | 700 | 08-Jan-1999 |
我们就打入,
FROM Store_Information
GROUP BY Store_Name;
结果:
Store_Name | SUM(Sales) |
Los Angeles | 1800 |
San Diego | 250 |
Boston | 700 |
5.HAVING
那我们如何对函数产生的值来设定条件呢?举例来说,我们可能只需要知道哪些店的营业额有超过 $1,500。在这个情况下,我们不能使用 WHERE 的指令。那要怎么办呢?很幸运地,SQL 有提供一个HAVING 的指令,而我们就可以用这个指令来达到这个目标。 HAVING 子句通常是在一个 SQL 句子的最后。一个含有 HAVING 子句的 SQL 并不一定要包含 GROUP BY 子句。HAVING 的语法如下:
FROM "表格名"
GROUP BY "栏位1"
HAVING (函数条件);
请读者注意: GROUP BY 子句并不是一定需要的。
在我们 Store_Information 表格这个例子中,
Store_Information 表格
Store_Name | Sales | Txn_Date |
Los Angeles | 1500 | 05-Jan-1999 |
San Diego | 250 | 07-Jan-1999 |
Los Angeles | 300 | 08-Jan-1999 |
Boston | 700 | 08-Jan-1999 |
我们打入,
FROM Store_Information
GROUP BY Store_Name
HAVING SUM(sales) > 1500;
结果:
Store_Name | SUM(Sales) |
Los Angeles | 1800 |
6.ALIAS(别名)
我们讨论 alias (别名) 在 SQL 上的用处。最常用到的别名有两种: 栏位别名及表格别名。
简单地来说,栏位别名的目的是为了让 SQL 产生的结果易读。在之前的例子中,每当我们有营业额总合时,栏位名都是 SUM(Sales)。 虽然在这个情况下没有什么问题,可是如果这个栏位不是一个简单的总合,而是一个复杂的计算,那栏位名就没有这么易懂了。若我们用栏位别名的话,就可以确认结果中的栏位名是简单易懂的。
第二种别名是表格别名。要给一个表格取一个别名,只要在 FROM 子句中的表格名后空一格,然后再列出要用的表格别名就可以了。这在我们要用 SQL 由数个不同的表格中获取资料时是很方便的。这一点我们在之后谈到连接 (join) 时会看到。
我们先来看一下栏位别名和表格别名的语法:
FROM "表格名" "表格别名";
基本上,这两种别名都是放在它们要替代的物件后面,而它们中间由一个空白分开。我们 继续使用Store_Information 这个表格来做例子:
Store_Information 表格
Store_Name | Sales | Txn_Date |
Los Angeles | 1500 | 05-Jan-1999 |
San Diego | 250 | 07-Jan-1999 |
Los Angeles | 300 | 08-Jan-1999 |
Boston | 700 | 08-Jan-1999 |
我们用跟 SQL GROUP BY 那一页 一样的例子。这里的不同处是我们加上了栏位别名以及表格别名:
FROM Store_Information A1
GROUP BY A1.Store_Name;
结果:
Store | Total Sales |
Los Angeles | 1800 |
San Diego | 250 |
Boston | 700 |
7.SQL连接
现在我们介绍连接 (Join) 的概念。要了解连接,我们需要用到许多我们之前已介绍过的指令。我们先假设我们有以下的两个表格,
Store_Information 表格
Store_Name | Sales | Txn_Date |
Los Angeles | 1500 | 05-Jan-1999 |
San Diego | 250 | 07-Jan-1999 |
Los Angeles | 300 | 08-Jan-1999 |
Boston | 700 | 08-Jan-1999 |
Geography 表格
Region_Name | Store_Name |
East | Boston |
East | New York |
West | Los Angeles |
West | San Diego |
而我们要知道每一区 (Region_Name) 的营业额 (Sales)。 Geography 这个表格告诉我们每一区有哪些店,而 Store_Information 告诉我们每一个店的营业额。若我们要知道每一区的营业额,我们需要将这两个不同表格中的资料串联起来。当我们仔细了解这两个表格后,我们会发现它们可经由一个相同的栏位,Store_Name,连接起来。我们先将 SQL 句列出,之后再讨论每一个子句的意义:
FROM Geography A1, Store_Information A2
WHERE A1.Store_Name = A2.Store_Name
GROUP BY A1.Region_Name;
结果:
REGION | SALES |
Eas | 700 |
West | 2050 |
在第一行中,我们告诉 SQL 去选出两个栏位:第一个栏位是 Geography 表格中的 Region_Name 栏位 (我们取了一个别名叫做 REGION);第二个栏位是 Store_Information 表格中的 Sales 栏位 (别名为 SALES)。请注意在这里我们有用到表格别名:Geography 表格的别名是 A1,Store_Information 表格的别名是 A2。若我们没有用表格别名的话, 第一行就会变成
很明显地,这就复杂多了。在这里我们可以看到表格别名的功用:它能让 SQL 句容易被了解,尤其是这个 SQL 句含盖好几个不同的表格时。
接下来我们看第三行,就是 WHERE 子句。 这是我们阐述连接条件的地方。在这里,我们要确认Geography 表格中 Store_Name 栏位的值与 Store_Information 表格中 Store_Name 栏位的值是相等的。这个 WHERE 子句是一个连接的灵魂人物,因为它的角色是确定两个表格之间的连接是正确的。如果WHERE 子句是错误的,我们就极可能得到一个笛卡儿连接 (Cartesian Join)。笛卡儿连接会造成我们得到所有两个表格每两行之间所有可能的组合。在这个例子中,笛卡儿连接会让我们得到 4 x 4 = 16 行的结果。