SELECT(7) | SQL Commands | SELECT(7) |
SELECT - 從表或視圖中取出若干行
SELECT [ ALL | DISTINCT [ ON ( expression [, ...] ) ] ]
* | expression [ AS output_name ] [, ...]
[ FROM from_item [, ...] ]
[ WHERE condition ]
[ GROUP BY expression [, ...] ]
[ HAVING condition [, ...] ]
[ { UNION | INTERSECT | EXCEPT } [ ALL ] select ]
[ ORDER BY expression [ ASC | DESC | USING operator ] [, ...] ]
[ LIMIT { count | ALL } ]
[ OFFSET start ]
[ FOR UPDATE [ OF table_name [, ...] ] ] where from_item can be one of:
[ ONLY ] table_name [ * ] [ [ AS ] alias [ ( column_alias [, ...] ) ] ]
( select ) [ AS ] alias [ ( column_alias [, ...] ) ]
function_name ( [ argument [, ...] ] ) [ AS ] alias [ ( column_alias [, ...] | column_definition [, ...] ) ]
function_name ( [ argument [, ...] ] ) AS ( column_definition [, ...] )
from_item [ NATURAL ] join_type from_item [ ON join_condition | USING ( join_column [, ...] ) ]
[Comment: FIXME: This last syntax is incorrect if the join type is an INNER or OUTER join (in which case one of NATURAL, ON ..., or USING ... is mandatory, not optional). What's the best way to fix this?]
SELECT 將從一個或更多表中返回記錄行。 SELECT 通常的處理如下:
你必須有 SELECT
權限用來從表中讀取數值。
使用 FOR UPDATE 還要求 UPDATE
權限。
FROM 子句爲 SELECT 聲明一個或者多個源表。 如果聲明瞭多個源表,那麼結果就是所有源表的笛卡兒積(交叉連接)。 但是通常我們會添加一些條件,把返回行限制成笛卡兒積的一個小的結果集。
FROM-子句可以包括:
之一。 就 INNER 和 OUTER
連接類型,
我們必須聲明一個連接條件,也就是說一個
NATURAL, ON join_condition, 或者 USING
(join_column [, ...])。
見下文獲取它們的含義,對於
CROSS
JOIN,這些子句都不能出現。
一個 JOIN
子句,組合了兩個 FROM
項。
必要時使用圓括弧以決定嵌套的順序。
如果沒有圓括弧,JOIN
的嵌套從左向右。
在任何情況下,JOIN
都比逗號分隔的 FROM
項綁定得更緊。
CROSS JOIN 和 INNER JOIN 生成一個簡單的笛卡兒積,和你在 FROM 的頂層列出兩個項的結果相同。 CROSS JOIN 等效於 INNER JOIN ON (true), 也就是說,沒有被條件刪除的行。這種連接類型只是符號上的方便, 因爲它們和你用簡單的 FROM 和 WHERE 乾的事情是一樣的。
LEFT OUTER JOIN 返回有條件的笛卡兒積(也就是說, 所有組合出來的行都通過了連接條件)中的行,加上左手邊的表中沒有對應的右手邊表的行可以一起匹配通過連接條件的那些行。 這樣的左手邊的行擴展成連接生成表的全長,方法是在那些右手邊表對應的字段位置填上空。請注意,只有在決定那些行是匹配的時候, 之計算 JOIN 子句自己的條件。外層的條件是在這之後施加的。
對應的是,RIGHT OUTER JOIN
返回所有連接出來的行,
加上每個不匹配的右手邊行(左邊用空值擴展)。這只是一個符號上的便利,因爲我們總是可以把它轉換成一個
LEFT OUTER JOIN,
只要把左邊和右邊的輸入對掉一下即可。
FULL OUTER JOIN 返回所有連接出來的行,加上每個不匹配的左手邊的行(右邊用空值擴展), 加上每個不匹配的右手邊的行(左邊用空值擴展)。
可選的 WHERE 條件有如下常見的形式:
WHERE condition
可選的 GROUP BY 子句的一般形式
GROUP BY expression [, ...]
GROUP BY 將把所有在組合了的表達式上共享同樣的值的行壓縮成一行。 expression 可以是一個輸入字段名字, 或者是一個輸入字段(SELECT 列表)的序號,或者也可以是任意從輸入字段值形成的任意表達式。 在有歧義的情況下,一個 GROUP BY 的名字將被解釋成輸入字段的名字,而不是輸出字段的名字。
如果使用了聚集函數,那麼就會對組成一組的所有行進行計算,爲每個組生成一個獨立的值(而如果沒有
GROUP BY,
那麼聚集對選出來的所有行計算出一個值)。如果出現了
GROUP BY, 那麼 SELECT
列表表達式中再引用那些沒有分組的字段就是非法的,
除非放在聚集函數裏,因爲對於未分組的字段,可能會返回多個數值。
可選的 HAVING 子句有如下形式:
HAVING condition
HAVING 去除了一些不滿足條件的組行。 HAVING 與 WHERE 不同: WHERE 在使用 GROUP BY 之前過濾出單獨的行,而 HAVING 過濾由 GROUP BY 創建的行。 在 condition 裏引用的每個字段都必須無歧義地引用一個分組的行,除非引用出現在一個聚集函數裏。
UNION 子句的一般形式是:
select_statement UNION [ ALL ] select_statement
UNION 操作符計算那些涉及到的所有 SELECT 語句返回的行的結果聯合。 一個行如果至少在兩個結果集中的一個裏面出現,那麼它就會在這兩個結果集的集合聯合中。 兩個做爲 UNION 直接操作數的SELECT必須生成相同數目的字段, 並且對應的字段必須有兼容的數據類型。
缺省地,UNION
的結果不包含任何重複的行,除非聲明瞭
ALL 子句。 ALL
制止了消除重複的動作。
同一SELECT語句中的多個 UNION
操作符是從左向右計算的,
除非用圓括弧進行了標識。
目前,FOR UPDATE 不能在 UNION
的結果或輸入中聲明。
INTERSECT 子句的一般形式是:
select_statement INTERSECT [ ALL ] select_statementselect_statement 是任何不帶 ORDER BY, LIMIT,或者 FOR UPDATE 子句的 SELECT 語句。
INTERSECT 計算涉及的 SELECT
語句返回的行的集合交集。
如果一個行在兩個結果集中都出現,那麼它就在兩個結果集的交集中。
NTERSECT
的結果不包含任何重複行,除非你聲明瞭
ALL 選項。 用了 ALL
以後,一個在左手邊的表裏有
m
個重複而在右手邊表裏有
n 個重複的行將出現 min(m,n)
次。
除非用圓括號指明順序,
同一 SELECT 語句中的多個
INTERSECT
操作符是從左向右計算的。
INTERSECT 比 UNION 綁定得更緊 ---
也就是說 A UNION B INTERSECT C
將讀做 A UNION (B INTERSECT
C),除非你用圓括弧聲明。
EXCEPT 子句有如下的通用形式:
select_statement EXCEPT [ ALL ] select_statement
EXCEPT 操作符計算存在於左邊SELECT 語句的輸出而不存在於右邊語句輸出的行。
EXCEPT 的結果不包含任何重複的行,除非聲明瞭 ALL 選項。 使用 ALL 時,一個在左手邊表中有 m 個重複而在右手邊表中有 n 個重複的行將出現 max(m-n,0) 次。
除非用圓括弧指明順序,同一
SELECT 語句中的多個 EXCEPT
操作符是從左向右計算的。
EXCEPT 和 UNION
綁定級別相同。
SELECT 列表(在關鍵字 SELECT 和 FROM) 之間的東西)聲明一個表達式,這個表達式形成 SELECT 語句的輸出行。這個表達式可以(通常也的確是)引用那些在 FROM 子句裏計算的字段。 通過使用 AS output_name, 我們可以爲一個輸出行聲明另外一個名字。這個名字主要用做顯示該行的標籤。 它也可以在 ORDER BY 和 GROUP BY 子句裏當作字段值的引用, 但是不能在 WHERE 或者 HAVING 子句裏這麼用;在那裏,你必須寫出表達式。
除了表達式之外,我們也可以在輸出列表上寫一個
*
表示選出的行的所有字段的縮寫。同樣,我們可以寫
table_name.*
作爲來自某個特定表的字段的縮寫。
可選的 ORDER BY 子句有下面的一般形式:
ORDER BY expression [ ASC | DESC | USING operator ] [, ...]expression 可以是一個輸出字段(SELECT 列表)的名字或者序號, 或者也可以是用輸入字段的數值組成的任意表達式。
ORDER BY 子句導致結果行根據指定的表達式進行排序。 如果根據最左邊的表達式,兩行的結果相同,那麼就根據下一個表達式進行比較, 依此類推。如果對於所有聲明的表達式他們都相同,那麼以隨機順序返回。
序數指的是列/字段按順序(從左到右)的位置。
這個特性讓我們可以對沒有唯一名稱的列/字段進行排序。
這一點從來不是必須的,
因爲總是可以通過 AS
子句給一個要計算的列/字段賦予一個名稱。
在 ORDER BY
裏還可以使用任意表達式,
包括那些沒有出現在SELECT結果列表裏面的字段。
因此下面的語句現在是合法的:
SELECT name FROM distributors ORDER BY code;
請注意如果一個 ORDER BY
表達式是一個簡單名稱,
同時匹配結果字段和輸入字段,
ORDER BY
將把它解釋成結果字段名稱。
這和 GROUP BY
在同樣情況下做的選擇正相反。
這樣的不一致是由 SQL
標準強制的。
我們可以給 ORDER BY
子句裏每個列/字段加一個關鍵字
DESC (降序)或
ASC(升序)。如果不聲明,
ASC 是缺省。
我們還可以在 USING
子句裏聲明一個排序操作符來實現排序。
ASC 等效於使用 USING < 而 DESC
等效於使用 USING >。 (But the creator
of a user-defined data type can define exactly what the default sort
ordering is, and it might correspond to operators with other names.)
在一個域裏,空值排序時排在其它數值前面。換句話說,升序排序時,
空值排在末尾,而降序排序時空值排在開頭。
字符類型的數據是按照區域相關的字符集順序排序的,這個區域是在數據庫集羣初始化的時候建立的。
LIMIT 子句由兩個獨立的子句組成:
LIMIT { count | ALL } OFFSET start
在使用 LIMIT 時,
一個好習慣是使用一個
ORDER BY
子句把結果行限制成一個唯一的順序。
否則你會得到無法預料的查詢返回的子集
---
你可能想要第十行到第二十行,
但以什麼順序?除非你聲明
ORDER
BY,否則你不知道什麼順序。
查詢優化器在生成查詢規劃時把
LIMIT 考慮進去了,
所以你很有可能因給出的
LIMIT 和 OFFSET
值不同而得到不同的規劃(生成不同的行序)。
因此用不同的 LIMIT/OFFSET
值選擇不同的查詢結果的子集將不會產生一致的結果,
除非你用 ORDER BY
強制生成一個可預計的結果順序。
這可不是毛病;這是 SQL
生來的特點,因爲除非用了
ORDER BY 約束順序, SQL
不保證查詢生成的結果有任何特定的順序。
如果聲明瞭 DISTINCT,那麼就從結果集中刪除所有重複的行(每個有重複的組都保留一行)。 ALL 聲明相反的作用:所有行都被保留;這個是缺省。
DISTINCT ON ( expression [, ...] ) 只保留那些在給出的表達式上運算出相同結果的行集合中的第一行。 DISTINCT ON 表達式是使用與 ORDER BY (見上文) 相同的規則進行解釋的。請注意,除非我們使用了 ORDER BY 來保證我們需要的行首先出現,否則,每個 "第一行" 是不可預測的。 比如,
SELECT DISTINCT ON (location) location, time, report
FROM weather_reports
ORDER BY location, time DESC;
DISTINCT ON
表達式必須匹配最左邊的
ORDER BY 表達式。 ORDER BY
子句將通常包含額外的表達式來判斷每個
DISTINCT ON
組裏面需要的行的優先級。
FOR UPDATE 子句有下面的形式
FOR UPDATE [ OF table_name [, ...] ]
FOR UPDATE 令那些被 SELECT 語句檢索出來的行被鎖住,就像要更新一樣。 這樣就避免它們在當前事務結束前被其它事務修改或者刪除; 也就是說,其它視圖 UPDATE,DELETE, 或者 SELECT FOR UPDATE 這些行的事務將被阻塞, 直到當前事務結束。同樣,如果一個來自其它事務的 UPDATE, DELETE,或者 SELECT FOR UPDATE 已經鎖住了某個或某些選定的行,SELECT FOR UPDATE 將等到那些事務結束, 並且將隨後鎖住並返回更新的行(或者不返回行,如果行已經被刪除)。更多的討論參閱 Chapter 12 ``Concurrency Control'' 。
如果特定的表在 FOR UPDATE
中,那麼只有來自這些表中的行才被鎖住;
任何在 SELECT
中使用的其它表都只是和平常一樣讀取。
FOR UPDATE 不能在那些無法使用獨立的表數據行清晰標識返回行的環境裏; 比如,它不能和聚集一起使用。
FOR UPDATE 可以在 LIMIT 前面出現, 主要是爲了和 7.3 之前的 PostgreSQL 兼容。 不過,它在 LIMIT 後面執行更高效,因此我們建議放在 LIMIT 後面。
將表 films 和表 distributors 連接在一起:
SELECT f.title, f.did, d.name, f.date_prod, f.kind
FROM distributors d, films f
WHERE f.did = d.did
title | did | name | date_prod | kind -------------------+-----+--------------+------------+----------
The Third Man | 101 | British Lion | 1949-12-23 | Drama
The African Queen | 101 | British Lion | 1951-08-11 | Romantic
...
統計用kind
分組的所有電影和組的列/字段的
len(長度)的和:
SELECT kind, sum(len) AS total FROM films GROUP BY kind;
kind | total ----------+-------
Action | 07:34
Comedy | 02:58
Drama | 14:28
Musical | 06:42
Romantic | 04:38
統計所有電影(films),組的列/字段
len(長度)的和,用 kind
分組並且顯示小於5小時的組總和:
SELECT kind, sum(len) AS total
FROM films
GROUP BY kind
HAVING sum(len) < interval '5 hours';
kind | total ----------+-------
Comedy | 02:58
Romantic | 04:38
下面兩個例子是根據第二列(name)的內容對單獨的結果排序的經典的方法:
SELECT * FROM distributors ORDER BY name; SELECT * FROM distributors ORDER BY 2;
did | name -----+------------------
109 | 20th Century Fox
110 | Bavaria Atelier
101 | British Lion
107 | Columbia
102 | Jean Luc Godard
113 | Luso films
104 | Mosfilm
103 | Paramount
106 | Toho
105 | United Artists
111 | Walt Disney
112 | Warner Bros.
108 | Westward
下面這個例子演示如何獲得表
distributors 和 actors的連接,
只將每個表中以字母 W
開頭的取出來。
因爲只取了不相關的行,所以關鍵字
ALL 被省略了:
distributors: actors:
did | name id | name -----+-------------- ----+----------------
108 | Westward 1 | Woody Allen
111 | Walt Disney 2 | Warren Beatty
112 | Warner Bros. 3 | Walter Matthau
... ... SELECT distributors.name
FROM distributors
WHERE distributors.name LIKE 'W%' UNION SELECT actors.name
FROM actors
WHERE actors.name LIKE 'W%';
name ----------------
Walt Disney
Walter Matthau
Warner Bros.
Warren Beatty
Westward
Woody Allen
這個例子顯示瞭如何在
FROM
子句中使用一個函數,
包括帶有和不帶字段定義列表的。
CREATE FUNCTION distributors(int) RETURNS SETOF distributors AS '
SELECT * FROM distributors WHERE did = $1; ´ LANGUAGE SQL; SELECT * FROM distributors(111);
did | name -----+-------------
111 | Walt Disney CREATE FUNCTION distributors_2(int) RETURNS SETOF record AS '
SELECT * FROM distributors WHERE did = $1; ´ LANGUAGE SQL; SELECT * FROM distributors_2(111) AS (f1 int, f2 text);
f1 | f2 -----+-------------
111 | Walt Disney
當然,SELECT 語句和 SQL 標準兼容。但是還有一些擴展和一些缺少的特性。
PostgreSQL 允許我們在一個查詢裏省略 FROM 子句。 它的最直接用途就是計算簡單的常量表達式的結果:
SELECT 2+2;
?column? ----------
4
這個特性的另外一個不太明顯的用途是把一個普通的從一個或多個表的
SELECT 縮寫:
SELECT distributors.* WHERE distributors.name = 'Westward';這樣也可以運行是因爲我們給 SELECT 中引用了但沒有在 FROM 中提到的每個表都加了一個隱含的 FROM 項。
did | name -----+----------
108 | Westward
儘管這是個很方便的寫法,但它卻容易誤用。
比如,下面的查詢
SELECT distributors.* FROM distributors d;可能就是個錯誤;用戶最有可能的意思是
SELECT d.* FROM distributors d;而不是下面的他實際上得到的無約束的連接
SELECT distributors.* FROM distributors d, distributors distributors;爲了幫助檢測這種錯誤, PostgreSQL 以及以後的版本將在你使用一條即有隱含 FROM 特性又有明確的 FROM 子句的查詢的時候給出警告。 Also, it is possible to disable the implicit-FROM feature by setting the ADD_MISSING_FROM parameter to false.
在 SQL 標準裏,可選的關鍵字 AS 是多餘的,可以忽略掉而不對語句產生任何影響。 PostgreSQL 分析器在重命名列/字段時需要這個關鍵字, 因爲類型擴展的特性會導致在這個環境裏的歧義。 不過,AS 在 FROM 項裏是可選的。
在 SQL92 標準裏,ORDER BY 子句只能使用結果字段名或者編號, 而 GROUP BY 子句只能用基於輸入字段名的表達式。 PostgreSQL 對這兩個子句都進行了擴展, 允許另外一種選擇(但是如果存在歧義,則使用標準的解釋)。 PostgreSQL 還允許兩個子句聲明任意的表達式。 請注意在表達式中出現的名字強總是被當作輸入字段名,而不是結果字段名。
SQL99 uses a slightly different definition which is not upward compatible with SQL92. In most cases, however, PostgreSQL will interpret an ORDER BY or GROUP BY expression the same way SQL99 does.
DISTINCT ON, LIMIT, 和 OFFSET 都沒有在 SQL 標準中定義。
Postgresql 中文網站 何偉平 <laser@pgsqldb.org>
本頁面中文版由中文
man 手冊頁計劃提供。
中文 man
手冊頁計劃:https://github.com/man-pages-zh/manpages-zh
2003-11-02 | SQL - Language Statements |