王珊《数据库系统概论》(第4版)【教材精讲+考研真题解析】讲义与视频课程【28小时高清视频】
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

3.4 数据查询

◆语句格式

3.4.1 单表查询

视频二维码(扫码观看)

◆查询仅涉及一个表

一、选择表中的若干列

1查询指定列

【例1】查询全体学生的学号与姓名。

SELECT Sno,Sname FROM Student;

【例2】查询全体学生的姓名、学号、所在系。

SELECT Sname,Sno,Sdept FROM Student;

2查询全部列

◆选出所有属性列:

在SELECT关键字后面列出所有列名,将<目标列表达式>指定为*

【例3】查询全体学生的详细记录。

SELECT Sno,Sname,Ssex,Sage,Sdept FROM Student;

SELECT * FROM Student;

3查询经过计算的值

◆SELECT子句的<目标列表达式>可以为:

(1)算术表达式

(2)字符串常量

(3)函数

(4)列别名

【例4】查全体学生的姓名及其出生年份。

SELECT Sname,2004-Sage /*假定当年的年份为2004年*/

FROM Student;

输出结果:

【例5】查询全体学生的姓名、出生年份和所有系,要求用小写字母表示所有系名

SELECT Sname,‘Year of Birth:’,2004-Sage,ISLOWER(Sdept) FROM Student;

输出结果:

◆使用列别名改变查询结果的列标题:

SELECT Sname NAME,‘Year of Birth:’BIRTH,2000-Sage BIRTHDAY,LOWER(Sdept)DEPARTMENT FROM Student;

输出结果:

二、选择表中的若干元组

1消除取值重复的行

如果没有指定DISTINCT关键词,则缺省为ALL。

【例6】查询选修了课程的学生学号。

SELECT Sno FROM SC;

等价于:

SELECT ALL Sno FROM SC;

执行上面的SELECT语句后,结果为:

Sno

200215121

200215121

200215121

200215122

200215122

◆指定DISTINCT关键词,去掉表中重复的行

SELECT DISTINCT Sno FROM SC;

执行结果:

Sno

200215121

200215122

2查询满足条件的元组

表3-4 常用的查询条件

(1)比较大小

【例7】查询计算机科学系全体学生的名单。

SELECT Sname FROM Student WHERE Sdept=‘CS’;

【例8】查询所有年龄在20岁以下的学生姓名及其年龄。

SELECT Sname,Sage FROM Student WHERE Sage<20;

【例9】查询考试成绩有不及格的学生的学号。

SELECT DISTINCT Sno FROM SC WHERE Grade<60;

(2)确定范围

◆谓词:

BETWEEN…AND…

NOT BETWEEN…AND…

【例10】查询年龄在20~23岁(包括20岁和23岁)之间的学生的姓名、系别和年龄。

SELECT Sname,Sdept,Sage FROM Student WHERE Sage BETWEEN 20 AND 23;

【例11】查询年龄不在20~23岁之间的学生姓名、系别和年龄。

SELECT Sname,Sdept,Sage FROM Student WHERE Sage NOT BETWEEN 20 AND 23;

(3)确定集合

◆谓词:IN<值表>,NOT IN<值表>

【例12】查询信息系(IS)、数学系(MA)和计算机科学系(CS)学生的姓名和性别。

SELECT Sname,Ssex FROM Student WHERE Sdept IN(‘IS’,‘MA’,‘CS’);

【例13】查询既不是信息系、数学系,也不是计算机科学系的学生的姓名和性别。

SELECT Sname,Ssex FROM Student WHERE Sdept NOT IN(‘IS’,‘MA’,‘CS’);

(4)字符匹配

◆谓词:[NOT] LIKE‘<匹配串>’[ESCAPE‘<换码字符>’]

匹配串为固定字符串

【例14】查询学号为200215121的学生的详细情况。

SELECT * FROM Student WHERE Sno LIKE‘200215121’;

等价于:

SELECT * FROM Student WHERE Sno=‘200215121’;

匹配串为含通配符的字符串

【例15】查询所有姓刘学生的姓名、学号和性别。

SELECT Sname,Sno,Ssex FROM Student WHERE Sname LIKE‘刘%’;

【例16】查询姓“欧阳”且全名为三个汉字的学生的姓名。

SELECT Sname FROM Student WHERE Sname LIKE‘欧阳__’;

【例17】查询名字中第2个字为“阳”字的学生的姓名和学号。

SELECT Sname,Sno FROM Student WHERE Sname LIKE‘__阳%’;

【例18】查询所有不姓刘的学生姓名。

SELECT Sname,Sno,Ssex FROM Student WHERE Sname NOT LIKE‘刘%’;

使用换码字符将通配符转义为普通字符

【例19】查询DB_Design课程的课程号和学分。

SELECT Cno,Ccredit FROM Course WHERE Cname LIKE‘DB\_Design’ESCAPE‘\’;

【例20】查询以“DB_”开头,且倒数第3个字符为i的课程的详细情况。

SELECT * FROM Course WHERE Cname LIKE‘DB\_%i_ _’ESCAPE‘\’;

ESCAPE‘\’表示“\”为换码字符。

(5)涉及空值的查询

谓词:IS NULL或IS NOT NULL

“IS”不能用“=”代替

【例21】某些学生选修课程后没有参加考试,所以有选课记录,但没有考试成绩。查询缺少成绩的学生的学号和相应的课程号。

SELECT Sno,Cno FROM SC WHERE Grade IS NULL;

【例22】查所有有成绩的学生学号和课程号。

SELECT Sno,Cno FROM SC WHERE Grade IS NOT NULL;

(6)多重条件查询

◆逻辑运算符:AND和OR来联结多个查询条件

AND的优先级高于OR

可以用括号改变优先级

◆可用来实现多种其他谓词

[NOT] IN

[NOT] BETWEEN … AND …

【例23】查询计算机系年龄在20岁以下的学生姓名。

SELECT Sname FROM Student WHERE Sdept=‘CS’AND Sage<20;

【改写例12】查询信息系(IS)、数学系(MA)和计算机科学系(CS)学生的姓名和性别。

SELECT Sname,Ssex FROM Student WHERE Sdept IN(‘IS’,‘MA’,‘CS’);

可改写为:

SELECT Sname,Ssex FROM Student WHERE Sdept=‘IS’OR Sdept=‘MA’OR Sdept=‘CS’;

三、ORDER BY子句

ORDER BY子句可以按一个或多个属性列排序:

升序:ASC;

降序:DESC;

缺省值为升序。

当排序列含空值时:(控制默认为最大值)

ASC:排序列为空值的元组最后显示

DESC:排序列为空值的元组最先显示

【例24】查询选修了3号课程的学生的学号及其成绩,查询结果按分数降序排列。

SELECT Sno,Grade FROM SC WHERE Cno=‘3’ ORDER BY Grade DESC;

【例25】查询全体学生情况,查询结果按所在系的系号升序排列,同一系中的学生按年龄降序排列。

SELECT * FROM Student ORDER BY Sdept,Sage DESC;

四、聚集函数

1计数

COUNT([DISTINCT|ALL] *)

COUNT([DISTINCT|ALL] <列名>)

2计算总和

SUM([DISTINCT|ALL] <列名>)

3计算平均值

AVG([DISTINCT|ALL] <列名>)

4最大最小值

MAX([DISTINCT|ALL] <列名>)

MIN([DISTINCT|ALL] <列名>)

【例26】查询学生总人数。

SELECT COUNT(*) FROM Student;

【例27】查询选修了课程的学生人数。

SELECT COUNT(DISTINCT Sno) FROM SC;

【例28】计算1号课程的学生平均成绩。

SELECT AVG(Grade) FROM SC WHERE Cno=‘1’;

【例29】查询选修1号课程的学生最高分数。

SELECT MAX(Grade) FROM SC WHERE Cno=‘1’;

【例30】查询学生200215012选修课程的总学分数。

SELECT SUM(Ccredit) FROM SC,Course WHERE Sno=‘200215012’AND SC.Cno=Course.Cno;

五、GROUP BY子句

GROUP BY子句分组:细化聚集函数的作用对象

◆未对查询结果分组,聚集函数将作用于整个查询结果

◆对查询结果分组后,聚集函数将分别作用于每个组

◆作用对象是查询的中间结果表

◆按指定的一列或多列值分组,值相等的为一组

【例31】求各个课程号及相应的选课人数。

SELECT Cno,COUNT(Sno) FROM SC GROUP BY Cno;

查询结果:

【例32】查询选修了3门以上课程的学生学号。

SELECT Sno FROM SC GROUP BY Sno HAVING COUNT(*)>3;

HAVING短语与WHERE子句的区别:

◆作用对象不同;

◆WHERE子句作用于基表或视图,从中选择满足条件的元组;

◆HAVING短语作用于组,从中选择满足条件的组。

3.4.2 连接查询

视频二维码(扫码观看)

◆连接查询:同时涉及多个表的查询

◆连接条件或连接谓词:用来连接两个表的条件一般格式:

·[<表名1>]<列名1> <比较运算符> [<表名2>]<列名2>;

·[<表名1>]<列名1> BETWEEN [<表名2>]<列名2> AND [<表名2>]<列名3>;

◆连接字段:连接谓词中的列名称

·连接条件中的各连接字段类型必须是可比的,但名字不必是相同的

连接操作的执行过程

◆嵌套循环法(NESTED-LOOP)

·首先在表1中找到第一个元组,然后从头开始扫描表2,逐一查找满足连接件的元组,找到后就将表1中的第一个元组与该元组拼接起来,形成结果表中一个元组。

·表2全部查找完后,再找表1中第二个元组,然后再从头开始扫描表2,逐一查找满足连接条件的元组,找到后就将表1中的第二个元组与该元组拼接起来,形成结果表中一个元组。

·重复上述操作,直到表1中的全部元组都处理完毕。

◆排序合并法(SORT-MERGE)

常用于=连接

·首先按连接属性对表1和表2排序。

·对表1的第一个元组,从头开始扫描表2,顺序查找满足连接条件的元组,找到后就将表1中的第一个元组与该元组拼接起来,形成结果表中一个元组。当遇到表2中第一条大于表1连接字段值的元组时,对表2的查询不再继续。

·找到表1的第二条元组,然后从刚才的中断点处继续顺序扫描表2,查找满足连接条件的元组,找到后就将表1中的第一个元组与该元组拼接起来,形成结果表中一个元组。直接遇到表2中大于表1连接字段值的元组时,对表2的查询不再继续。

·重复上述操作,直到表1或表2中的全部元组都处理完毕为止。

◆索引连接(INDEX-JOIN)

·对表2按连接字段建立索引,对表1中的每个元组,依次根据其连接字段值查询。

·表2的索引,从中找到满足条件的元组,找到后就将表1中的第一个元组与该元组拼接起来,形成结果表中一个元组。

一、等值与非等值连接查询

◆等值连接

连接运算符为“=”

【例33】查询每个学生及其选修课程的情况

SELECT Student.*,SC.* FROM Student,SC WHERE Student.Sno=SC.Sno;

查询结果:

◆自然连接

【例34】【例33】用自然连接完成。

SELECT Student.Sno,Sname,Ssex,Sage,Sdept,Cno,Grade FROM Student,SC WHERE Student.Sno=SC.Sno;

二、自身连接

◆自身连接:一个表与其自己进行连接

◆需要给表起别名以示区别

◆由于所有属性名都是同名属性,因此必须使用别名前缀

【例35】查询每一门课的间接先修课(即先修课的先修课)

SELECT FIRST.Cno,SECOND.Cpno FROM Course FIRST,Course SECOND WHERE FIRST.Cpno=SECOND.Cno;

FIRST表(Course表)

SECOND表(Course表)

查询结果:

三、外连接

◆外连接与普通连接的区别

·普通连接操作只输出满足连接条件的元组。

·外连接操作以指定表为连接主体,将主体表中不满足连接条件的元组一并输出。

【例36】改写【例33】

SELECT Student.Sno,Sname,Ssex,Sage,Sdept,Cno,Grade FROM Student LEFT OUT JOIN SC ON(Student.Sno=SC.Sno);

执行结果:

左外连接

·列出左边关系(如本例Student)中所有的元组

右外连接

·列出右边关系中所有的元组

四、复合条件连接

复合条件连接:WHERE子句中含多个连接条件。

【例37】查询选修2号课程且成绩在90分以上的所有学生。

【例38】查询每个学生的学号、姓名、选修的课程名及成绩。

3.4.3 嵌套查询

视频二维码(扫码观看)

◆嵌套查询概述

·一个SELECT-FROM-WHERE语句称为一个查询块。

·将一个查询块嵌套在另一个查询块的WHERE子句或HAVING短语的条件中的查询称为嵌套查询。

·子查询的限制:不能使用ORDER BY子句。

·层层嵌套方式反映了SQL语言的结构化。

·有些嵌套查询可以用连接运算替代。

嵌套查询求解方法

◆不相关子查询:子查询的查询条件不依赖于父查询。

·由里向外逐层处理。即每个子查询在上一级查询处理之前求解,子查询的结果用于建立其父查询的查找条件。

◆相关子查询:子查询的查询条件依赖于父查询。

·首先取外层查询中表的第一个元组,根据它与内层查询相关的属性值处理内层查询,若WHERE子句返回值为真,则取此元组放入结果表。

·然后再取外层表的下一个元组。

·重复这一过程,直至外层表全部检查完为止。

一、带有IN谓词的子查询

【例39】查询与“刘晨”在同一个系学习的学生。

此查询要求可以分步来完成

确定“刘晨”所在系名

SELECT Sdept FROM Student WHERE Sname=‘刘晨’;

结果为:CS

查找所有在CS系学习的学生。

SELECT Sno,Sname,Sdept FROM Student WHERE Sdept=‘CS’;

结果为:

将第一步查询嵌入到第二步查询的条件中

此查询为不相关子查询。

用自身连接完成【例39】查询要求。

【例40】查询选修了课程名为“信息系统”的学生学号和姓名。

用连接查询实现【例40】

二、带有比较运算符的子查询

当能确切知道内层查询返回单值时,可用比较运算符(>,<,=,>=,<=,!=或<>)。

与ANY或ALL谓词配合使用。

例:假设一个学生只可能在一个系学习,并且必须属于一个系,则在【例39】可以用=代替IN:

子查询一定要跟在比较符之后。

错误的例子:

【例41】找出每个学生超过他选修课程平均成绩的课程号。

可能的执行过程:

1.从外层查询中取出SC的一个元组x,将元组x的Sno值(200215121)传送给内层查询。

SELECT AVG(Grade) FROM SC y WHERE y.Sno=‘200215121’;

2.执行内层查询,得到值88(近似值),用该值代替内层查询,得到外层查询:

SELECT Sno,Cno FROM SC x WHERE Grade>=88;

3.执行这个查询,得到:

(200215121,1)

(200215121,3)

4.外层查询取出下一个元组重复做上述1至3步骤,直到外层的SC元组全部处理完毕。结果为:

(200215121,1)

(200215121,3)

(200215122,2)

三、带有ANY(SOME)或ALL谓词的子查询

谓词语义

·ANY:任意一个值

·ALL:所有值

需要配合使用比较运算符:

>ANY 大于子查询结果中的某个值;

>ALL 大于子查询结果中的所有值;

<ANY 小于子查询结果中的某个值;

<ALL 小于子查询结果中的所有值;

>=ANY 大于等于子查询结果中的某个值;

>=ALL 大于等于子查询结果中的所有值;

<=ANY 小于等于子查询结果中的某个值;

<=ALL 小于等于子查询结果中的所有值;

=ANY 等于子查询结果中的某个值;

=ALL 等于子查询结果中的所有值(通常没有实际意义);

!=(或<>)ANY 不等于子查询结果中的某个值;

!=(或<>)ALL 不等于子查询结果中的任何一个值。

【例42】查询其他系中比计算机科学某一学生年龄小的学生姓名和年龄。

结果:

执行过程:

(1)RDBMS执行此查询时,首先处理子查询,找出CS系中所有学生的年龄,构成一个集合(20,19);

(2)处理父查询,找所有不是CS系且年龄小于20或19的学生。

用聚集函数实现【例42】

【例43】查询其他系中比计算机科学系所有学生年龄都小的学生姓名及年龄。

方法一:用ALL谓词

方法二:用聚集函数

表3-5 ANY(或SOME)、ALL谓词与聚集函数、IN谓词的等价转换关系

四、带有EXISTS谓词的子查询

1EXISTS谓词

·存在量词∃。

·带有EXISTS谓词的子查询不返回任何数据,只产生逻辑真值“true”或逻辑假值“false”。

若内层查询结果非空,则外层的WHERE子句返回真值;

若内层查询结果为空,则外层的WHERE子句返回假值。

·由EXISTS引出的子查询,其目标列表达式通常都用*,因为带EXISTS的子查询只返回真值或假值,给出列名无实际意义。

2NOT EXISTS谓词

若内层查询结果非空,则外层的WHERE子句返回假值;

若内层查询结果为空,则外层的WHERE子句返回真值。

【例44】查询所有选修了1号课程的学生姓名。

思路分析:

·本查询涉及Student和SC关系;

·在Student中依次取每个元组的Sno值,用此值去检查SC关系;

·若SC中存在这样的元组,其Sno值等于此Student.Sno值,并且其Cno=‘1’,则取此Student.Sname送入结果关系。

用嵌套查询:

用连接运算:

【例45】查询没有选修1号课程的学生姓名。

◆不同形式的查询间的替换

·一些带EXISTS或NOT EXISTS谓词的子查询不能被其他形式的子查询等价替换;

·所有带IN谓词、比较运算符、ANY和ALL谓词的子查询都能用带EXISTS谓词的子查询等价替换。

◆用EXISTS/NOT EXISTS实现全称量词(难点)

SQL语言中没有全称量词∀(For all)。

可以把带有全称量词的谓词转换为等价的带有存在量词的谓词:(∀x)P≡¬(∃x(¬P))。

例:【例39】查询与“刘晨”在同一个系学习的学生。

可以用带EXISTS谓词的子查询替换:

【例46】查询选修了全部课程的学生姓名。

◆用EXISTS/NOT EXISTS实现逻辑蕴函(难点)

·SQL语言中没有蕴函(Implication)逻辑运算。

·可以利用谓词演算将逻辑蕴函谓词等价转换为:p→q≡¬p∨q。

【例47】查询至少选修了学生200215122选修的全部课程的学生号码。

解题思路:

·用逻辑蕴函表达:查询学号为x的学生,对所有的课程y,只要200215122学生选修了课程y,则x也选修了y。

·形式化表示:

用P表示谓词“学生200215122选修了课程”。

用q表示谓词“学生x选修了课程y”。

则上述查询为:(∀y)p→q。

·等价变换:

(∀y)p→q≡¬(∃y(¬(p→q))≡¬(∃y(¬(¬p∨q)))≡¬∃y(p∧¬q)。

·变换后语义:不存在这样的课程y,学生200215122选修了y,而学生x没有选。

用NOT EXISTS谓词表示:

3.4.4 集合查询

视频二维码(扫码观看)

集合操作的种类

·并操作UNION

·交操作INTERSECT

·差操作EXCEPT

参加集合操作的各查询结果的列数必须相同;对应项的数据类型也必须相同

【例48】查询计算机科学系的学生及年龄不大于19岁的学生。

方法一:

SELECT * FROM Student WHERE Sdept=‘CS’ UNION SELECT * FROM Student WHERE Sage<=19;

UNION:将多个查询结果合并起来时,系统自动去掉重复元组。

UNION ALL:将多个查询结果合并起来时,保留重复元组。

方法二:

SELECT DISTINCT * FROM Student WHERE Sdept=‘CS’OR Sage<=19;

【例49】查询选修了课程1或者选修了课程2的学生。

SELECT Sno FROM SC WHERE Cno=‘1’ UNION SELECT Sno FROM SC WHERE Cno=‘2’;

【例50】查询计算机科学系的学生与年龄不大于19岁的学生的交集。

SELECT * FROM Student WHERE Sdept=‘CS’ INTERSECT SELECT * FROM Student WHERE Sage<=19

上述例子实际上就是查询计算机科学系中年龄不大于19岁的学生。

SELECT * FROM Student WHERE Sdept=‘CS’AND Sage<=19;

【例51】查询选修课程1的学生集合与选修课程2的学生集合的交集。

SELECT Sno FROM SC WHERE Cno=‘1’ INTERSECT SELECT Sno FROM SC WHERE Cno=‘2’;

上述例子实际上是查询既选修了课程1又选修了课程2的学生。

SELECT Sno FROM SC WHERE Cno=‘1’ AND Sno IN (SELECT Sno FROM SC WHERE Cno=‘2’);

【例52】查询计算机科学系的学生与年龄不大于19岁的学生的差集。

SELECT * FROM Student WHERE Sdept=‘CS’ EXCEPT SELECT * FROM Student WHERE Sage<=19;

上述例子实际上是查询计算机科学系中年龄大于19岁的学生。

SELECT * FROM Student WHERE Sdept=‘CS’AND Sage>19;

3.4.5 SELECT语句的一般格式

视频二维码(扫码观看)