3.4 数据查询
◆语句格式
3.4.1 单表查询
视频二维码(扫码观看)
◆查询仅涉及一个表
一、选择表中的若干列
1查询指定列
【例1】查询全体学生的学号与姓名。
SELECT Sno,Sname FROM Student;
【例2】查询全体学生的姓名、学号、所在系。
SELECT Sname,Sno,Sdept FROM Student;
2查询全部列
◆选出所有属性列:
在SELECT关键字后面列出所有列名,将<目标列表达式>指定为*
【例3】查询全体学生的详细记录。
SELECT Sno,Sname,Ssex,Sage,Sdept FROM Student;
或
SELECT * FROM Student;
3查询经过计算的值
◆SELECT子句的<目标列表达式>可以为:
(1)算术表达式
(2)字符串常量
(3)函数
(4)列别名
【例4】查全体学生的姓名及其出生年份。
SELECT Sname,2004-Sage /*假定当年的年份为2004年*/
FROM Student;
输出结果:
【例5】查询全体学生的姓名、出生年份和所有系,要求用小写字母表示所有系名
SELECT Sname,‘Year of Birth:’,2004-Sage,ISLOWER(Sdept) FROM Student;
输出结果:
◆使用列别名改变查询结果的列标题:
SELECT Sname NAME,‘Year of Birth:’BIRTH,2000-Sage BIRTHDAY,LOWER(Sdept)DEPARTMENT FROM Student;
输出结果:
二、选择表中的若干元组
1消除取值重复的行
如果没有指定DISTINCT关键词,则缺省为ALL。
【例6】查询选修了课程的学生学号。
SELECT Sno FROM SC;
等价于:
SELECT ALL Sno FROM SC;
执行上面的SELECT语句后,结果为:
Sno
200215121
200215121
200215121
200215122
200215122
◆指定DISTINCT关键词,去掉表中重复的行
SELECT DISTINCT Sno FROM SC;
执行结果:
Sno
200215121
200215122
2查询满足条件的元组
表3-4 常用的查询条件
(1)比较大小
【例7】查询计算机科学系全体学生的名单。
SELECT Sname FROM Student WHERE Sdept=‘CS’;
【例8】查询所有年龄在20岁以下的学生姓名及其年龄。
SELECT Sname,Sage FROM Student WHERE Sage<20;
【例9】查询考试成绩有不及格的学生的学号。
SELECT DISTINCT Sno FROM SC WHERE Grade<60;
(2)确定范围
◆谓词:
BETWEEN…AND…
NOT BETWEEN…AND…
【例10】查询年龄在20~23岁(包括20岁和23岁)之间的学生的姓名、系别和年龄。
SELECT Sname,Sdept,Sage FROM Student WHERE Sage BETWEEN 20 AND 23;
【例11】查询年龄不在20~23岁之间的学生姓名、系别和年龄。
SELECT Sname,Sdept,Sage FROM Student WHERE Sage NOT BETWEEN 20 AND 23;
(3)确定集合
◆谓词:IN<值表>,NOT IN<值表>
【例12】查询信息系(IS)、数学系(MA)和计算机科学系(CS)学生的姓名和性别。
SELECT Sname,Ssex FROM Student WHERE Sdept IN(‘IS’,‘MA’,‘CS’);
【例13】查询既不是信息系、数学系,也不是计算机科学系的学生的姓名和性别。
SELECT Sname,Ssex FROM Student WHERE Sdept NOT IN(‘IS’,‘MA’,‘CS’);
(4)字符匹配
◆谓词:[NOT] LIKE‘<匹配串>’[ESCAPE‘<换码字符>’]
①匹配串为固定字符串
【例14】查询学号为200215121的学生的详细情况。
SELECT * FROM Student WHERE Sno LIKE‘200215121’;
等价于:
SELECT * FROM Student WHERE Sno=‘200215121’;
②匹配串为含通配符的字符串
【例15】查询所有姓刘学生的姓名、学号和性别。
SELECT Sname,Sno,Ssex FROM Student WHERE Sname LIKE‘刘%’;
【例16】查询姓“欧阳”且全名为三个汉字的学生的姓名。
SELECT Sname FROM Student WHERE Sname LIKE‘欧阳__’;
【例17】查询名字中第2个字为“阳”字的学生的姓名和学号。
SELECT Sname,Sno FROM Student WHERE Sname LIKE‘__阳%’;
【例18】查询所有不姓刘的学生姓名。
SELECT Sname,Sno,Ssex FROM Student WHERE Sname NOT LIKE‘刘%’;
③使用换码字符将通配符转义为普通字符
【例19】查询DB_Design课程的课程号和学分。
SELECT Cno,Ccredit FROM Course WHERE Cname LIKE‘DB\_Design’ESCAPE‘\’;
【例20】查询以“DB_”开头,且倒数第3个字符为i的课程的详细情况。
SELECT * FROM Course WHERE Cname LIKE‘DB\_%i_ _’ESCAPE‘\’;
ESCAPE‘\’表示“\”为换码字符。
(5)涉及空值的查询
谓词:IS NULL或IS NOT NULL
“IS”不能用“=”代替
【例21】某些学生选修课程后没有参加考试,所以有选课记录,但没有考试成绩。查询缺少成绩的学生的学号和相应的课程号。
SELECT Sno,Cno FROM SC WHERE Grade IS NULL;
【例22】查所有有成绩的学生学号和课程号。
SELECT Sno,Cno FROM SC WHERE Grade IS NOT NULL;
(6)多重条件查询
◆逻辑运算符:AND和OR来联结多个查询条件
AND的优先级高于OR
可以用括号改变优先级
◆可用来实现多种其他谓词
[NOT] IN
[NOT] BETWEEN … AND …
【例23】查询计算机系年龄在20岁以下的学生姓名。
SELECT Sname FROM Student WHERE Sdept=‘CS’AND Sage<20;
【改写例12】查询信息系(IS)、数学系(MA)和计算机科学系(CS)学生的姓名和性别。
SELECT Sname,Ssex FROM Student WHERE Sdept IN(‘IS’,‘MA’,‘CS’);
可改写为:
SELECT Sname,Ssex FROM Student WHERE Sdept=‘IS’OR Sdept=‘MA’OR Sdept=‘CS’;
三、ORDER BY子句
ORDER BY子句可以按一个或多个属性列排序:
升序:ASC;
降序:DESC;
缺省值为升序。
当排序列含空值时:(控制默认为最大值)
ASC:排序列为空值的元组最后显示
DESC:排序列为空值的元组最先显示
【例24】查询选修了3号课程的学生的学号及其成绩,查询结果按分数降序排列。
SELECT Sno,Grade FROM SC WHERE Cno=‘3’ ORDER BY Grade DESC;
【例25】查询全体学生情况,查询结果按所在系的系号升序排列,同一系中的学生按年龄降序排列。
SELECT * FROM Student ORDER BY Sdept,Sage DESC;
四、聚集函数
1计数
COUNT([DISTINCT|ALL] *)
COUNT([DISTINCT|ALL] <列名>)
2计算总和
SUM([DISTINCT|ALL] <列名>)
3计算平均值
AVG([DISTINCT|ALL] <列名>)
4最大最小值
MAX([DISTINCT|ALL] <列名>)
MIN([DISTINCT|ALL] <列名>)
【例26】查询学生总人数。
SELECT COUNT(*) FROM Student;
【例27】查询选修了课程的学生人数。
SELECT COUNT(DISTINCT Sno) FROM SC;
【例28】计算1号课程的学生平均成绩。
SELECT AVG(Grade) FROM SC WHERE Cno=‘1’;
【例29】查询选修1号课程的学生最高分数。
SELECT MAX(Grade) FROM SC WHERE Cno=‘1’;
【例30】查询学生200215012选修课程的总学分数。
SELECT SUM(Ccredit) FROM SC,Course WHERE Sno=‘200215012’AND SC.Cno=Course.Cno;
五、GROUP BY子句
GROUP BY子句分组:细化聚集函数的作用对象
◆未对查询结果分组,聚集函数将作用于整个查询结果
◆对查询结果分组后,聚集函数将分别作用于每个组
◆作用对象是查询的中间结果表
◆按指定的一列或多列值分组,值相等的为一组
【例31】求各个课程号及相应的选课人数。
SELECT Cno,COUNT(Sno) FROM SC GROUP BY Cno;
查询结果:
【例32】查询选修了3门以上课程的学生学号。
SELECT Sno FROM SC GROUP BY Sno HAVING COUNT(*)>3;
HAVING短语与WHERE子句的区别:
◆作用对象不同;
◆WHERE子句作用于基表或视图,从中选择满足条件的元组;
◆HAVING短语作用于组,从中选择满足条件的组。
3.4.2 连接查询
视频二维码(扫码观看)
◆连接查询:同时涉及多个表的查询
◆连接条件或连接谓词:用来连接两个表的条件一般格式:
·[<表名1>]<列名1> <比较运算符> [<表名2>]<列名2>;
·[<表名1>]<列名1> BETWEEN [<表名2>]<列名2> AND [<表名2>]<列名3>;
◆连接字段:连接谓词中的列名称
·连接条件中的各连接字段类型必须是可比的,但名字不必是相同的
连接操作的执行过程
◆嵌套循环法(NESTED-LOOP)
·首先在表1中找到第一个元组,然后从头开始扫描表2,逐一查找满足连接件的元组,找到后就将表1中的第一个元组与该元组拼接起来,形成结果表中一个元组。
·表2全部查找完后,再找表1中第二个元组,然后再从头开始扫描表2,逐一查找满足连接条件的元组,找到后就将表1中的第二个元组与该元组拼接起来,形成结果表中一个元组。
·重复上述操作,直到表1中的全部元组都处理完毕。
◆排序合并法(SORT-MERGE)
常用于=连接
·首先按连接属性对表1和表2排序。
·对表1的第一个元组,从头开始扫描表2,顺序查找满足连接条件的元组,找到后就将表1中的第一个元组与该元组拼接起来,形成结果表中一个元组。当遇到表2中第一条大于表1连接字段值的元组时,对表2的查询不再继续。
·找到表1的第二条元组,然后从刚才的中断点处继续顺序扫描表2,查找满足连接条件的元组,找到后就将表1中的第一个元组与该元组拼接起来,形成结果表中一个元组。直接遇到表2中大于表1连接字段值的元组时,对表2的查询不再继续。
·重复上述操作,直到表1或表2中的全部元组都处理完毕为止。
◆索引连接(INDEX-JOIN)
·对表2按连接字段建立索引,对表1中的每个元组,依次根据其连接字段值查询。
·表2的索引,从中找到满足条件的元组,找到后就将表1中的第一个元组与该元组拼接起来,形成结果表中一个元组。
一、等值与非等值连接查询
◆等值连接
连接运算符为“=”
【例33】查询每个学生及其选修课程的情况
SELECT Student.*,SC.* FROM Student,SC WHERE Student.Sno=SC.Sno;
查询结果:
◆自然连接
【例34】对【例33】用自然连接完成。
SELECT Student.Sno,Sname,Ssex,Sage,Sdept,Cno,Grade FROM Student,SC WHERE Student.Sno=SC.Sno;
二、自身连接
◆自身连接:一个表与其自己进行连接
◆需要给表起别名以示区别
◆由于所有属性名都是同名属性,因此必须使用别名前缀
【例35】查询每一门课的间接先修课(即先修课的先修课)
SELECT FIRST.Cno,SECOND.Cpno FROM Course FIRST,Course SECOND WHERE FIRST.Cpno=SECOND.Cno;
FIRST表(Course表)
SECOND表(Course表)
查询结果:
三、外连接
◆外连接与普通连接的区别
·普通连接操作只输出满足连接条件的元组。
·外连接操作以指定表为连接主体,将主体表中不满足连接条件的元组一并输出。
【例36】改写【例33】
SELECT Student.Sno,Sname,Ssex,Sage,Sdept,Cno,Grade FROM Student LEFT OUT JOIN SC ON(Student.Sno=SC.Sno);
执行结果:
左外连接
·列出左边关系(如本例Student)中所有的元组
右外连接
·列出右边关系中所有的元组
四、复合条件连接
复合条件连接:WHERE子句中含多个连接条件。
【例37】查询选修2号课程且成绩在90分以上的所有学生。
【例38】查询每个学生的学号、姓名、选修的课程名及成绩。
3.4.3 嵌套查询
视频二维码(扫码观看)
◆嵌套查询概述
·一个SELECT-FROM-WHERE语句称为一个查询块。
·将一个查询块嵌套在另一个查询块的WHERE子句或HAVING短语的条件中的查询称为嵌套查询。
·子查询的限制:不能使用ORDER BY子句。
·层层嵌套方式反映了SQL语言的结构化。
·有些嵌套查询可以用连接运算替代。
嵌套查询求解方法
◆不相关子查询:子查询的查询条件不依赖于父查询。
·由里向外逐层处理。即每个子查询在上一级查询处理之前求解,子查询的结果用于建立其父查询的查找条件。
◆相关子查询:子查询的查询条件依赖于父查询。
·首先取外层查询中表的第一个元组,根据它与内层查询相关的属性值处理内层查询,若WHERE子句返回值为真,则取此元组放入结果表。
·然后再取外层表的下一个元组。
·重复这一过程,直至外层表全部检查完为止。
一、带有IN谓词的子查询
【例39】查询与“刘晨”在同一个系学习的学生。
此查询要求可以分步来完成
①确定“刘晨”所在系名
SELECT Sdept FROM Student WHERE Sname=‘刘晨’;
结果为:CS
②查找所有在CS系学习的学生。
SELECT Sno,Sname,Sdept FROM Student WHERE Sdept=‘CS’;
结果为:
将第一步查询嵌入到第二步查询的条件中
此查询为不相关子查询。
用自身连接完成【例39】查询要求。
【例40】查询选修了课程名为“信息系统”的学生学号和姓名。
用连接查询实现【例40】
二、带有比较运算符的子查询
当能确切知道内层查询返回单值时,可用比较运算符(>,<,=,>=,<=,!=或<>)。
与ANY或ALL谓词配合使用。
例:假设一个学生只可能在一个系学习,并且必须属于一个系,则在【例39】可以用=代替IN:
子查询一定要跟在比较符之后。
错误的例子:
【例41】找出每个学生超过他选修课程平均成绩的课程号。
可能的执行过程:
1.从外层查询中取出SC的一个元组x,将元组x的Sno值(200215121)传送给内层查询。
SELECT AVG(Grade) FROM SC y WHERE y.Sno=‘200215121’;
2.执行内层查询,得到值88(近似值),用该值代替内层查询,得到外层查询:
SELECT Sno,Cno FROM SC x WHERE Grade>=88;
3.执行这个查询,得到:
(200215121,1)
(200215121,3)
4.外层查询取出下一个元组重复做上述1至3步骤,直到外层的SC元组全部处理完毕。结果为:
(200215121,1)
(200215121,3)
(200215122,2)
三、带有ANY(SOME)或ALL谓词的子查询
谓词语义
·ANY:任意一个值
·ALL:所有值
需要配合使用比较运算符:
>ANY 大于子查询结果中的某个值;
>ALL 大于子查询结果中的所有值;
<ANY 小于子查询结果中的某个值;
<ALL 小于子查询结果中的所有值;
>=ANY 大于等于子查询结果中的某个值;
>=ALL 大于等于子查询结果中的所有值;
<=ANY 小于等于子查询结果中的某个值;
<=ALL 小于等于子查询结果中的所有值;
=ANY 等于子查询结果中的某个值;
=ALL 等于子查询结果中的所有值(通常没有实际意义);
!=(或<>)ANY 不等于子查询结果中的某个值;
!=(或<>)ALL 不等于子查询结果中的任何一个值。
【例42】查询其他系中比计算机科学某一学生年龄小的学生姓名和年龄。
结果:
执行过程:
(1)RDBMS执行此查询时,首先处理子查询,找出CS系中所有学生的年龄,构成一个集合(20,19);
(2)处理父查询,找所有不是CS系且年龄小于20或19的学生。
用聚集函数实现【例42】
【例43】查询其他系中比计算机科学系所有学生年龄都小的学生姓名及年龄。
方法一:用ALL谓词
方法二:用聚集函数
表3-5 ANY(或SOME)、ALL谓词与聚集函数、IN谓词的等价转换关系
四、带有EXISTS谓词的子查询
1EXISTS谓词
·存在量词∃。
·带有EXISTS谓词的子查询不返回任何数据,只产生逻辑真值“true”或逻辑假值“false”。
若内层查询结果非空,则外层的WHERE子句返回真值;
若内层查询结果为空,则外层的WHERE子句返回假值。
·由EXISTS引出的子查询,其目标列表达式通常都用*,因为带EXISTS的子查询只返回真值或假值,给出列名无实际意义。
2NOT EXISTS谓词
若内层查询结果非空,则外层的WHERE子句返回假值;
若内层查询结果为空,则外层的WHERE子句返回真值。
【例44】查询所有选修了1号课程的学生姓名。
思路分析:
·本查询涉及Student和SC关系;
·在Student中依次取每个元组的Sno值,用此值去检查SC关系;
·若SC中存在这样的元组,其Sno值等于此Student.Sno值,并且其Cno=‘1’,则取此Student.Sname送入结果关系。
用嵌套查询:
用连接运算:
【例45】查询没有选修1号课程的学生姓名。
◆不同形式的查询间的替换
·一些带EXISTS或NOT EXISTS谓词的子查询不能被其他形式的子查询等价替换;
·所有带IN谓词、比较运算符、ANY和ALL谓词的子查询都能用带EXISTS谓词的子查询等价替换。
◆用EXISTS/NOT EXISTS实现全称量词(难点)
SQL语言中没有全称量词∀(For all)。
可以把带有全称量词的谓词转换为等价的带有存在量词的谓词:(∀x)P≡¬(∃x(¬P))。
例:【例39】查询与“刘晨”在同一个系学习的学生。
可以用带EXISTS谓词的子查询替换:
【例46】查询选修了全部课程的学生姓名。
◆用EXISTS/NOT EXISTS实现逻辑蕴函(难点)
·SQL语言中没有蕴函(Implication)逻辑运算。
·可以利用谓词演算将逻辑蕴函谓词等价转换为:p→q≡¬p∨q。
【例47】查询至少选修了学生200215122选修的全部课程的学生号码。
解题思路:
·用逻辑蕴函表达:查询学号为x的学生,对所有的课程y,只要200215122学生选修了课程y,则x也选修了y。
·形式化表示:
用P表示谓词“学生200215122选修了课程”。
用q表示谓词“学生x选修了课程y”。
则上述查询为:(∀y)p→q。
·等价变换:
(∀y)p→q≡¬(∃y(¬(p→q))≡¬(∃y(¬(¬p∨q)))≡¬∃y(p∧¬q)。
·变换后语义:不存在这样的课程y,学生200215122选修了y,而学生x没有选。
用NOT EXISTS谓词表示:
3.4.4 集合查询
视频二维码(扫码观看)
集合操作的种类
·并操作UNION
·交操作INTERSECT
·差操作EXCEPT
参加集合操作的各查询结果的列数必须相同;对应项的数据类型也必须相同
【例48】查询计算机科学系的学生及年龄不大于19岁的学生。
方法一:
SELECT * FROM Student WHERE Sdept=‘CS’ UNION SELECT * FROM Student WHERE Sage<=19;
UNION:将多个查询结果合并起来时,系统自动去掉重复元组。
UNION ALL:将多个查询结果合并起来时,保留重复元组。
方法二:
SELECT DISTINCT * FROM Student WHERE Sdept=‘CS’OR Sage<=19;
【例49】查询选修了课程1或者选修了课程2的学生。
SELECT Sno FROM SC WHERE Cno=‘1’ UNION SELECT Sno FROM SC WHERE Cno=‘2’;
【例50】查询计算机科学系的学生与年龄不大于19岁的学生的交集。
SELECT * FROM Student WHERE Sdept=‘CS’ INTERSECT SELECT * FROM Student WHERE Sage<=19
上述例子实际上就是查询计算机科学系中年龄不大于19岁的学生。
SELECT * FROM Student WHERE Sdept=‘CS’AND Sage<=19;
【例51】查询选修课程1的学生集合与选修课程2的学生集合的交集。
SELECT Sno FROM SC WHERE Cno=‘1’ INTERSECT SELECT Sno FROM SC WHERE Cno=‘2’;
上述例子实际上是查询既选修了课程1又选修了课程2的学生。
SELECT Sno FROM SC WHERE Cno=‘1’ AND Sno IN (SELECT Sno FROM SC WHERE Cno=‘2’);
【例52】查询计算机科学系的学生与年龄不大于19岁的学生的差集。
SELECT * FROM Student WHERE Sdept=‘CS’ EXCEPT SELECT * FROM Student WHERE Sage<=19;
上述例子实际上是查询计算机科学系中年龄大于19岁的学生。
SELECT * FROM Student WHERE Sdept=‘CS’AND Sage>19;
3.4.5 SELECT语句的一般格式
视频二维码(扫码观看)