数据库复习笔记

来源:互联网 发布:大数据分析商业案例 编辑:程序博客网 时间:2024/06/11 23:45
 

数据库复习

 

第一章 概论
1、数据管理:对数据进行分类,组织,编码,存储,检索和维护,是数据处理的中心问题
2、数据库:存放数据的仓库,需要由一个软件系统统一管理,这个系统称为数据库管理系统
3、数据模型:数据特征的抽象,用来描述数据的一组概念和定义(数据结构,数据操作,数据的完整性约束),分为逻辑数据模型【用户所看到的数据模型】,物理数据模型【表示数据存储结构和存取方法】
4、数据库系统结构:一般划分为三个层次,称为三级模式,外模式,模式,内模式
模式-逻辑模式,是全体数据的逻辑结构和特征的描述,构成了数据库的一个总的框架
外模式-数据库用户能看见的局部数据的逻辑结构和特征的描述,外模式是模式的子集,一个数据库可以有多个外模式
内模式-存储模式,数据物理结构和存储方式的描述
外模式多个,内模式和模式只有一个,三级模式对数据三个抽象级别(视图级、概念级、物理级)
两级映像:外模式/模式映像 模式/内模式映像,一个模式对应多个外模式实现数据的逻辑独立性,一个模式对应一个内模式,提供数据物理独立性
5、数据库定义功能:模式定义语言【定义数据库全局逻辑结构】,外模式定义语言【定义用户的局部逻辑结构】,内模式定义语言【定义物理数据库的结构】
6、数据库人员分类:数据库管理员,系统分析员,应用程序员,用户
7、数据库管理系统主要功能:数据定义,数据操纵,数据保护,数据维护

第二章 数据模型
1、实体:客观存在并可相互区别的事物称为实体
2、属性:实体所具有的某一特征称为属性
3、联系:实体内部的联系【组成实体各属性之间的联系】,实体之间的联系【通常指不同实体集之间的联系】,两个实体集之间联系有1-1,1-n,m-n三种。多个实体集之间也可以存在有联系,称为多元联系
4、ER图:实体,属性和联系的方法。基数比约束,参与约束,实体参与度(实体参与联系的最小最大次数)
弱实体:这种实体的存在是依赖于其他实体而存在的
5、层次模型:用树型结构表示各类实体以及实体间的联系
6、关系模型:以关系为基础发展起来的【关系,属性,域,元组-对于实体集中的一个个体,键-唯一标识一个元组】

第三章 关系数据库
1、组成:数据模型【数据结构,数据操作,完整性约束】,关系数据结构、关系操作集合、关系完整性约束
2、域:一组具有相同数据类型的值的集合,关系中用域表示属性的取值范围
3、笛卡尔积:给定一组集合D1,D2,它们可以是相同的,D1*D2*...*Dn所有域的所有值的一个组合,不能重复
4、元组:笛卡尔积中的每一个元素叫做一个n元组
5、分量:笛卡尔积元素中的每一个值叫做一个分量
6、关系:D1*D2*..*Dn的任一个子集称为D1,D2...Dn上的一个关系,N叫做关系的目或度
7、关系模式:关系的型,对关系的描述,包括关系名、属性名、属性的类型和长度,以及属性固有的数据关联关系,关系是值,是元组的集合
8、关系数据库:关系模式的集合称为关系数据库模式
9、关系的键:唯一标识元组的属性或属性组称为关系的键,在一个关系中,如果有多个候选键,选其中一个作为主键
10、关系模型的三类完整性:实体完整性【指主键的值不能为空或部分为空】,参照完整性【对关系中作为外键的值的约束】,用户定义的完整性【针对某一具体关系数据库的约束条件】
11、关系的运算
并:由属于R或属于S的元组组成
差:由属于R而不属于S的所有元组组成
交:由既属于R又属于S的元组组成
笛卡尔积:元组的前n列是关系R的一个元组,后m列是关系S的一个元组
12、专门关系运算
选择:从关系中选择满足一定条件的元组子集
投影:从R中选择若干属性列组成新的关系
连接:把两个关系中的元组按条件连接起来,形成一个新关系,条件连接【不要求去掉重复列】,自然连接【要求把重复列去掉】
除运算:生成一个新的关系,新关系中的属性是R的属性中去掉与S具有公共域属性的其它属性
外连接:左外连接-包含关系R中不满足连接条件的元组 右外连接-包含了关系S中不满足连接条件的元组 完全外连接-包含关系R和S不满足连接条件的元组
13、关系数据语言
关系代数语言,关系演算语言【元组关系演算语言,域关系演算语言】,具有关系带上和关系演算双重特点的语言(SQL)

第五章 查询处理和查询优化
1、数据库查询语的具体处理过程:解释方式【每一次都重新解释执行查询语句,事务完成后返回查询结果】,编译方式【先进行编译处理,生成可执行代码,运行时直接执行可执行代码】
2、选择操作实现:顺序扫描方法,二分查找法,使用索引扫描方法,逻辑合取AND
3、连接操作的实现:嵌套循环法,索引嵌套循环法,排序合并法,散列连接法
4、查询优化技术:代数优化,基于存储路径的优化,基于代价估算的优化

第六章 数据库的安全性
1、定义:保护数据库,防止因用户非法使用数据库造成数据泄露、更改或破坏
2、三类计算机系统安全性问题:技术安全、管理安全、政策法律
3、存取控制:自主存取控制DAC 强制存取控制MAC
4、SQL Server的安全体系结构四个等级:客户机操作系统安全性,SQL Server的登录安全性,数据库的使用安全性,数据库对象的使用安全性
5、SQL验证阶段:验证阶段,许可确认阶段

第七章 数据库的完整性
1、定义:防止数据库中存在【不符合语义的数据,不正确的数据】,保证数据库中数据的质量
2、完整性约束条件:列级约束,元组约束,关系约束
3、声明式数据完整性:作为对象定义的一部分来定义数据必须达到的标准
4、过程式数据完整性:在脚本中定义数据必须达到的标准
5、实体完整性规则:主键的值不能取空值,主键的值唯一
6、触发器:一种特殊类型的存储过程,在对表或视图发出某些语句时自动执行,由数据库服务器自动执行,一个数据表上可能定义了多个触发器

第八章 数据库恢复技术
1、事务:用户定义的一个数据库操作序列,要么做要么不做,是一个不可分割的工作单位,事务处理技术主要包括数据库恢复技术和并发控制技术
2、事务特性:原子性【事务是数据库的逻辑工作单位】,一致性【使数据库从一个一致性状态变到另一个一致性状态】,隔离性【对并发执行而言,一个事务的执行不能被其他事务干扰】,持续性【一个事务一旦提交,对数据库中数据的改变应该永久性】
3、事务中止:由于系统原因无法成功执行处在中止状态
4、事务回滚:数据库恢复到事务执行前状态
5、事务状态:活动状态,部分提交状态,失败状态,终止状态,提交状态
6、系统故障:造成系统停止运转的任何事件
7、事务故障:某个事务在运行过程中由于种种原因未运行至正常终止点就夭折了
8、数据转储:DBA定期将数据库复制到磁带上保存起来的过程,方法【静态转储与动态转储,海量转储与增量转储】
9、检查点:记录在日志中表示数据库是否正常运行的一个标志,以记录所有当前活动的事务

第九章  并发控制
1、事务的四个特性:原子性【逻辑工作单位】,一致性【从一个一致性状态变到另一个一致性状态】,隔离性【一个事务不能被其他事务干扰】,持续性【一旦提交,改变是永久的】,ACID特性
2、并发操作带来的数据不一致性:丢失更新、不可重复读、读“脏”数据
3、冲突操作:不同的事务对同一数据的读写操作和写写操作,冲突可串行化调度是可串行化调度的充分条件,不是必要条件
4、并发控制技术:封锁【操作前先加锁,共享锁,排他锁】,时间戳,乐观控制法
5、活锁:在数据库中某个事务由于请求封锁,但总也得不到锁而长时间处于等待状态,避免:采用先来先服务策略
6、死锁:同时处于等待状态的两个或多个事务中相互封锁了对方请求的资源,没有任何一个事务可以获得足够的资源运行完毕
7、两阶段封锁协议:所有事务必须分两个阶段对数据项加锁和解锁,保证并发调度可串行性的封锁协议。第一个阶段是获得封锁,第二阶段是释放封锁
8、封锁粒度:封锁对象的大小,封锁对象可以是逻辑单元,也可以是物理单元
9、意向锁:对任一结点加基本锁,必须先对它的上层结点加意向锁

第十章 关系数据库设计理论
1、函数依赖:是现实世界属性间相互联系的抽象;是数据内在的性质,表示了关系中属性间的一种制约关系
2、范式:规范化的关系模式,关系数据库中的关系必须满足一定的要求,满足不同程度要求的为不同范式,1NF,2NF,3NF,BCNF,4NF
3、第一范式:关系模式R的每一个属性对应的域值都是不可再分的,称R属于第一范式
4、第二范式:R属于第一范式,所有非主属性都完全依赖于R的每个候选键
5、第三范式:R属于第一范式,R中没有非主属性传递依赖于R的候选键,一个2NF关系模式不一定属于3NF,3NF一定属于2NF
6、BCNF:R属于第一范式,而且R中没有任何属性传递依赖于R中的任一关键字,3NF不一定是BCNF
7、多值依赖:(X,Y,Z)对于X的每一个值,Y有一组值与之对应,而不论Z取何值
8、4NF:R属于第一范式,对于R上的任何一个非平凡的多值依赖X--Y,X是R的一个超键
9、关系模式规范化:一个低一级范式的关系模式,通过模式分解可以转换为若干个高一级范式的关系模式集合
10、Armstrong公理:自反律,增广律,传递律

第11章  数据库设计
1、数据库设计方法:需求分析-概念结构设计-逻辑结构设计-物理设计-数据库实施-数据库运行和维护
2、需求分析阶段:综合各个用户的应用需求
3、概念结构设计:形成独立于各个DBMS概念模式,四种方法【自顶向下,自底向下,逐步扩张,混合策略】
4、逻辑结构设计:形成数据库逻辑模式与外模式
5、物理结构设计:形成数据库内模式
6、客户/服务器(C/S):分布式系统结构
7、浏览器/服务器(B/S):多节点广域网应用系统
8、中间件:泛指能够屏蔽操作系统和网络差异,为异构环境之间提供通信服务的软件,主要中间件技术(ODBC,JDBC)

第13章 数据库的存储结构
1、定长记录的存储:如果记录中所有字段都是定长的,则称之为定长记录,记录存储在磁盘块中,而块是磁盘和内存之间传输数据的基本单位
2、变长记录的存储:记录的一个或多个字段的长度是可变的,称之为变长记录。
3、文件存储结构:顺序存储,链接存储
4、页面:数据库中使用的最小数据单元,8KB
5、盘区:8个连续的页面组成的数据结构,64KB

第17章 数据库新技术
1、面向对象数据库:既有DBMS特性,又具有面向对象的封装性、继承性、重载、复合对象和可扩充等特性
2、实时数据库:适用于处理不断更新的快速变化的数据及具有时间限制的事务处理
3、主动数据库:在传统数据库系统中嵌入事件-条件动作规则,自动检测
4、分布式数据库:将分散在各处的数据库系统通过计算机网络连接起来
5、并行数据库:将传统数据库管理技术与并行处理技术结合提供高性能【共享内存结构,共享磁盘结构,无共享资源结构】
6、空间数据库:用于表示空间物体的位置、形状,大小和分布特征等方面信息的数据
7、XML数据库:关系数据库方式,面向对象数据库方式,文本方式,XML数据库方式
8、数据仓库技术:从数据分析的角度将联机事务中的数据经过清理、转换并加载到数据仓库中,数据在数据仓库中被合理的组织和维护,特点【面向主题,集成的数据,数据不可更新,数据随时间不断变化,为了更好的支持制定决策】,分类【标准数据仓库,数据集市,多层数据仓库,联合式数据仓库】,架构【星型架构,雪花型架构(一个维度表分解为多个表,每个表都连接到主维度表)】
9、数据挖掘:数据库知识发现过程的一个步骤,包括数据准备【数据选择,数据预处理,数据转换】,数据挖掘,结果分析,知识的同化;知识分类【广义,关联,分类,预测型,偏差型】;常用技术【人工神经网络,决策树,遗传算法,近邻算法,规则推导】

2011年复试题目数据库题目:


关系代数有哪几种运算?
【传统集合运算,专门关系运算,基本运算】
T-SQL是什么编程语言?
【结构化查询语言】
关系模式(学号,课号,成绩)属性是否能为空?
【不能,否则无意义】
视图能提高数据库的安全性吗?
【可以】
解释XML,它是结构化语言还是非结构化语言?
【可扩展标记语言,用于标记电子文件使其具有结构性的标记语言,可以用来标记数据、定义数据类型,是一种允许用户对自己的标记语言进行定义的源语言,结构化语言】
动态SQL的概念是什么?
【预编译时能够动态改变语句正文,变量个数,数据类型等等的SQL语句】
数据库的安全性措施是什么?
【用户标识与鉴别,存取控制,视图机制,数据加密,数据库审计】
数据库中为什么要使用视图?
【提供逻辑数据独立性,简化用户视图,使用户以不同角度看待相同的数据,提供安全保护功能】
什么是意图锁?有哪几种意图锁?
【对任一结点加基本锁,必须先对它的上层结点加意向锁;分为意向共享锁,意向排它锁,共享意向排它锁】
数据库的三级模式是什么?
【内模式,模式,外模式】
如何确定一个关系模式?
【R(U,D,dom,F)其中R为关系名,U为组成该关系的属性名集合,D为属性组U中属性所来自的域,dom为属性向域的映象集合,F为属性间数据的依赖关系集合】
在对数据库做修改时,遇到系统故障,系统重启后是做撤销操作还是重做操作?
【撤销】
删除数据库的表用什么?
【delete table】
select语句中DISTINCT的功能?
【DISTINCT 用于返回唯一不同的值,SELECT DISTINCT 列名称 FROM 表名称】
什么是事物的原子性?
【事务的原子性指的是,事务中包含的程序作为数据库的逻辑工作单位,它所做的对数据修改操作要么全部执行,要么完全不执行。这种特性称为原子性】
数据库中可以进行表合并吗?
【马小蛇答案:如果这两个表有外键关联,那么就可以合并成宽表,如果没有,一般来说就不能合并了】

 

原创粉丝点击