计算机四级考试~数据库工程师
考试时间:90分钟
考试科目:操作系统+数据库原理
题型:60个单选+20个多选,其中操作系统(30个单选+10个多选),数据库原理(30个单选+10个多选)
单选题一题一分,多选题一题两分(多选题每题5个选项,选择其中的正确选项)
这是计算机四级考试~数据库工程师——操作系统部分的高频考点:https://blog.csdn.net/weixin_45238761/article/details/111382999

今天介绍的是数据库原理部分
高频考点
数据与信息的关系:
数据=信息+数据冗余
数据是描述现实世界的符号记录;
数据是信息的符号表示、载体;
信息是数据的内涵、语义解释;
信息通过数据进行描述。
可以这么理解,大学咱们参加部门活动,要写新闻稿,新闻稿是描述某一活动的官方流程,所有可以把数据看成“新闻稿”,信息看成是“活动过程”
举个例子:“数据是信息的符号表示、载体”~举办了某一场活动,需要以新闻稿的方式,给更多的同学、老师了解这个事情,所以是载体。

  1. 数据库中的数据称为数据字典(X)
  2. 不是数据库技术研究领域:数据库存储设备的研究
  3. 用户数据+系统数据=数据字典(X)
  4. 常用的逻辑结构:层次模型、网状模型、关系模型(这三种是传统模型)、面向对象模型、对象关系模型(这两种是新型模型)
  5. 基本操作:并、差、笛卡尔积、投影、选择
  6. 概念层模型是数据库概念模型的基础(不是物理模型)
  7. E-R图冲突:属性冲突、结构冲突、命名冲突
  8. 两大操作类型:检索和修改(insert、update、delete)
  9. 面向对象模型:即是概念模型,又是逻辑模型
  10. 关系数据语言:关系代数语言、关系演算语言,兼具两者双重特点的语言 (共同的特点:完备的表达能力,是非过程化的结构操作语言)
  11. 概念层模型是现实世界到信息世界的语义抽象。(不是语法抽象)
  12. 一个应用程序只能使用一个外模式;三级抽象模型是数据字典的最基本的内容。
  13. 关系代数比关系演算具有更强的表达能力(X)
  14. 顺序索引支持~点查询、范围查询;散列索引支持点查询,不支持范围查询(注意区分)
  15. 投影运算~交(倒过来的U),没有分配律
  16. 半连接查询不可交换
  17. 半连接查询——分布式查询更有效一些
  18. 系统不用协调SQL和主语言不同处理权限
  19. 包含在任何一个候选码中的属性称为主属性
  20. 1:n联系——与n端实体合并(不是和1端实体合并)
  21. 分布式数据库系统 -> 分片技术~水平或垂直 原则 可重构、完备性、不相交
  22. 自主安全性机制用于向用户授予特权(不是权限)
  23. SQL99:含有面向对象的特征、行类型对应于元组构造器、用户自定义类型可用于属性类型、也可用于指定表的行类型。
  24. ACID 原子性——故障恢复机制;一致性——应用程序员,DBMS是用于事务的隔离来保持一致性;隔离性——并发控制持久性——故障恢复机制。
  25. 关系操作的操作方式是一次一个记录(X)
  26. 散列索引——散列函数——除余法
  27. 最常用的联机存储设备~磁盘存储器(无磁带存储器)
  28. 概念层模型是语义抽象
  29. 被参照与参照关系是1:n的联系
  30. 视图:一个虚表,对视图的一切操作转换成对导出它的基本表的操作。
  31. 可移植性保护——DBMS必须要做的
  32. 关系语言的特点:高度非过程化
  33. 数据审计~以检查某一特定时间内所以应用于数据库的访问和操作等。
  34. 分解符号无损连接~BCNF
  35. 启发式规则~逻辑查询
  36. Armstron公理系统的自发律、增广律、传递率以及推到出来的合并规则、伪传递率、分解规则,这6个记得理解性记忆哦~


1.关系模型中数据的逻辑结构是一张二维表。(不是物理结构)
2.关系演算比关系代数具有更强的表达能力。
3.DBMS不可以直接处理基于非结构化复杂对象的值的选择条件及其他操作。
4.模式是数据库中全体数据的逻辑结构和特征的描述,是所有用户的公共数据视图,即模式实际上是数据库数据的逻辑视图,逻辑模式的基础是数据模型。
5.SQL语言提供预定义的数据类型,除此之外,用户可以自行定义自己专用的数据类型。
6.数据仓库特点:面向主题的、数据是集成的、数据是相对稳定对的、数据是反映历史变化的。
7.RDB关系数据库


1.动态SQL语句的执行方式包括:立即执行方式和先准备后执行方式。
2.Armstrong公里的基本推理规则:自反律、增广律、传递率。
3.系统发生错误,进入一种不良状态(例如死锁),导致事务无法正常执行,但该事务可以在以后的某个时间重新执行。这种故障属于事务故障。
4.NOSQL数据库便于大量数据的写入处理、对简单查询可以快速返回结果、可方便处理表模式的变更,很多NOSQL系统不支持JOIN(连接)操作,Join操作需要再应用程序中实现。
5.逻辑数据模型有:层次模型、网状模型、关系模型、面向对象模型和对象关系模型。
6.SQL预定义数据类型包括:数值型、字符串型、位串型、时间型和布尔型。
7.记录的聚簇存放是指将不同类型的记录存放到相同的物理区域。
8.索引是数据库中一种非常重要的数据存取路径。
9.给数据项加锁的方式有多种。
10.基于识别数据项副本的方法可用于分布式并发控制,主站点方法是把所有的识别副本都保留在相同的站点上,基于投票的方法可以用于实现分布式并发控制。
11.在投票方法中,没有使用识别副本技术。
12.对象-关系数据库以关系模型为基础,对象-关系数据库的所有的面向对象扩展都在SQL环境中进行,对象-关系数据库提供继承机制。


1.模式只涉及到“型”的描述,不涉及具体的值。
2.如果选择条件为等值比较,则顺序索引和散列索引皆可利用。
3.隔离性是DBMS的事务管理器中并发控制部件的责任,保证单个事务的一致性是对该事务进行编码的应用程序的责任,原子性和持久性是DBMS的事务管理器中故障恢复机制的责任。(ACID特性,分别是原子性、一致性、隔离性、持久性)
4.加锁和解锁一般有由系统自动进行。
5.CAP原理指出,对于一个分布式计算系统来说,不可能同时满足一致性、可用性和分区容忍性三个需求,最多只能同时满足两个。
6.基于关系数据库系统的、以数据处理为主的传统的数据库应用具有以下共同特点:结构统一、面向记录、数据项小和原子字段。
7.数据库安全性的一般控制措施包括:访问控制、推理控制、流控制、数据加密。
8.SQL的数据类型(insert、update、delete)分为四类:预定义数据类型、构造数据类型、用户定义数据类型和大对象类型。
9.数据库操纵功能主要不是用于保证数据的安全性和有效性。
10.数据库查询处理中所涉及的活动不包括在查询所涉及的属性上建立索引,以提高查询速度。


1.create可以创建模式、表、视图。
2.数据模型描述了数据库的静态特征与动态行为。(不是数据结构)
3.概念模型能很好地模拟现实世界、容易被人们所理解
4.存储过程可以使用控制流语句和变量,大大增强SQL的功能。
5.两个调度S和S’等价满足的条件有:对于每个数据项Q,若事务Ti在调度S中读取了Q的初始值,那么在调度S’中Ti也必需读取Q的初始值(读取,read(Q),write(Q))
6.三种最基本的构造器是原子、元组或构造、以及汇集。


1.数据模型描述了数据库的静态特征与动态行为。
2.概念数据模型包括E-R模型、EER模型、面向对象模型、谓词模型。
3.关系语言是高度非过程化的语言、用户不必请求DBA为他建立特殊的存取路径,存取路径的选择由DBMS的优化机制来完成,用户不必求助于循环和递归来完成数据的重复操作。


1.通过应用系统的用户接口使用数据库不是数据库管理员的职责。
2.DBMS支持强有力的的查询语言、DBMS支持对于持久存储的大量数据进行高效存取。


1.DBMS不是计算机按照一定格式存放数据的仓库。
2.主属性和非主属性的集合可以唯一标识一个元组。
3.全外连接是在等值连接的基础上将左表和右表的未匹配数据都加上。
4.嵌入的SQL语句在程序编译前不都需要确定下来。
5.第二级存储器存储设备称作辅助存储。
6.非结构化的复杂对象通常是需要大量存储空间的数据类型
7.基本可用是指分布式系统再出现不可预知故障的时候,允许损失部分可用性但不等价于系统不可用。
8.基于角色的安全性机制是强制安全性机制的扩展。
9.DBMS是实现对数据库系统中的数据进行有效管理的复杂的系统软件,DBMS支持对于持久存储的大量数据进行高效存取,DBMS支持强有力的查询语言,DBMS支持看起来是原子的和独立于其他事物的方式并发的执行的持久事务。
10.投影对交不满足分配律,选择对交、并、减满足分配律。
11.DBA具有以下权限;创建账户、授予权限、收回权限、指定安全级别以及保证数据库系统的总体安全。
12.OLAP的基本功能:切片和切块、钻取和旋转。


1.数据字典和元数据是相同的概念
2.涉及企业订单处理、市场及客户支持等功能领域的应用软件是ERP
3.SQL语言在1987年被国际标准组织ISO采纳。
4.存储过程在服务器端运行,可以减少客户与服务器之间的数据传输和通讯代价,进而提高运行效率。
5.存储过程通过为数据库用户提供更复杂类型的导出数据,增强视图所提供的建模能力。
6.若关系模式R中没有非主属性,则R肯定属于3NF,但R不一定属于BCNF。
7.B+树是一种平衡的多路查找树,B+树所有的关键码都在叶节点中出现,m阶B+树的每个结点至多有m个子女,至少有m/2个子女。
8.分布透明性或网络透明性是指用户能够从网络的操作细节中解脱出来,它可以分为位置透明性和命名透明性。
9.CGI(Common Gateway Interface,公共网关接口)作为一个独立的进程在Web服务器上运行,进程的创建和关闭都会严重消耗系统的资源。
10.在数据挖掘的关联分析中,设D是事物的集合,A和B都是项集,则D中事务包含A并B的百分比称为支持度。
11.分量指元组中的一个属性值,
12.存储文件的逻辑结构组成了SQL数据库的内模式,存储文件的物理结构对用户是透明的(透明~看不见),由操作系统来管理。
13.一个SQL表可以是一个基本表,也可以是一个视图。
14.数据字典包含了对视图的定义。
15.数据项具有多个副本是集中式数据库不会出现的问题。


1.CALL语句用来调用存储过程。
2.定义SQL通信区的是EXEC SQL INCLUDE SQLCA
3.若X—>—>Y,且Z=空集,则称X—>—>Y为平凡的多值依赖。
4.若关系模式R只包含两个属性,则R肯定属于4NF。
5.对于一个给定的查询,尤其是负责查询,通常会有许多种可能的处理策略,查询优化就是从这许多策略中找出最有效的查询计划的一种处理过程。
6.在进行物理查询计划选择时,通常采用基于代价的查询计划选择方法。
7.执行物理查询计划时,不仅要指明要执行的操作,而且指明这些操作执行的顺序、执行每步所用的算法、获得所存储数据的方式,数据从一个操作专递给另一个操作的方式等。
8.DES56位密钥,AES128,192,256
9.OQL需要与编程语言精密配合使用,OQL与SQL在查询语法上有比较大的区别,C++语言可以和OQL配合使用。
10.NOSQL所采用的的模型有:键值、文档、列和图。
11.用户自定义完整性约束主要是域完整性约束,域完整性约束的取值范围可分为静态定义和动态定义两种,域完整性约束也包括定义属性见的约束,包括函数依赖和多值依赖。可以涉及多个关系。
12.CASCADE方式和RESTRICT方式可以在模式的删除、基本表的删除、权限的收回的SQL语句中出现。
13.数据依赖是通过一个关系中各个元组的某些属性值之间的相等与否体现出来的相互关系。
14.死锁是封锁系统自身引发的问题,两阶段封锁协议能保证可串行性,不能避免级联回滚。
15.数据仓库是面向主题的,数据是集成的、数据是相对稳定的、数据是反映历史变化的。


1.关系规范化理论只要属于数据库理论的研究。(数据库开发工具的研究不是理论研究范畴)
2.二维表中的行是关系的描述,称为关系模式,每个关系至少有一个默认的超码,即该关系的所有属性的集合。
3.有1NF、2NF、3NF、BCNF、4NF以此更严格的限制
4.DBMS运行的基本依据是存储在数据字典中的有数据定义语言对数据库结构的描述。
5.分布式系统的所有问题是内部的、实现级别的问题。
6.NOSQL的数据库支持无模式结构数据的存储和访问,在许多NOSQL数据库中,通过对对象的主码进行哈希或范围分区可以提高访问数据的性能。数据被创建的时候通过增加时间戳属性,可以实现NOSQL数据库的版本控制功能。
7.访问矩阵模型中M(i,j)表示主体i对对象j的权限类型。
8.数值型、字符串型和位串型、时间型和布尔型。
9.关系模式设计不当引起的问题是:插入异常、数据冗余、删除异常、更新异常。
10.DBMS不是实现对数据库系统中的数据进行有效管理的复杂的应用软件。
11.在投票方法中,没有识别副本;相反地,加锁请求被发送到所有包含该数据项副本的站点上;每个数据项副本维护自己的锁,并且可以授予或拒绝对它的加锁请求;投票方法被认为是真正的分布式并发控制方法,以为决策的职责在于所有涉及的站点,模拟研究表明投票方法在站点间产生的信息通信量比识别副本方法产生的要高。

十一
1.物理数据库的设计与调优,属于数据库管理员的职责。
2.分布式数据库中用户的一个全局查询必须转换成几个片段查询,可以做到分片的透明性。
3.外部并操作是为了用于两个不满足相容性条件的关系得到它们元组的并集而开发的。
4.自然连接从行和列的角度进行操作,如果两个关系没有公共属性,那么它们的自然连接就变成笛卡尔积。
5.视图一旦定义,就可以和基本表一样被查询,但对视图的修改操作有一定的限制。
6.块头包含以下信息:块中记录的数目;块中空闲的末尾处;一个由包含记录位置和大小的条目组成的数组。
7.保证可串行性的一个协议是两阶段封锁协议。该协议要求每个事务分为两个阶段提出加锁和解锁申请,增长阶段,事务可以获得锁,但不能释放锁;在缩减阶段,事务可以释放锁,但不能获得新锁。
8.C2系统具有C1系统中所有的安全性特征。
9.C2级计算机系统比c1 级具有更细粒度的自主访问控制。

十二
1.E-R模型是基于客观对象的模型
2.数据库管理系统的三个主要成分:存储管理器、查询处理器、事务管理器。
3.B+树是B树的变种。
4.无论是水平分片还是垂直分片,都需要遵循一定的原则:完备性原则、可重构原则、和不相交原则。
5.磁盘块由一个或多个扇区组成。
6.SQL99中含有一些面向对象的特征,行类型对应于元祖构造器,数组类型用于指定汇集;用户自定义类型可以用作属性类型,也可用于指定表的行类型。
7.频繁项集是满足最小支持度的项集,Apriori算法是常用的关联规则挖掘算法。

十三
1.动态SQL支持程序在运行时动态的生成并执行不同的SQL查询或修改,SQL标准引入动态SQL的原因,是由于静态SQL语句不能提供足够的编程灵活性。
2.概念模型特点:有丰富的语义表达能力、易于交流理解、易于变动、易于向各种数据模型转换。
3.磁带存储器称为第三级存储或脱机存储。
4.语法分析树先转换为逻辑查询计划,再转换为物理查询计划;选择逻辑查询计划和物理查询计划的步骤称为查询优化。
5.对象-关系数据库模型新特性包括:支持线性递归程序操作、引入角色概念、支持用作主动规则的语法。
6.索引、文件和记录管理器是存储管理器中的重要模块,DDL编译器、查询编译器和执行引擎是查询处理器中的重要模块;缓冲区和锁表是DBMS管理的重要的内存结构。
7.服务器扩展程序主要使用CGI和WebAPI两种编程接口编写,CGI最显著的缺点是消耗资源严重,WEB API 程序是在执行时动态加载到Web服务器进程内。

小伙伴们有疑问的可以在评论区发表意见哦~

Logo

开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!

更多推荐