2023系统分析师---冲刺资料必备知识点三

视图的优点:

  1. 视图能简化用户的操作;
  2. 视图机制可以使用户以不同的方式查询同一数据;
  3. 视图对数据库重构提供了一定程度的逻辑独立性;
  4. 视图可以对机密的数据提供安全保护;

ER图、实体、联系、联系的类型:

分布式数据库:

是一组数据组成的,这组数据分布在计算机网络的不同计算机上,网络中的每个节点具有独立处理的能力(称为场地自治),它可以执行局部应用,同时,每个节点也能通过网络通信子系统执行全局应用。分布式数据库系统是在集中式数据库系统技术的基础上发展起来的,具有如下特点:

  1. 数据独立性:在分布式数据库系统中,数据独立性这一特性更加重要,并具有更多的内容。除了数据的逻辑独立性与物理独立性之外,还有数据分布独立性(分布透明性)。
  2. 集中与自治共享结合的控制结构:各个局部的DBMS可以独立管理局部数据库,具有自治的功能。同时,系统又设有集中控制机制,协调各局部DBMS的工作,执行全局应用。
  3. 适当增加数据冗余度:在不同的场地存储同一数据的多个副本,这样,可以提高系统的可靠性和可用性,同时也能提高系统性能。
  4. 全局的一致性、可串行性和可恢复性。

分布式数据库的 优点:

  1. 分布式数据库可以解决企业部门分散而数据需要相互联系的问题。
  2. 如果企业需要增加新的相对自主的部门来扩充机构,则分布式数据库系统可以在对当前机构影响最小的情况下进行扩充。
  3. 分布式数据库可以满足负载均衡的需要。
  4. 当企业已存在几个数据库系统,而且实现全局应用的必要性增加时,就可以由这些数据库自下而上构成分布式数据库系统。
  5. 相等规模的分布式数据库系统在出现故障的概率上不会比集中式数据库系统低,但由于其故障的影响仅限于局部数据应用,因此,就整个系统来说,它的可靠性是比较高的。

数据分片:

将数据库整体逻辑结构分解为合适的逻辑单位,然后由分布模式来定义片段及其副本在各场地的物理分布,其主要目的是提高访问的局部性,有利于按照用户的需求,组织数据的分布和控制数据的冗余度。

  1. 水平分片:水平分片是将一个全局关系中的元祖分裂成多个子集,每个子集为一个片段。分片条件由关系中属性值表示。对于水平分片,重构全局关系可通过关系合并操作实现。
  2. 垂直分片:垂直分片将一个全局关系按属性分裂成多个子集,应满足不相交性(关键字除外)。对于垂直分片,重构全局关系可通过连接运算实现。
  3. 导出分片:导出分片又称为导出水平分片,即水平分片的条件不是本关系属性的条件,而是其他关系属性的条件。
  4. 混合分片:混合分片是分片中采用水平分片和垂直分片两种形式的混合。

分布透明性:

是指用户不必关系数据的逻辑分片,不必关心数据存储的物理位置分配细节,也不必关心局部场地上数据库的数据模型。

  1. 分片透明性是分布透明性的最高层次,它是指用户或应用程序只对全局关系进行操作而不必考虑数据的分片。
  2. 位置透明性是指用户或应用程序应当了解分片情况,但是不必了解片段的存储场地。
  3. 局部数据模型透明性。局部数据模型透明性是指用户或应用程序应当了解分片及各片段存储的场地,但是不必了解局部场地上使用的是何种数据模型。

分布式数据查询优化:

  1. 全局查询树的变换;例如,在做笛卡尔积之前,先进行投影和选择运算。
  2. 副本的选择与多副本的更新策略;多个副本存在不同的节点,如何选择。
  3. 查询树的分解;对所有节点采取后续遍历法,直到所有的叶节点均被成功地遍历为止
  4. 半连接与直接连接等,不需要传递整个关系,只要传送连接时与对方匹配的元祖即可。

数据仓库的集成:

  1. 数据源:是数据仓库系统的基础,是整个系统的数据源泉。
  2. 数据的存储与管理:是整个数据仓库系统的核心。
  3. OLAP(联机分析处理)服务器:对分析需要的数据进行有效集成,按多维模型组织,以便进行多角度、多层次的分析,并发现趋势。
  4. 前端工具:主要包括各种报表工具、查询工具、数据分析工具、数据挖掘工具以及各种基于数据仓库或数据集市的应用开发工具。

数据挖掘流程:

  1. 问题定义:在开始挖掘之前最先也是最重要的要求就是熟悉背景知识,弄清用户需求。
  2. 建立数据挖掘库:要进行数据挖掘必须收集要挖掘的数据资源,一般需要将要挖掘的数据都收集到一个数据库中,而不是采用原有的数据库或数据仓库
  3. 分析数据:分析数据是对数据深入调查的过程,从数据集中找出规律和趋势。
  4. 调整数据:通过上述步骤的操作,对数据的状态和趋势有了进一步的了解,这时,要尽可能对问题解决的要求作进一步明确化和量化。
  5. 模型化:在问题进一步明确、数据结构和内容进一步调整的基础上,就可以建立形成知识的模型。
  6. 评价和解释:所得到的模型有可能是没有实际意义或没有实用价值的,也有可能是其不能准确反映数据的真实意义,甚至在某些情况下是与事实相反的。

数据挖掘的分析方法:

  1. 关联分析:关联分析主要用于发现不同事件之间的关联性,即一个事件发生的同时,另一个事件也经常发生。
  2. 序列分析:序列分析主要用于发现一定时间间隔内连接发生的事件,这些事件构成一个序列,发现的序列应该具有普遍意义。
  3. 分类分析:分类分析通过分析具有类别的样本特点,得到决定样本属于各种类别的规则或方法。分类分析时首先为每个记录赋予一个标记(一组具有不同特征的类别),即按标记分类记录,然后检查这些标定的记录,描述出这些记录的特征。
  4. 聚类分析:聚类分析是根据“物以类聚”的原理,将本身没有类别的样本聚集i成不同的组,并且对每个这样的组进行描述的过程。

商业智能:

  1. BI系统主要包括数据预处理;
  2. 建立数据仓库
  3. 数据分析
  4. 数据展现

反规范化技术:

规范化设计后,数据库设计者希望牺牲部分规范化来提高性能,这种从规范化设计的回退方法称为反规范化技术。

采用反规范化技术的益处:降低连接操作的需求、降低外码和索引的数目,还可能减少表的数目,能够提高查询效率。

可能带来的问题:数据的重复存储,浪费了磁盘空间、可能出现数据完整性问题,为了保障数据的一致性,增加了数据维护的复杂性,会降低修改速度。

  1. 增加冗余列:在多个表中保留相同的列,通过增加数据冗余减少或避免查询时的连接操作。
  2. 增加派生列:在表中增加可以由本表或其他表中数据计算生成的列,减少查询时的连接操作并避免计算或使用集合函数。
  3. 重新组表:如果许多用户需要查看两个表连接出来的结果数据,则把这两个表重新组成一个表来减少连接而提高性能。
  4. 水平分割表:根据一列或多列数据的值,把数据放到多个独立的表中,主要用于表数据规模很大,表中的数据相对独立或数据需要存放到多个介质上时使用。
  5. 垂直分割表:对表进行分割,将主键与部分列放到一个表中,主键与其他列放到另一个表中,在查询时减少IO次数。

NOSQL:

Not-only Sql:是一种非关系型数据库,其和关系数据库的比较如下:

特征

关系型数据库模式

NoSql模式

并发支持

支持并发,效率低

并发性能高

存储与查询

关系表方式存储,SQL查询

海量数据存储、查询效率高

扩展方式

向上扩展

向外扩展

索引方式

B树、哈希等

键值索引

应用领域

面向通用领域

特定应用领域

数据一致性

实时一致性

弱一致性

数据类型

结构化数据

非结构化

事务

高事务性

若事务性

水平扩展

NOSQL数据库存在的问题:

  1. 成熟度不够,大量关键特性有待实现
  2. 开源数据库产品的支持力度有限
  3. 数据挖掘与商务智能支持不足,现有的产品无法直接使用NoSql数据库
  4. NoSql数据库专家较少,大部分都处于学习阶段

内存数据库:

内存数据库抛弃了磁盘数据管理的传统方式,基于全部数据都在内存中重新设计了体系结构,并且在数据缓存、快速算法、并行操作方面也进行了相应的改进,所以数据处理速度比传统数据库的数据处理速度要快很多,一般是10倍以上。

特点:工作版本常驻内存,活动事务只与实时内存数据库的内存拷贝打交道

常见的内存数据库:Redis、SQLite、Mircrosoft Sql Server Compact等

REST(表述性状态传递):

是一种只使用HTTP和XML进行基于Web通信的技术,可以降低开发的复杂性,提高系统的可伸缩性。

REST的5个原则:

  1. 网络上所有事物都被抽象为资源;
  2. 每个资源对应一个唯一的资源标识;
  3. 通过通用的连接件接口对资源进行操作;
  4. 对资源的各种操作不会改变资源标识;
  5. 所有的操作都是无状态的

MVP模式与MVC模式的主要区别为:

  1. 在组件耦合度方面:在MVP模式中,视图并不直接使用模型,它们之间的通信通过Presenter进行,从而实现了视图与模型的分离,而在MVC模式中,视图直接与模型交互。
  2. 在组件分工方面:在MVP模式中,视图需要处理鼠标及键盘等触发的界面事件,而在MVC模式中这通常是由控制器完成的工作;在MVP模式中,系统核心业务逻辑组织集中在Presenter中,而在MVC模式中,相应的控制器通常只完成事件的分发。
  3. 在开发工程化支持方面:MVP模式可更好地支持单元测试,而在MVC模式中,由于模式与视图绑定,因此难以实施相应的单元测试;在MVP模式中,Presenter基于约定接口与视图和模型交互,可更好地支持组件的重用。

猜你喜欢

转载自blog.csdn.net/qq_25580555/article/details/130852933