目录
一、分值分布
CDGA:2分(2单选)
CDGP:0分
二、重点知识梳理
1、引言
语境关系图:
文件和内容管理:是指针对存储在关系型数据库之外的数据和信息的采集、存储、访问和使用过程的管理。重点在于保持文件和其他非结构化或半结构化信息的完整性,并使这些信息能够被访问。确保文件和内容管理的安全性和高质量,需要可靠的架构和管理良好的元数据。
1.1 业务驱动因素
业务驱动因素:
- 法规遵从性要求
- 诉讼响应能力
- 电子取证请求能力
- 业务连续性要求
- 帮助提高组织效率
1.2 目标和原则
目标:
- 1)确保能够高速有效地采集和使用非结构化的数据和信息。
- 2)确保结构化和非结构化数 据之间的整合能力。
- 3)遵守法律义务并达到客户预期。
原则:
- 1)组织中的每个人都应该在保护组织的未来方面发挥作用。每个人都必须按照既定的制度和程序来创建、使用、检索和处置档案。
- 2)档案和内容处理方面的专家应充分参与制度和规划的制定。
ARMA 国际在 2009 发布的档案保存指导原则 GARP:
- 1)问责原则。
- 2)完整原则。
- 3)保护原则。
- 4)遵从原则。
- 5)可用原则。
- 6)保留原则。
- 7)处置原则。
- 8)透明原则。
1.3 基本概念
内容:内容是指文件、档案或网站内的数据和信息。
- 内容管理:内容管理 (Content Management) 包括用于组织、分类和构造信息资源的流程、方法和技术以便以多种方式存储、发布和重复使用这些资源。内容的生命周期可以是动态的。
- 内容元数据:
- 1)格式。
- 2)可搜索性。
- 3)自我描述性。
- 4)既有模式。
- 5)内容主题。
- 6)需求。
- 内容建模:内容建模 (Content Modeling)是将逻辑内容概念转换为具有关系的内容类型、属性和数据类型的过程。
- 层次:
- 1)信息产品级别
- 2)组件级别
- 层次:
- 内容分发方法:
- 1)推式 (Push)。
- 2)拉式 (Pul)。
- 3)交互式 (Interactive)。
受控词表:被明确允许用于通过浏览和搜索对内容进行索引、分类、标引、排序和检索术语的定 义列表。
- 词汇表管理:词汇表管理关键问题集中于用途、消费者、标准、维护4个方面
- 词汇表视图和微控制词汇表:
- 词汇表视图(Vocabulary View)是受控词表的子集,涵盖了受控词表领域内有限范围的主题。
- 微控制词汇表(Micro-Controlled Vocabulary)是包含一般词汇表中不包含的高度专业化术语的词汇表。
- 术语和选择列表:术语列表仅仅就是一个列表 (List)
- 术语管理:
- 术语关系类型:
- 1)等价术语关系(Equivalent Term Relationship)。
- 2)层次化关系 (Hierarchical Relationship)。
- 3)关联关系(Related Term Relationship)。
- 术语关系类型:
- 同义词环和规范表:
- 同义词环 (Synonym Ring) 是指一组含义大致相同的术语
- 规范表 (Authority List) 是描述性术语的受控词汇表,旨在促进特定领域或范围内的信息检索其术语处理方法和同义词环不同:在同义词环中有一个术语是首选,其他术语则是变体
- 分类法:分类法 (Taxonomies)是指任何分类或受控词表的总称
- 分类法结构:
- 1)扁平分类法(Flat Taxonomy)。在受控类别集之间没有关系,所有类别都是平等的。这类似于列表。例如,一个包含多个国家的列表。
- 2)层次分类法 (Hierarchical Taxonomy)。它是一种树结构,其中节点通过规则相互关联。
- 3)多重层级结构 (Polyhierarchy)。它是具有多个节点关系规则的树状结构。子节点可能有多个父节点,父节点也可以共用一个祖父节点。
- 4)面分类法 (Facet Taxonomy)。它指的是每个节点与中心节点相关联,其形状看起来像星形图。
- 5)网状分类法(Network Taxonomy)。既可用于层级结构,也可用于刻面结构
- 分类法结构:
文件和档案:
文件 (Document) 是包含任务说明,对执行任务或功能的方式和时间的要求以及任务执行和决策的日志等的电子或纸质对象。文件可用于交流并分享信息和知识。程序、协议、方法和说明书都属于文件。只有部分文件才能称为档案 (Record)。
档案可用于证明所做的决策和所采取的行动是符合程序的:可作为组织业务活动和法规遵从的证据。档案通常是由人来创建的,但仪器和监控设备也可以提供数据来自动生成档案
- 文件管理:文件管理包括在文件和档案的整个生命周期中控制和组织它们的流程、方法和技术。它包括电子和纸质文件的存储、编目和控制。
- 关注点:文件管理关注的是文件本身,几乎不关注文件内容
- 市场和监管压力的重点:放在档案保管期限表、地点、传送和销毁上
- 文件和档案的生命周期:
- 1)编目。识别已有的和新建的文件/档案
- 2)制度。文件/档案制度的创建、批准和实施,包括文件/档案的保管制度。
- 3)分类。文件/档案的分类。
- 4)存储。纸质和电子文件/档案的短期和长期存储。
- 5)检索和流转。在遵守制度、安全、控制标准和法律的情况下,允许文件/档案的访问和流通。
- 6)保存和处置。在遵守组织需求、规章和法规的情况下,对文件/档案进行归档和销毁。
- 档案管理:档案管理(Records Management) 是文件管理的一部分,管理档案有一些特殊的要求
- 档案的生命周期:
- 档案的创建或接收到处理
- 分发
- 组织和检索
- 处置
- 档案的类型:
- 物理的 (如文件、备忘录、合同、报告或缩微胶片)
- 电子的 (如电子邮件内容、附件和即时消息)
- 网站上的内容及各种介质和硬件上的文件
- 各种数据库中采集的数据甚至是混合档案
- 精心管理的档案具有以下特点:
- 1)内容。内容必须准确、完整和真实。
- 2)背景。关于档案的创建者、创建日期或与其他档案关系的描述性信息 (元数据) 应该在创建档案时收集、组织并维护。
- 3)及时性。档案应该在事件、行为或决定发生后立即创建
- 4)永久性。一旦成为档案,则在档案的法定保存期内不能改变其内容
- 5)结构。档案内容的外观和排版需要清晰,它们应被记录在正确的表格或模板上。内容应清晰易读,对术语的使用应始终保持如一。
- 档案的生命周期:
信息架构:是为信息体或内容创建的结构。
- 组件:
- 1)受控词表。
- 2)分类法和本体。
- 3) 元数据映射。
- 4)搜索功能规格。
- 5)用例。
- 6)用户流。
信息架构和内容制度共同描述了“什么”, 即哪些内容将在系统中被管理。设计阶段描述了“如何”实施内容管理制度
语义建模:一种知识建模,描述一系列概念网络(有关的想法或主题)以及它们之间的关系。语 义模型包含语义对象和语义约束。语义对象是模型中表示的事物,它们可以具有基数和域的属性 以及标识符。它们的结构可以是简单的、合成的、复合的、混合的、关联的、父/子类型或原型/ 版本。语义约束表示UML中的关联或关联类模型,这些模型有助于识别模式和趋势,并发现可能看起来不相干信息之间的关系。
语义搜索(Semantic Search):侧重于语义和语境而非预先设定的关键字。可使用人工智能。要 弄清用户想要什么。
非结构化数据:多达 80%的数据存储是在关系型数据库之外维护
- 格式:
- 电子格式:文字处理文件、电子邮件、社交媒体、聊天室、平面文件、电子表格、XML 文件、事务性消息、报告、图形、数字图像、缩微胶片、视频和音频。
- 纸质文件中也存在大量非结构化数据
数据管理的基本原则既适用于结构化数据也适用于非结构化数据。非结构化数据是宝贵的企业资产。存储、完整性、安全性、内容质量、访问和有效使用对非结构化数据的管理都具有指导作用。非结构化数据需要数据治理、体系架构、安全元数据和数据质量。
工作流:应该通过一个工作流 (Workflow) 管理内容开发,以确保内容按时创建并获得适当的批准。工作流组件可以包括创建、处理、路由、规则、管理、安全性、电子签名、截止日期、升级(如果出现问题)、报告和交付等过程。它应该通过使用内容管理系统 (CMS 或其他独立系统来实现自动化,而不是人工处理。
2、活动
2.1 规划生命周期管理
- 规划档案管理。(什么是档案?存在哪?老旧档案处置?)
- 制定内容策略。(从当前状态审视和差距评估开始。元数据分类和SEO)
2.2 创建内容处理制度
文件管理制度:
- 1)审计的范围和合规性。
- 2)重要档案的鉴定和保护
- 3)保留档案的目的和保管期限表。
- 4)如何响应信息保留命令(特殊保护令),即针对已过保留期的诉讼信息要求。
- 5)本地和异地存储档案的要求。
- 6)硬盘驱动器和共享网络驱动器的使用和维护。
- 7)对电子邮件管理,从内容管理的角度进行处理。
- 8)合理的档案销毁方法。
2.3 定义内容信息架构
需要从结构和非结构化的数据中,检索出用户需要的信息。
2.4 实施的生命周期管理
- 1.获取档案和内容。
- 2.管理版本控制。
- 数据控制等级:
- 1)正式控制:正式
- 2)修订控制:没那么正式
- 3)托管控制:最不正式
- 控制级别的标准:
- 1)提供和更新资产的成本
- 2)项目影响 (如果变更将产生重大成本或进度后果)
- 3)企业或项目变更的其他后果。
- 4)需要重新使用资产或资产的早期版本
- 5)维护变更历史 (当企业或项目要求时)
- 数据控制等级:
- 3.备份和恢复。
- 4.管理保管和处置。
- 5.审计文件/档案。
- 步骤:
- 1)定义组织驱动因素,并确定“为什么”要进行文件/记录管理的利益相关方 (Why)。
- 2) 一旦确定了检查/测量的内容和要使用的工具 (如标准、基准、访问调查),就开始收集相关数据 (How)。
- 3)报告结果。
- 4)制订下一步的行动计划和时间表
- 步骤:
2.5 发布和分发内容
- 1.开放访问、搜索和检索。
- 2.通过可接受的渠道分发。
3、工具
- 企业内容管理系统
- 文件管理
- 内容管理系统
- 内容和文件工作流
- 协作工具。
- 受控词汇表和元数据工具
- 标准标记和交换格式
- XML
- JSON
- RDF
- W3C
- Schema.org
- 电子取证技术
4、方法
- 诉讼应诉手册。
- 诉讼应诉数映射
- 时间限制:90 天限制
5、实施指南
5.1 就绪评估/风险评估
ECM就绪评估:
- 目的:确定内容管理需要改进的方面,以及组织对改变其流程以满足这些需求的适应程度
档案管理成熟度:
- ARMA信息治理成熟度模型:
- 1)1 级,低于标准的(Sub-Standard)。信息治理和档案保管问题没有得到解决或只是最低限度的解决。
- 2)2 级,发展中的(In Development)。认识到信息治理和档案保管可能对组织产生的影响。
- 3)3 级,基本的(Essential)。必须满足法律法规的最低要求。
- 4)4 级,积极的(Proactive)。已经建立了一个以持续改进为重点的主动式信息治理计划。
- 5)5 级,完成变革的(Transformational)。信息治理已经融入企业的基础架构和业务流程中。
- 技术评估标准:
- 1)电子档案管理软件应用系统设计标准(DOD 5015.2)。
- 2)电子办公环境中档案管理原则与功能要求 (ISO 16175)
- 3)电子档案管理通用需求 (MoReq2)
- 4)对象管理组 (OMG)的档案管理服务 (RMS) 规范。
6、文件和内容治理
6.1 信息治理框架
ARMA的GARP原则:
- 为问责制提供高层支持
- 教育员工了解信息治理职责
- 根据正确的档案代码或分类类目对信息进行分类
- 确保信息的真实性和完整性
- 确保官方档案是电子档案,除非另有规定
- 制定制度,使业务系统和第三方与信息治理标准保持一致。
- 存储、管理、访问、监控和审核已批准的企业存储库以及档案和内容系统
- 保护机密或个人身份信息。
- 控制不必要的信息增长
- 在信息的生命周期结束时对其进行处置
- 遵守信息的请求(如取证、传票等)。
- 持续改进
6.2 信息的激增
非结构化数据的增长速度远远快于结构化数据。管理非结构化数据需要数据管理专员与其他数据管理专业人员、档案管理人员的有效合作。
6.3 管理高质量的内容
定义高质量的内容需要了解它生产和使用的背景:
- 生产者。谁创建内容?为什么要创建?
- 消费者。谁使用信息?出于什么目的?
- 时间。何时需要信息?需要多久更新或访问一次?
- 格式。消费者是否需要特定格式的内容才能实现目标?是否有不可接受的格式?
- 分发。信息将如何分发?消费者将如何获取信息?如何实施安全措施以防止对电子内容的不恰当访问?
6.4 度量指标
- 1.档案管理:
- 衡量档案管理系统实施成功的标准如下:
- 1)每个用户有百分之几的文件和电子邮件被认定为是公司的档案。
- 2)被认定为公司档案中有百分之几得到了控制。
- 3)在所有存储的档案中有百分之几的档案应用了适当的保管规则。
- 衡量档案管理系统实施成功的标准如下:
- 2.电子取证:
- 成本降低
- 对比被动收集信息的方式
- 提前收集信息时提高的效率(如转为电子取证平均需要几天时间)
- 组织可以快速地进行法律保留通知的过程
- 3.企业内容管理:
- 衡量企业内容管理(ECM)的有形和无形效益:
- 有形效益包括提高生产力、降低成本、提高信息质量和改善合规性;
- 无形效益包括增进协作、简化工 作程序和工作流。
- 衡量企业内容管理(ECM)的有形和无形效益: