Why Information Storag
Information Explosion
on-command, on-demand
how to manage info?
数据种类
(貌似比较重要)
- 结构化数据
- 半结构化数据
- 非结构化数据
处理周期
数据处理是人or机器对数据进行重组或重新排序,增加特定价值
- 输入
- 处理
- 输出
关系?
数据 | 信息 | |
---|---|---|
特征 | 无特定目的 | 价值、逻辑 |
本质 | raw materials | 加工后 |
依赖关系 | 不依赖信息 | 取决于数据 |
例子 | 气象数据 | 天气预报 |
value of information to a business
- Identifying new business opportunities
- Identifying patterns that lead to changes in existing bus
- Creating a competitive advantage
storage
Examples:
– Individuals: Digital camera, Cell phone, DVD’s, Hard disk
– Businesses: Hard disk, external disk arrays, tape library
Storage model: An evolution
– Centralized: mainframe computers
– Decentralized: Client –server model
– Centralized: Storage Networking
数据库应用:
数据产生-> 数据处理 -> 数据管理
(根据数据访问频率)
- 在线存储
- 进线存储 – 需要一段时间的准备(对比在线有时间差
- 离线存储
存储趋势
云化、闪存化、智能化
介质可以有
- 磁盘
- 闪存
结构
- 集中式
- 分布式
- 人工运维 只能运维
智能时代对数据存储的要求
从前
- RAID重构时间长
- 硬盘故障率高
- 多点故障业务中断
- 数据重删压缩率低
- 并发时延波动大
- 块/文件/对象服务融合不高效
转变
- 万物互联,业务不间断运行
- 5G时代,生产交易实时高速处理
- 数据资产化,存储智能分层,冷变温挖掘价值
- 边,中心,云协同,让数据每比特成本最低,价值最大
Storage Technology and Architecture Evolution:
- Internal DAS
- JBOD just a bundle of disk
- RAID Array
- SAN/NAS
- IP SAN
硬盘 -> 磁盘
分离 -> 融合
分布式存储
- 将物理资源组织起来构成高性能逻辑存储池 —— 保证可靠性,提供多种存储服务
- 数据分散在独立设备上
- 可拓展系统架构、多存储服务器分担负荷
存储虚拟化
- 存储设备进行抽象,逻辑资源方式的呈现——统一提供全面存储服务
- 不同的存储形态、设备之间提供相同功能
云存储
- 多存储设备
- 多应用
- 多服务协同
- 高度虚拟化、多用户基础,给可扩展的存储资源。根据组织动态要求配置
Example of an Order Processing System
Client(根本使用者) 通过 Application User Interface, 经过LAN 连接 Server/OS(直接使用者)的DBMS 再经由 FC SAN 查找 Storage Array
数据中心
典型架构
- 存储网络
- 服务器
- 存储交换网络
- 存储系统
物理空间内信息的集中处理、存储、传输、交换、管理。
计算机设备、服务器设备、网络设备、存储设备是关键设备。
运行所需要的环境因素是物理基础设施
- 网络架构
- 支持设施(机房、发电机、UPS、散热
- 服务器/应用平台
- 集中存储和备份
- 系统管理平台
- 客户服务的运维管理组织、流程
Challenges in Managing Information
- Exploding digital universe(数据爆炸)
- multifold increase of info growth
- increasing dependency on info(可靠性)
- strategic use of info
- Changing value of info(信息价值的改变)
A proactive strategy that enables an IT organization to effectively manage the data throughout
信息生命周期进程:
基于策列(附带信息价值的存储架构)的分配
- classify data/app (based on business rules) 对数据/应用进行分类
- implement policies with info management tools 管理工具实施策略
- integrated management of storage environment 环境的集成管理
- organize storage resources to align with data classes 数据类保持一致
从上往下,automated;
从下往上,flexible
Benefits of Implementing ILM
- Improved utilization(可用性/利用率)
- Tiered storage platforms 分层存储平台
- Simplified management 简化管理
- Processes, tools and automation
- Simplified backup(备份) and recovery(恢复)简化备份恢复
– A wider range of options to balance the need for business continuity 广泛选择,平衡业务连续性 - Maintaining compliance(合规性)
– Knowledge of what data needs to be protected for what length of time 数据的保护时间 - Lower Total Cost of Ownership 降低总成本
– By aligning(使一致) the infrastructure and management costs with information value (基础设施、管理成本、信息价值