1. 基本概念
- :拥有多种数据类型的数据。
- :将结构化的数据变成数据流的格。式,即变为一个字符串或二进制流。
- 结构化数据处理工具:实现数据序列化及反序列化(从数据流中还原出原来的结构化数据)。
1.1 结构化数据处理
1.1.1 XML
<user>
<name>Li Zhang</name>
<id>890</id>
<email>[email protected]</email>
</user>
1.1.2 JSON
{
"name":"Li Zhang",
"id":"890",
"email":"[email protected]",
}
1.1.3 Protocol Buffer
Protocol Buffer格式的数据与XML和JSON的区别:
- Protocol Buffer格式化的数据是二进制流, 是不可读的
- XML和JSON的所有信息包含在内,反序列化时不需要额外信息
- Protocol Buffer反序列化时,需要预先定义的数据格式
- Protocol Buffer序列化出来的数据比XML格式数据小3到10 倍,解析速度要快20到100倍
- 数据格式定义文件:
message user{
optionial string name =1;
required int32 id = 2;
repeated string email = 3;
}
- Protocol Buffer定义的数据格式保存在.proto文件中
- TensorFlow的通信协议gRPC是以Protocol Buffer作为基础的
1.2 深度学习
- 深度学习:一类通过多层非线性变换对高复杂性数据建模算法的集合。
- 深度学习重要特征:
- 多层
- 非线性
- 线性变换:输出结果对任意输入变量求偏导,其偏导均为常数。
- 当模型的输入只有一个的时候, 和 形成了二维坐标系上的一条地直线
- 当模型有 个输入时, 和 形成了 维空间中的一个平面
- 线性模型特点:任意线性模型的组合仍然是线性模型
- 工
- 工