目录
1.1.1 两种不同的方式来创建tf.data.Dataset
1 tf.data模块
基于 tf.data API,我们可以使用简单的代码来构建复杂的输入, tf.data API 可以轻松处理大量数据、不同的数据格式 以及复杂的转换。
1.1 tf.data API 最重要的概念:
tf.data.Dataset 表示一些列元素中每个元素包含一个或多个 Tensor 对象。例如,在图片管道中,一个元素可能是单个训练样本,具有一对 表示图片数据和标签的张量。
1.1.1 两种不同的方式来创建tf.data.Dataset
- 直接从 Tensor 创建 Dataset 例如 Dataset.from_tensor_slices()); 当然 Numpy 也是可以的,TensorFlow 会自动将其转 换为 Tensor.
- 通过对一个或多个 tf.data.Dataset 对象来使用变换 (例如 Dataset.zip)来创建 Dataset。
1.2 认识Dataset
一个 Dataset 对象包含多个元素,每个元素的结构都 相同。每个元素包含一个或多个 tf.Tensor 对象,这些对象被称为组件。
Dataset 的属性由构成该 Dataset 的元素的属性映射 得到,元素可以是单个张量、张量元组,也可以是张量的嵌套元组。
在tensorflow 2.0 环境下可以直接对 Dataset 经迭代处理
代码实现:
、