tensorflow.data.Dataset中batch、shuffle、repeat作用及不同顺序的区别

1.作用

dataset.shuffle作用是将数据进行打乱操作，传入参数为buffer_size，改参数为设置“打乱缓存区大小”，也就是说程序会维持一个buffer_size大小的缓存，每次都会随机在这个缓存区抽取一定数量的数据
dataset.batch作用是将数据打包成batch_size
dataset.repeat作用就是将数据重复使用多少epoch

2.各种不同顺序的区别

示例代码（以下面代码作为说明）：

# -*- coding: utf-8 -*-
import tensorflow as tf
import numpy as np

dataset = tf.data.Dataset.from_tensor_slices(np.arange(20).reshape((4, 5)))

dataset = dataset.shuffle(100)
dataset = dataset.batch(3)
dataset = dataset.repeat(2)

sess = tf.Session()

iterator = dataset.make_one_shot_iterator()
input_x = iterator.get_next()

print(sess.run(input_x))
print(sess.run(input_x))
print(sess.run(input_x))
print(sess.run(input_x))