TensorFlow の tf.data (TfRecord)

@Vengineerの戯言 : Twitter
SystemVerilogの世界へようこそ、すべては、SystemC v0.9公開から始まった

Inside TensorFlow: tf.data - TF Input Pipelineを見ました。

TensorFlowにおける、Input Pipeline の技術的な説明です。tf.data と TFRecord　が出てきます。

TensorFlowは、どんどん進化しているので、今は、Input Pipeline を使って、モデルにデータを流し込む感じなのね。

TFRecord に関する記事等
TensorFlow推奨フォーマット「TFRecord」の作成と読み込み方法
TensorFlowのTFRecordを用いた「学習」をDataset API で行う
AI（人工知能）実践第12回　TFRecordの読み込み
Beginner’s guide to feeding data in Tensorflow — Part2

    dataset = tf.data.TfRecordDataset(files)

    dataset = dataset.shuffle(buffer_size=X)

    dataset = dataset.map(lambda record: parse(record))

    dataset = dataset.batch(batch_size=Y)

が基本パターン。

batch の後に、Optimize を置くことで、最適化ができる。

Map と Batch は、CPUによる並列化も可能。 ParallelMap, ParallelBatch に

Map と Batch を融合した、MapAndBatch もある。

Vengineerの妄想

人生を妄想しています。

TensorFlow の tf.data (TfRecord)