使用 TensorFlow 集群的分布式模型

之前我们学习了如何使用 Kubernetes,Docker 和 TensorFlow 服务在生产中大规模运行 TensorFlow 模型。 TensorFlow 服务并不是大规模运行 TensorFlow 模型的唯一方法。 TensorFlow 提供了另一种机制,不仅可以运行,还可以在多个节点或同一节点上的不同节点和不同设备上训练模型。 在第 1 章,TensorFlow 101 中,我们还学习了如何在不同设备上放置变量和操作。在本章中,我们将学习如何分发 TensorFlow 模型以在多个节点上的多个设备上运行。

在本章中,我们将介绍以下主题:

  • 分布式执行策略
  • TensorFlow 集群
  • 数据并行模型
  • 对分布式模型的异步和同步更新

results matching ""

    No results matching ""