调试 TensorFlow 模型

正如我们在本书中所学到的,TensorFlow 程序用于构建和训练可用于各种任务预测的模型。在训练模型时,您可以构建计算图,运行图以进行训练,并评估图以进行预测。重复这些任务,直到您对模型的质量感到满意为止,然后将图与学习的参数一起保存。在生产中,图是从文件构建或恢复的,并使用参数填充。

构建深度学习模型是一项复杂的技术,TensorFlow API 及其生态系统同样复杂。当我们在 TensorFlow 中构建和训练模型时,有时我们会得到不同类型的错误,或者模型不能按预期工作。例如,您经常看到自己陷入以下一种或多种情况:

  • 获取损失和指标输出中的 NaN
  • 即使经过多次迭代,损失或其他指标也没有改善

在这种情况下,我们需要调试使用 TensorFlow API 编写的代码。

要修复代码以使其正常工作,可以使用调试器或平台提供的其他方法和工具,例如 Python 中的 Python 调试器(pdb)和 Linux OS 中的 GNU 调试器(gdb)。当出现问题时,TensorFlow API 还提供一些额外的支持来修复代码。

在本章中,我们将学习 TensorFlow 中可用的其他工具和技术,以帮助调试:

  • 使用tf.Session.run()获取张量值
  • 使用tf.Print()打印张量值
  • tf.Assert()断言条件
  • 使用 TensorFlow 调试器进行调试(tfdbg

results matching ""

    No results matching ""