使用 TensorFlow 和 Keras 的文本数据的 RNN
文本数据可以被视为一系列字符,单词,句子或段落。 循环神经网络( RNN )已被证明是非常有用的序列神经网络结构。为了将神经网络模型应用于自然语言处理( NLP )任务,文本被视为单词序列。事实证明,这对于 NLP 任务非常成功,例如:
- 问题回答
- 会话智能体或聊天机器人
- 文件分类
- 情绪分析
- 图像标题或描述文本生成
- 命名实体识别
- 语音识别和标记
NLP 与 TensorFlow 深度学习技术是一个广阔的领域,很难在一章中捕捉到。因此,我们尝试使用 Tensorflow 和 Keras 为您提供该领域中最流行和最重要的示例。一旦掌握了本章的内容,不要忘记探索和试验 NLP 的其他领域。
在本章中,我们将了解以下主题:
- 词向量表示
- 为 word2vec 模型准备数据
- TensorFlow 和 Keras 中的 skip-gram 模型
- 使用 t-SNE 可视化单词嵌入
- TensorFlow 和 Keras 中使用 LSTM 模型的文本生成示例