电商多轮对话客服机器人
数据集:18年公开的淘宝客服对话数据 https://github.com/cooelf/DeepUtteranceAggregation
实现类别:生成式模型
模型架构:Seq2Seq模型,编码器使用多层双向GRU,解码器使用多层单向GRU及全局注意力机制,训练模式使用了teacher forcing和梯度修剪技巧,测试模式则使用集束搜索技巧来生成回答
依赖:
torch 1.0.1
jieba 0.38
numpy 1.15.4
电商多轮对话智能机器人
电商多轮对话客服机器人
数据集:18年公开的淘宝客服对话数据 https://github.com/cooelf/DeepUtteranceAggregation
实现类别:生成式模型
模型架构:Seq2Seq模型,编码器使用多层双向GRU,解码器使用多层单向GRU及全局注意力机制,训练模式使用了teacher forcing和梯度修剪技巧,测试模式则使用集束搜索技巧来生成回答
依赖:
torch 1.0.1
jieba 0.38
numpy 1.15.4