hemingkx / LoveTalker

LoveTalker implemented by PyTorch and Tensorflow2.x.(基于charRNN的简易中文情话生成模型)

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

LoveTalker

本项目是基于charRNN的情话生成工具,适合新手入门。

Function

1. 给定开头生成情话:

开头:爱一个人
output:爱一个人,就是在一起很开心;爱一个人,就是一辈子。

2. 基于开头和语境生成情话:

语境不是情话的组成部分,但是为生成的情话提供了语气、句法格式等参考。

开头:我想
语境:我的胸口有点闷,因为你堵在我心头了。
output:我想你一定很忙,所以你只看前三个字就好。

Dataset

我们使用 weibo-search 对微博话题 #情话# 下的数据进行爬取,具体爬取了2000-2020年共154380条文本数据。这些数据在love_word/data.csv文件中。这些数据只是初步爬取,是有很多噪声的。

Requirements

1.pytorch

pytorch实现的主要package配置包括:

  • tqdm
  • pandas
  • pytorch >= 1.5.1

安装环境可以运行:

pip install -r requirements.txt

2.tensorflow

tensorflow2.x实现的主要package配置包括:

  • pandas
  • tensorflow-gpu >= 2.2.0

安装环境可以运行:

pip install -r requirements.txt

Parameter Setting

模型参数等在config.py中进行设置。

Usage

命令行输入

python main.py

模型运行结束后,每个epoch的模型保存在./checkpoints下。

Pretrained Model

Tensorflow 2.x版本的Pretrained Model地址:

链接: https://pan.baidu.com/s/1jJdmOrDicAI15mVOwlhuYw 密码: 7jdt

可下载后,选用训练特定epoch后保存的模型生成情话,测试模型性能。

About

LoveTalker implemented by PyTorch and Tensorflow2.x.(基于charRNN的简易中文情话生成模型)


Languages

Language:Python 100.0%