Morizeyao / Decoders-Chinese-TF2.0

GPT2 training script for Chinese in Tensorflow 2.0

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

基于Tensorflow 2.0 与 Huggingface 的 Transformers 的 GPT2 与 Transformer-XL 训练代码

(本项目不保证能稳定运行)

使用方法

  • pip install -r requirements.txt
  • 将scripts文件夹中的几个sh文件拷贝到拷贝到根目录。
  • 运行prepare_data.sh预处理。
  • 然后运行train_gpt2_keras.sh训练。
  • 运行generate_gpt2_keras.sh生成。

数据格式

  • 本项目采用的语料格式为一个txt文件,每一行是一个json的列表,这个列表中包含了一篇文章。

About

GPT2 training script for Chinese in Tensorflow 2.0

License:MIT License


Languages

Language:Python 98.6%Language:Shell 1.4%