E2E-Relation-Extraction

generate text after extracting and identifying relation between entities in sentence using seq2seq model

Dataset

环境	环境配置
镜像	PyTorch 1.10.0 + Python 3.8 (Ubuntu 20.04) + Cuda 11.3
CPU	14 vCPU Intel(R) Xeon(R) Gold 6330 CPU @ 2.00GHz
GPU	RTX 3090(24GB) * 1

操作	输出结果	分析
数据分析		我们针对训练集做出了数据分析，从左图可看出训练集的平均句子长度为 21.79，最小长度为 1，最大长度为 73。句子长度在50之后逐渐减少，因此我们在数据预处理的部分将训练集、测试集和验证集的 src 和 tgt 长度统一设置为 50。
模型训练损失		从左图的训练集损失图像我们可观测到，模型在经过迭代训练的过程中，模型损失逐步递减。
数据预处理
模型训练

generate text using seq2seq model

Language:Jupyter Notebook 93.7%Language:Python 6.3%