EVASHINJI / Dialog-Datasets

本项目收集目前对话系统论文中,已公开的,用于训练中(英)文的训练集。Datasets for training Dialog.

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

对话系统中英文语料

本项目收集目前论文中,已公开的,用于训练中(英)文对话系统的语料以及开源的对话模型。

部分开源模型 待整理…

常用

中文

Douban Conversation Corpus

Noah NRM Data

STC Data

英文

Ubuntu Dialogue Corpus v2

OpenSubtitles

Cornell Movie Dialogs Corpus

Twitter

微博

Noah NRM Data

STC Data

NTCIR14 STC3 CECG

Personality Assignment Dataset

Chinese Dialogue Dataset with Sentence Function

Twitter

Twitter

豆瓣

Douban Conversation Corpus

电商

JD Customer Service Corpus

E-commerce Dialogue Corpus

About

本项目收集目前对话系统论文中,已公开的,用于训练中(英)文的训练集。Datasets for training Dialog.