Ailing-Zou / flashtext_chinese_nlp_data_augmentation_eda

flashtext-chinese-nlp-data-augmentation

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Repository purpose - 目的

这个repository的目的是进行NLP领域的数据增强,参考的论文是EDA参考文献:EDA Easy Data Augmentation Techniques for Boosting Performance on Text Classification Tasks flashtext for chinese ,2019.8

Data augmentation - 数据增强

数据增强包括四种方法:

Flashtext - 高效替换

在进行数据增强模式时,由于本身的数据和同义词的数据量都比较大,因此需要进行高效的匹配,而非正则表达式的匹配,进而采用了flashtext方法。

About

flashtext-chinese-nlp-data-augmentation


Languages

Language:Python 100.0%