fengzhouc / handleFileData

数据分类工具

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

handleFileData

数据分类工具

介绍

这个工具主要是处理大数据分类的,主要是用来处理师傅们的字典的

输入:单个文件/目录

输出:按类分文件输出

分类规则:配置文件中以regex进行配置

r1=xxx
r2=ddd
r3=ccc

按顺序进行匹配,匹配到则continue

如果只是想剔除会有编码错误的数据,可以清空配置

img.png

About

数据分类工具


Languages

Language:Python 99.9%Language:Batchfile 0.1%