CHIP2021医学对话临床发现阴阳性判别任务冠军方案开源

简介

比赛名称：CHIP2021评测一: 医学对话临床发现阴阳性判别任务

测评任务：针对互联网在线问诊记录中的临床发现进行阴阳性的分类判别

CPU 型号 AMD EPYC 7742 64-Core Processor
CPU 核数16 核
磁盘空间290 GB
显卡型号RTX A6000
显存大小48 GB
内存大小58 GB

Python 3.8.10
pip install ark-nlp==0.0.2
pip install pandas
pip install scikit-learn

训练模型请到train文件夹下运行

bash ./train.sh

PS：

训练过程采用过滤后的训练文件，已包含在'data/source_dataset'，过滤思路可以参考系统描述文档，生成方法gen_fliter_data.py
预训练模型可通过pretrain.py获取

预测请到predict文件夹下，相关命令如下

由于最近其他事情比较多，暂时还没有修整和注释，后期有时间会重新进行改进并适配到ark-nlp最新版本，有问题可以微信讨论，微信号是：fk95624