Chinese_medical_NLP

医疗NLP领域（主要关注中文）评测数据集与论文等相关资源。

Chinese_medical_NLP

评测及比赛更新

说明: 这部分从2021.2.20开始更新。添加当时还未截止的中英文医疗相关的NLP评测或比赛。

MEDIQA-2021

来源： NAACL 2021 workshop

Introduction

MEDIQA 2021 tackles three summarization tasks in the medical domain: consumer health question summarization, multi-answer summarization, and radiology report summarization. In this shared task, we will also explore the use of different evaluation metrics for summarization.

MEDIQA 2021 will be organized at the NAACL-BioNLP 2021 workshop.

BioNLP Workshop

MEDIQA评测地址

ICLR-2021-医疗对话生成与自动诊断国际竞赛

来源: ICLR 2021 workshop

本次竞赛以自动医疗诊断对话系统的开发为主题，目前设置了两大赛道：医疗对话生成赛道和自动医疗诊断赛道。

竞赛官方地址

中文医疗信息处理挑战榜CBLUE数据集

评测介绍:

中文医疗信息处理挑战榜CBLUE(Chinese Biomedical Language Understanding Evaluation)是**中文信息学会医疗健康与生物信息处理专业委员会在合法开放共享的理念下发起，由阿里云天池平台承办，并由医渡云（北京）技术有限公司、平安医疗科技、北京大学、郑州大学、鹏城实验室、哈尔滨工业大学(深圳）、同济大学、夸克、阿里巴巴达摩院等开展智慧医疗研究的单位共同协办，旨在推动中文医学NLP技术和社区的发展。评测长期开放。

CBLUE 1.0是由CHIP会议往届的学术评测比赛和阿里夸克医疗搜索业务的数据集组成，包括医学文本信息抽取（实体识别、关系抽取）、医学术语归一化、医学文本分类、医学句子关系判定和医学QA共5大类任务8个子任务。

Chinese_medical_NLP

评测及比赛更新

MEDIQA-2021

ICLR-2021-医疗对话生成与自动诊断国际竞赛

中文医疗信息处理挑战榜CBLUE数据集

**计算语言学大会CCL-2021智能医疗对话诊疗评测任务

科大讯飞-医疗实体及关系识别挑战赛

中文数据集

1. Yidu-S4K：医渡云结构化4K数据集

2.瑞金医院糖尿病数据集

3.Yidu-N7K：医渡云标准化7K数据集

4.中文医学问答数据集

5.平安医疗科技疾病问答迁移学习比赛

6.天池新冠肺炎问句匹配比赛

7.中文医患问答对话数据

8.中文医学问答数据

9.CHIP2020各项评测已开放

10.医学数据挖掘与算法评测大赛

11.中文医疗对话数据集

12.阿里发布的中文医疗标准数据集合

中文医学知识图谱

CMeKG

英文数据集

PubMedQA: A Dataset for Biomedical Research Question Answering

COMETA: A Corpus for Medical Entity Linking in the Social Media

MedMentions

相关论文

1.医疗领域预训练embedding

2.综述类文章

3.电子病历相关文章

4.医学关系抽取

5.医学知识图谱

6.辅助诊断

7.ACL2020医学领域相关论文列表

8.医疗实体Linking（标准化）

9. AAAI2020 医学NLP相关论文列表

10. EMNLP2020 医学NLP相关论文列表

中文医疗领域语料

医学教材+培训考试

哈工大《大词林》开放75万核心实体词及相关概念、关系列表（包含中药/医院/生物 类别）

医学embedding及预训练模型

开源英文医学embedding

MC-BERT中文医疗预训练模型

开源工具包

分词工具

PKUSEG

工业级产品解决方案

blog分享

友情链接

About

哈工大《大词林》开放75万核心实体词及相关概念、关系列表（包含中药/医院/生物类别）