`Awesome Medical Vison-Language Models`

A curated list of awesome resources in medical vision-language models (in chronological order), inspired by the other awesome-initiatives.

An awesome list on general vision-language pre-training.

Overview

Survey Papers
Medical Vision-Language Pre-Training
Vision-Language Models for Healthcare
Explaination, Bias, Noise, and Robustness
Datasets

Survey

Deep Multi-modal Fusion of Image and Non-image Data in Disease Diagnosis and Prognosis: A Review. [Mar., 2022].
Can Cui, Haichun Yang, Yaohong Wang, Shilin Zhao, Zuhayr Asad, Lori A. Coburn, Keith T. Wilson, Bennett A. Landman, Yuankai Huo.
[PDF]

Beyond Medical Imaging: A Review of Multimodal Deep Learning in Radiology. [Apr., 2022].
Lars HeiligerLars Heiliger, Anjany Sekuboyina, Bjoern Menze, Jan EggerJan Egger, Jens Kleesiek.
[PDF]

Medical Vision-Language Pre-Training

Self-supervised Image-text Pre-training With Mixed Data In Chest X-rays. [Mar., 2021].
Xiaosong Wang, Ziyue Xu, Leo Tam, Dong Yang, Daguang Xu.
[PDF]

Multi-modal Understanding and Generation for Medical Images and Text via Vision-Language Pre-Training. [May, 2021] [JBHI, 2022].
Jong Hak Moon, Hyungyung Lee, Woncheol Shin, Young-Hak Kim, Edward Choi.
[PDF] [Github]

Generalized radiograph representation learning via cross-supervision between images and free-text radiology reports. [Oct., 2021] [Nature Machine Intelligence, 2022].
Hong-Yu Zhou, Xiaoyu Chen, Yinghao Zhang, Ruibang Luo, Liansheng Wang, Yizhou Yu.
[PDF] [Github]

Making the Most of Text Semantics to Improve Biomedical Vision-Language Processing. [Apr., 2022] [ECCV, 2022].
Benedikt Boecking, Naoto Usuyama, Shruthi Bannur, Daniel C. Castro, Anton Schwaighofer, Stephanie Hyland, Maria Wetscherek, Tristan Naumann, Aditya Nori, Javier Alvarez-Valle, Hoifung Poon, Ozan Oktay.
[PDF] [Toolbox] [Dataset]

Clinical-BERT: Vision-Language Pre-training for Radiograph Diagnosis and Reports Generation. [Jun., 2022] [AAAI, 2022].
Bin Yan, Mingtao Pei.
[PDF]

Vision-Language Pretraining Enables Radiographs and Reports to be Learned without Curation. [Aug., 2022].
Sangjoon Park, Eun Sun Lee, Jeong Eun Lee, Jong Chul Ye.
[PDF]

Multi-Modal Masked Autoencoders for Medical Vision-and-Language Pre-Training. [Sep., 2022] [MICAI, 2022].
Zhihong Chen, Yuhao Du, Jinpeng Hu, Yang Liu, Guanbin Li, Xiang Wan, Tsung-Hui Chang.
[PDF] [Github]

Align, Reason and Learn: Enhancing Medical Vision-and-Language Pre-training with Knowledge. [Sep., 2022] [ACM MM, 2022].
Zhihong Chen, Guanbin Li, Xiang Wan.
[PDF] [Github]

Medical Image Understanding with Pretrained Vision Language Models: A Comprehensive Study. [Sep., 2022].
Ziyuan Qin, Huahui Yi, Qicheng Lao, Kang Li.
[PDF]

Expert-level detection of pathologies from unannotated chest X-ray images via self-supervised learning. [Sep., 2022] [Nature Biomedical Engineering, 2022].
Ekin Tiu, Ellie Talius, Pujan Patel, Curtis P. Langlotz, Andrew Y. Ng, Pranav Rajpurkar.
[PDF] [Github]

Multi-Granularity Cross-modal Alignment for Generalized Medical Visual Representation Learning. [Oct., 2022] [NeurIPS, 2022].
Fuying Wang, Yuyin Zhou, Shujun Wang, Varut Vardhanabhuti, Lequan Yu.
[PDF] [Github]

Vision-Language Models for Healthcare

Classification

Joint Modeling of Chest Radiographs and Radiology Reports for Pulmonary Edema Assessment. [Aug., 2020] [MICCAI, 2020].
Geeticka Chauhan, Ruizhi Liao, William Wells, Jacob Andreas, Xin Wang, Seth Berkowitz, Steven Horng, Peter Szolovits, Polina Golland.
[PDF] [Github]

BERTHop: An Effective Vision-and-Language Model for Chest X-ray Disease Diagnosis. [Aug., 2021] [ICCV Workshop, 2021].
Masoud Monajatipoor, Mozhdeh Rouhsedaghat, Liunian Harold Li, Aichi Chien, C.-C. Jay Kuo, Fabien Scalzo, Kai-Wei Chang.
[PDF]

Improving Joint Learning of Chest X-Ray and Radiology Report by Word Region Alignment. [Sep., 2021] [MLMI, 2021].
Zhanghexuan Ji, Mohammad Abuzar Shaikh, Dana Moukheiber, Sargur N Srihari, Yifan Peng, Mingchen Gao.
[PDF] [Github]

GLoRIA: A Multimodal Global-Local Representation Learning Framework for Label-efficient Medical Image Recognition. [Oct., 2021] [ICCV, 2021].
Shih-Cheng Huang, Liyue Shen, Matthew P. Lungren, Serena Yeung.
[PDF] [Github]

ContIG: Self-supervised Multimodal Contrastive Learning for Medical Imaging with Genetics. [Nov., 2021] [CVPR, 2022].
Aiham Taleb, Matthias Kirchler, Remo Monti, Christoph Lippert.
[PDF] [Github]

Breaking with Fixed Set Pathology Recognition through Report-Guided Contrastive Training. [May, 2022] [MICAI, 2022].
Constantin Seibold, Simon Reiß, M. Saquib Sarfraz, Rainer Stiefelhagen, Jens Kleesiek.
[PDF] [Github]

RadTex: Learning Efficient Radiograph Representations from Text Reports. [Aug., 2022] [MICAI Workshop, 2022].
Keegan Quigley, Miriam Cha, Ruizhi Liao, Geeticka Chauhan, Steven Horng, Seth Berkowitz, Polina Golland.
[PDF]

MedCLIP: Contrastive Learning from Unpaired Medical Images and Text. [Oct., 2022] [EMNLP, 2022].
Zifeng Wang, Zhenbang Wu, Dinesh Agarwal, Jimeng Sun.
[PDF] [Github]

Medical Vision Question Answering

A Comparison of Pre-trained Vision-and-Language Models for Multimodal Representation Learning across Medical Images and Reports. [Sep., 2020] [BIBM, 2020].
Yikuan Li, Hanyin Wang, Yuan Luo.
[PDF] [Github]

MMBERT: Multimodal BERT Pretraining for Improved Medical VQA. (Short Paper) [Apr., 2021].
Yash Khare, Viraj Bagal, Minesh Mathew, Adithi Devi, U Deva Priyakumar, CV Jawahar.
[PDF] [Github]

MuVAM: A Multi-View Attention-based Model for Medical Visual Question Answering. [Jul., 2021].
Haiwei Pan, Shuning He, Kejia Zhang, Bo Qu, Chunling Chen, Kun Shi.
[PDF]

Vision-Language Transformer for Interpretable Pathology Visual Question Answering. [Mar., 2022] [JBHI, 2022].
Usman Naseem, Matloob Khushi, Jinman Kim.
[PDF]

AMAM: An Attention-based Multimodal Alignment Model for Medical Visual Question Answering. [Sep., 2022] [KBS, 2022].
Haiwei Pan, Shuning He, Kejia Zhang, Bo Qu, Chunling Chen, Kun Shi.
[PDF]

Medical visual question answering based on question-type reasoning and semantic space constraint. [Sep., 2022] [ARTMED, 2022].
Meiling Wang, Xiaohai He, Luping Liu, Linbo Qing, Honggang Chen, Yan Liu, Chao Ren.
[PDF]

A Bi-level representation learning model for medical visual question answering. [Oct., 2022] [JBI, 2022].
Yong Li, Shaopei Long, Zhenguo Yang, Heng Weng, Kun Zeng, Zhenhua Huang, FuLee Wang, Tianyong Hao.
[PDF]

Caption-Aware Medical VQA via Semantic Focusing and Progressive Cross-Modality Comprehension. [Oct., 2022] [ACM MM, 2022].
Fuze Cong, Shibiao Xu, Li Guo, Yinbing Tian.
[PDF]

A Dual-Attention Learning Network with Word and Sentence Embedding for Medical Visual Question Answering. [Oct., 2022].
Xiaofei Huang, Hongfang Gong.
[PDF]

Medical Object Locolization and Anomaly Detection

Weakly supervised one-stage vision and language disease detection using large scale pneumonia and pneumothorax studies. [Jul., 2020] [MICAI, 2020].
Leo K. Tam, Xiaosong Wang, Evrim Turkbey, Kevin Lu, Yuhong Wen, Daguang Xu.
[PDF]

Anatomy-Guided Weakly-Supervised Abnormality Localization in Chest X-rays. [Jun., 2022] [MICAI, 2022].
Ke Yu, Shantanu Ghosh, Zhexiong Liu, Christopher Deible, Kayhan Batmanghelich.
[PDF] [Github]

Joint Learning of Localized Representations from Medical Images and Reports. [Aug., 2022] [ECCV, 2022].
Philip Müller, Georgios Kaissis, Congyu Zou, Daniel Rueckert.
[PDF] [Github]

Radiological Reports Improve Pre-training for Localized Imaging Tasks on Chest X-Rays. [Sep., 2022] [MICAI, 2022].
Philip Müller, Georgios Kaissis, Congyu Zou, Daniel Rueckert.
[PDF]

Adapting Pretrained Vision-Language Foundational Models to Medical Imaging Domains. [Oct., 2022].
Pierre Chambon, Christian Bluethgen, Curtis P. Langlotz, Akshay Chaudhari.
[PDF]

Medical Image Segmentation

LViT: Language meets Vision Transformer in Medical Image Segmentation. [Jun., 2022].
Zihan Li, Yunxiang Li, Qingde Li, Puyang Wang, You Zhang, Dazhou Guo, Le Lu, Dakai Jin, Qingqi Hong.
[PDF] [Github]

Medical Report Generation

Improving Factual Completeness and Consistency of Image-to-Text Radiology Report Generation. [Oct., 2020] [NAACL, 2020].
Yasuhide Miura, Yuhao Zhang, Emily Bao Tsai, Curtis P. Langlotz, Dan Jurafsky.
[PDF]

Generating Radiology Reports via Memory-driven Transformer. [Oct., 2020] [EMNLP, 2020].
Zhihong Chen, Yan Song, Tsung-Hui Chang, Xiang Wan.
[PDF]

Exploring and Distilling Posterior and Prior Knowledge for Radiology Report Generation. [Jun., 2021] [CVPR, 2021].
Fenglin Liu, Xian Wu, Shen Ge, Wei Fan, Yuexian Zou.
[PDF]

Contrastive Attention for Automatic Chest X-ray Report Generation. [Jun., 2021] [Findings of ACL, 2021].
Xuewei Ma, Fenglin Liu, Changchang Yin, Xian Wu, Shen Ge, Yuexian Zou, Ping Zhang, Xu Sun.
[PDF]

Competence-based Multimodal Curriculum Learning for Medical Report Generation. [Aug., 2021] [ACL Oral, 2021].
Fenglin Liu, Shen Ge, Xian Wu.
[PDF]

AlignTransformer: Hierarchical Alignment of Visual Regions and Disease Tags for Medical Report Generation. [Sep., 2021] [MICAI, 2021].
Di You, Fenglin Liu, Shen Ge, Xiaoxia Xie, Jing Zhang, Xian Wu.
[PDF]

Auto-Encoding Knowledge Graph for Unsupervised Medical Report Generation. [Nov., 2021] [NeurIPS, 2021].
Fenglin Liu, Chenyu You, Xian Wu, Shen Ge, Sheng Wang, Xu Sun.
[PDF]

ChestXRayBERT: A Pretrained Language Model for Chest Radiology Report Summarization. [Dec., 2021] [TMM, 2021].
Xiaoyan Cai, Sen Liu, Junwei Han, Libin Yang, Zhenguo Liu, Tianming Liu.
[PDF]

Retrieval-Based Chest X-Ray Report Generation Using a Pre-trained Contrastive Language-Image Model. [Dec., 2021] [ML4H, 2021].
Mark Endo, Rayan Krishnan, Viswesh Krishna, Andrew Y. Ng, Pranav Rajpurkar.
[PDF] [Github]

Knowledge matters: Chest radiology report generation with general and specific knowledge. [Dec., 2021] [MIA, 2022].
Shuxin Yang, Xian Wu, Shen Ge, S. Kevin Zhou, Li Xiao.
[PDF]

Radiology Report Generation with a Learned Knowledge Base and Multi-modal Alignment. [Dec., 2021].
Shuxin Yang, Xian Wu, Shen Ge, S. Kevin Zhou, Li Xiao.
[PDF]

Improving Chest X-Ray Report Generation by Leveraging Warm-Starting. [Jan., 2022].
Aaron Nicolson, Jason Dowling, Bevan Koopman.
[PDF] [Github]

Few-shot Structured Radiology Report Generation Using Natural Language Prompts. [Mar., 2022].
Matthias Keicher, Kamilia Mullakaeva, Tobias Czempiel, Kristina Mach, Ashkan Khakzar, Nassir Navab.
[PDF]

A Self-Guided Framework for Radiology Report Generation. [Jun., 2022] [MICAI, 2022].
Jun Li, Shibo Li, Ying Hu, Huiren Tao.
[PDF]

Cross-modal Prototype Driven Network for Radiology Report Generation. [Jul., 2022] [ECCV, 2022].
Jun Wang, Abhir Bhalerao, Yulan He.
[PDF]

Attributed Abnormality Graph Embedding for Clinically Accurate X-Ray Report Generation. [Jul., 2022].
Sixing Yan, William K. Cheung, Keith Chiu, Terence M. Tong, Charles K. Cheung, Simon See.
[PDF]

Prior Guided Transformer for Accurate Radiology Reports Generation. [Aug., 2022] [JBHI, 2022].
Bin Yan, Mingtao Pei, Meng Zhao, Caifeng Shan, Zhaoxing Tian.
[PDF]

A Medical Semantic-Assisted Transformer for Radiographic Report Generation. [Aug., 2022] [MICAI, 2022].
Zhanyu Wang, Mingkang Tang, Lei Wang, Xiu Li, Luping Zhou.
[PDF]

RepsNet: Combining Vision with Language for Automated Medical Reports. [Sep., 2022] [MICAI, 2022].
Ajay Kumar Tanwani, Joelle Barral, Daniel Freedman.
[PDF]

An Inclusive Task-Aware Framework for Radiology Report Generation. [Sep., 2022] [MICAI, 2022].
Lin Wang, Munan Ning, Donghuan Lu, Dong Wei, Yefeng Zheng, Jie Chen .
[PDF]

TranSQ: Transformer-Based Semantic Query for Medical Report Generation. [Sep., 2022] [MICAI, 2022].
Ming Kong, Zhengxing Huang, Kun Kuang, Qiang Zhu, Fei Wu .
[PDF] [Github]

JPG - Jointly Learn to Align: Automated Disease Prediction and Radiology Report Generation. [Oct., 2022] [COLING, 2022].
Jingyi You, Dongyuan Li, Manabu Okumura, Kenji Suzuki.
[PDF]

DeltaNet: Conditional Medical Report Generation for COVID-19 Diagnosis. [Oct., 2022] [COLING, 2022].
Xian Wu, Shuxin Yang, Zhaopeng Qiu, Shen Ge, Yangtian Yan, Xingwang Wu, Yefeng Zheng, S. Kevin Zhou, Li Xiao.
[PDF]

Improving Radiology Summarization with Radiograph and Anatomy Prompts. [Oct., 2022].
Jinpeng Hu, Zhihong Chen, Yang Liu, Xiang Wan, Tsung-Hui Chang.
[PDF]

Explaination, Bias, Noise, and Robustness

CheXpert++: Approximating the CheXpert labeler for Speed,Differentiability, and Probabilistic Output. [Jun., 2020] [ML4H, 2020].
Matthew B. A. McDermott, Tzu Ming Harry Hsu, Wei-Hung Weng, Marzyeh Ghassemi, Peter Szolovits.
[PDF] [Github]

Contrastive Cross-Modal Pre-Training: A General Strategy for Small Sample Medical Imaging. [Oct., 2020] [JBHI, 2022].
Gongbo Liang, Connor Greenwell, Yu Zhang, Xiaoqin Wang, Ramakanth Kavuluru, Nathan Jacobs.
[PDF]

VisualCheXbert: Addressing the discrepancy between radiology report labels and image labels. [Apr., 2021] [CHIL, 2021].
Saahil Jain, Akshay Smit, Steven QH Truong, Chanh DT Nguyen, Minh-Thanh Huynh, Mudit Jain, Victoria A. Young, Andrew Y. Ng, Matthew P. Lungren, Pranav Rajpurkar.
[PDF] [Github]

Effect of Radiology Report Labeler Quality on Deep Learning Models for Chest X-Ray Interpretation. [Nov., 2021] [NeurIPS Workshop, 2021].
Saahil Jain, Akshay Smit, Andrew Y. Ng, Pranav Rajpurkar.
[PDF]

Image Classification with Consistent Supporting Evidence. [Dec., 2021] [ML4H, 2021].
Peiqi Wang, Ruizhi Liao, Daniel Moyer, Seth Berkowitz, Steven Horng, Polina Golland.
[PDF]

Using Multi-modal Data for Improving Generalizability and Explainability of Disease Classification in Radiology. [Jul., 2022].
Pranav Agnihotri, Sara Ketabi, Khashayar (Ernest)Namdar, Farzad Khalvati.
[PDF]

Explaining Chest X-ray Pathologies in Natural Language. [Jul., 2022] [MICAI, 2022].
Maxime Kayser, Cornelius Emde, Oana-Maria Camburu, Guy Parsons, Bartlomiej Papiez, Thomas Lukasiewicz.
[PDF] [Github]

The Ability of Image-Language Explainable Models to Resemble Domain Expertise. [Sep., 2022].
Petrus Werner, Anna Zapaishchykova, Ujjwal Ratan.
[PDF]

Improving Radiology Report Generation Systems by Removing Hallucinated References to Non-existent Priors. [Oct., 2022].
Vignav Ramesh, Nathan Andrew Chi, Pranav Rajpurkar.
[PDF]

That's the Wrong Lung! Evaluating and Improving the Interpretability of Unsupervised Multimodal Encoders for Medical Data. [Oct., 2022].
Denis Jered McInerney, Geoffrey Young, Jan-Willem van de Meent, Byron C. Wallace.
[PDF]

Evaluating Progress in Automatic Chest X-Ray Radiology Report Generation. [Oct., 2022].
Feiyang Yu, Mark Endo, Rayan Krishnan, Ian Pan, Andy Tsai, Eduardo Pontes Reis, Eduardo Kaiser Ururahy Nunes Fonseca, Henrique Min Ho Lee, Zahra Shakeri Hossein Abad, Andrew Y. Ng, Curtis P. Langlotz, Vasantha Kumar Venugopal, Pranav Rajpurkar.
[PDF]

Language over Labels: Contrastive Language Supervision Exceeds Purely Label-Supervised Classification Performance on Chest X-Rays. [Oct., 2022] [AACL SRW, 2022].
Wiehe A., Schneider F., Blank S., Wang X., Zorn H., Biemann C.
[PDF]

Datasets

Shenzhen chest X-ray set: Two public chest X-ray datasets for computer-aided screening of pulmonary diseases. [Dec., 2014] [JAMIA, 2016].
Stefan Jaeger, Sema Candemir, Sameer Antani, Yì-Xiáng J. Wáng, Pu-Xuan Lu, George Thoma.
[PDF] [Url]

OpenI-CXR: Preparing a collection of radiology examinations for distribution and retrieval. [Mar., 2016] [JAMIA, 2016].
Dina Demner-Fushman, Marc D. Kohli, Marc B. Rosenman, Sonya E. Shooshan, Laritza Rodriguez, Sameer Antani, George R. Thoma, Clement J. McDonald.
[PDF] [Url]

NIH ChestX-ray: ChestX-ray8 - Hospital-scale Chest X-ray Database and Benchmarks on Weakly-Supervised Classification and Localization of Common Thorax Diseases. [May, 2017].
Xiaosong Wang, Yifan Peng, Le Lu, Zhiyong Lu, Mohammadhadi Bagheri, Ronald M. Summers.
[PDF] [Url]

Radiology Objects in COntext (ROCO): A Multimodal Image Dataset. [Sep., 2018] [MICAI Workshop, 2018].
O. Pelka, S. Koitka, J. Rückert, F. Nensa, C.M. Friedrich,.
[PDF] [Github]

MIMIC-CXR, a de-identified publicly available database of chest radiographs with free-text reports. [Jan., 2019] [Scientific Data, 2019].
Alistair E. W. Johnson, Tom J. Pollard, Seth J. Berkowitz, Nathaniel R. Greenbaum, Matthew P. Lungren, Chih-ying Deng, Roger G. Mark, Steven Horng.
[PDF] [Url]

MIMIC-CXR-JPG, a large publicly available database of labeled chest radiographs. [Jan., 2019].
Alistair E. W. Johnson, Tom J. Pollard, Nathaniel R. Greenbaum, Matthew P. Lungren, Chih-ying Deng, Yifan Peng, Zhiyong Lu, Roger G. Mark, Seth J. Berkowitz, Steven Horng.
[PDF] [Url]

VQA-RAD: A database for using machine learning and data mining techniques for coronary artery disease diagnosis. [Oct., 2019] [Scientific Data, 2019].
R. Alizadehsani, M. Roshanzamir, M. Abdar, A. Beykikhoshk, A. Khosravi, M. Panahiazar, A. Koohestani, F. Khozeimeh, S. Nahavandi, N. Sarrafzadegan.
[PDF] [Url]

COVID-19 Image Data Collection: Prospective Predictions Are the Future. [Jun., 2020] [MELBA, 2020].
Joseph Paul Cohen, Paul Morrison, Lan Dao, Karsten Roth, Tim Q Duong, Marzyeh Ghassemi.
[PDF] [Github]

MIMIC-CXR-annotations. [Jul, 2020].
Leo K. Tam, Xiaosong Wang, Evrim Turkbey, Kevin Lu, Yuhong Wen, Daguang Xu.
[PDF] [Github]

MedICaT: A Dataset of Medical Images, Captions, and Textual References. [Oct., 2020] [Findings of EMNLP, 2020].
Sanjay Subramanian, Lucy Lu Wang, Sachin Mehta, Ben Bogin, Madeleine van Zuylen, Sravanthi Parasa, Sameer Singh, Matt Gardner, and Hannaneh Hajishirzi.
[PDF] [Github]

VinDr-CXR: An open dataset of chest X-rays with radiologist’s annotations. [Dec., 2020] [Scientific Data, 2022].
Ha Q. Nguyen, Khanh Lam, Linh T. Le, Hieu H. Pham, Dat Q. Tran, Dung B. Nguyen, Dung D. Le, Chi M. Pham, Hang T. T. Tong, Diep H. Dinh, Cuong D. Do, Luu T. Doan, Cuong N. Nguyen, Binh T. Nguyen, Que V. Nguyen, Au D. Hoang, Hien N. Phan, Anh T. Nguyen, Phuong H. Ho, Dat T. Ngo, Nghia T. Nguyen, Nhan T. Nguyen, Minh Dao, Van Vu.
[PDF] [Url]

RadGraph: Extracting Clinical Entities and Relations from Radiology Reports. [Jun., 2021] [NeurIPS, 2021].
Saahil Jain, Ashwin Agrawal, Adriel Saporta, Steven QH Truong, Du Nguyen Duong, Tan Bui, Pierre Chambon, Yuhao Zhang, Matthew P. Lungren, Andrew Y. Ng, Curtis P. Langlotz, Pranav Rajpurkar.
[PDF] [Url]

Chest ImaGenome Dataset for Clinical Reasoning. [Jul., 2021].
Joy T. Wu, Nkechinyere N. Agu, Ismini Lourentzou, Arjun Sharma, Joseph A. Paguio, Jasper S. Yao, Edward C. Dee, William Mitchell, Satyananda Kashyap, Andrea Giovannini, Leo A. Celi, Mehdi Moradi.
[PDF] [Url]

RadFusion: Benchmarking Performance and Fairness for Multimodal Pulmonary Embolism Detection from CT and EHR. [Nov., 2021].
Yuyin Zhou, Shih-Cheng Huang, Jason Alan Fries, Alaa Youssef, Timothy J. Amrhein, Marcello Chang, Imon Banerjee, Daniel Rubin, Lei Xing, Nigam Shah, Matthew P. Lungren.
[PDF] [Url]

DrugEHRQA: A Question Answering Dataset on Structured and Unstructured Electronic Health Records For Medicine Related Queries. [May, 2022].
Jayetri Bardhan, Anthony Colas, Kirk Roberts, Daisy Zhe Wang.
[PDF] [Url]

OVQA: A Clinically Generated Visual Question Answering Dataset. [Jul., 2022] [SIGIR, 2022].
Yefan Huang, Xiaoli Wang, Feiyan Liu, Guofeng Huang.
[PDF] [Url]

PAXRAY: Detailed Annotations of Chest X-Rays via CT Projection for Report Understanding. [Oct., 2022] [BMVC, 2022].
Constantin Seibold, Simon Reiß, Saquib Sarfraz, Matthias A. Fink, Victoria Mayer, Jan Sellner, Moon Sung Kim, Klaus H. Maier-Hein, Jens Kleesiek, Rainer Stiefelhagen.
[PDF] [Url]

yangzhou12 / awesome-medical-vision-language-models