Neural Question Generation Survey

We summarize related research papers and resources for neural question generation (NQG). We categorize NQG into structured NQG, unstructured NQG and hybrid NQG, as illustrated in the subsequent figure.

We present a summary of the datasets widely used in NQG tasks, as shown in the Table below.

NQG Models
Benchmark Datasets

Structured NQG Models

Traditional Seq2Seq Models

RNN-based

Generating natural language question-answer pairs from a knowledge graph using a RNN based question generation model. Sathish Reddy Indurthiand Dinesh Raghu and Mitesh M Khapra and Sachindra Joshi. EACL, 2017. [Paper]
Zero-shot question generation from knowledge graphs for unseen predicates and entity types. Hady Elsahar and Christophe Gravier and Frederique Laforest. NAACL, 2018. [Paper] [Code]
Knowledge-enriched, Type-constrained and Grammar-guided Question Generation over Knowledge Bases. Sheng Bi and Xiya Cheng and YuanFang Li and Yongzhen Wang and Guilin Qi. COLING, 2020. [Paper] [Code]

Transformer-based

Generating Questions for Knowledge Bases via Incorporating Diversified Contexts and Answer-Aware Loss. Cao Liu and Kang Liu and Shizhu He and Zaiqing Nie and Jun Zhao. EMNLP, 2019. [Paper]
Difficulty-controllable multi-hop question generation from knowledge graphs. Vishwajeet Kumar and Yuncheng Hua and Ganesh Ramakrishnan and Guilin Qi and Lianli Gao and Yuan-Fang Li. ISWC, 2019. [Paper] [Code]

Graph2Seq Models

KGPT: Knowledge-Grounded Pre-Training for Data-to-Text Generation. Chen, Wenhu and Su, Yu and Yan, Xifeng and Wang, William Yang. EMNLP, 2020. [Paper] [Code]
Meta-CQG: A Meta-Learning Framework for Complex Question Generation over Knowledge Bases. Kun Zhang and Yunqi Qiu and Yuanzhuo Wang and Long Bai and Wei Li and Xuhui Jiang and Huawei Shen and Xueqi Cheng. COLING, 2022. [Paper]
Toward Subgraph-Guided Knowledge Graph Question Generation With Graph Neural Networks. Yu Chen and Lingfei Wu and Mohammed J. Zaki. TNNLS, 2023. [Paper] [Code]

Pre-trained Seq2Seq Models

PLMs-based

DSM: Question Generation over Knowledge Base via Modeling Diverse Subgraphs with Meta-learner. Shasha Guo and Jing Zhang and Yanling Wang and Qianyi Zhang and Cuiping Li and Hong Chen. EMNLP, 2022. [Paper] [Code]
Diversifying Question Generation over Knowledge Base via External Natural Questions. Shasha Guo and Jing Zhang and Xirui Ke and Cuiping Li and Hong Chen. Arxiv, 2023. [Paper]
JointGT: Graph-Text Joint Representation Learning for Text Generation from Knowledge Graphs. Pei Ke and Haozhe Ji and Yu Ran and Xin Cui and Liwei Wang and Linfeng Song and Xiaoyan Zhu and Minlie Huang. ACL Findings, 2021. [Paper] [Code]
LFKQG: A Controlled Generation Framework with Local Fine-tuning for Question Generation over Knowledge Bases. Zichu Fei and Xin Zhou and Tao Gui and Qi Zhang and Xuanjing Huang. COLING, 2022. [Paper] [Code]
AutoQGS: Auto-Prompt for Low-Resource Knowledge-based Question Generation from SPARQL. Guanming Xiong and Junwei Bao and Wen Zhao and Youzheng Wu and Xiaodong He. CIKM, 2022. [Paper] [Code]
Difficulty-controllable question generation over knowledge graphs: A counterfactual reasoning approach. Sheng Bi and Jianyu Liu and Zeyi Miao andQizhi Min. Information Processing and Management, 2024. [Paper]

LLMs-based

Prompting Large Language Models with Chain-of-Thought for Few-Shot Knowledge Base Question Generation. Yuanyuan Liang and Jianing Wang and Hanlun Zhu and Lei Wang and Weining Qian and Yunshi Lan. EMNLP, 2023. [Paper]
SGSH: Stimulate Large Language Models with Skeleton Heuristics for Knowledge Base Question Generation. Shasha Guo and Lizi Liao and Jing Zhang and Yanling Wang and Cuiping Li and Hong Chen. NAACL Findings, 2024. [Paper] [Code]

Unstructured NQG Models

Traditional Seq2Seq Models

RNN-based

Learning to Ask: Neural Question Generation for Reading Comprehension. Du, Xinya and Shao, Junru and Cardie, Claire. ACL, 2017. [Paper] [Code]
Answer-focused and position-aware neural question generation. Sun, Xingwu and Liu, Jing and Lyu, Yajuan and He, Wei and Ma, Yanjun and Wang, Shi. EMNLP, 2018. [Paper]
Harvesting Paragraph-level Question-Answer Pairs from Wikipedia. Du, Xinya and Cardie, Claire. ACL, 2018. [Paper] [Code]
Neural Models for Key Phrase Extraction and Question Generation. Sandeep Subramanian and Tong Wang and Xingdi Yuan and Saizheng Zhang and Adam Trischler and Yoshua Bengio. ACL, 2018. [Paper]
Improving Question Generation With to the Point Context. Jingjing Li and Yifan Gao and Lidong Bing and Irwin King and Michael R. Lyu. EMNLP, 2019. [Paper]
Improving Neural Question Generation Using Answer Separation. Yanghoon Kim and Hwanhee Lee and Joongbo Shin and Kyomin Jung. AAAI, 2019. [Paper]
Capturing Greater Context for Question Generation. Luu Anh Tuan and Darsh J. Shah and Regina Barzilay. AAAI, 2020. [Paper]
Multi-Hop Reasoning Question Generation and Its Application. Jianxing Yu and Qinliang Su and Xiaojun Quan and Jian Yin. IEEE Trans. Knowl. Data Eng., 2023. [Paper]

Transformer-based

Cross-Lingual Training for Automatic Question Generation. Vishwajeet Kumar and Nitish Joshi and Arijit Mukherjee and Ganesh Ramakrishnan and Preethi Jyothi. ACL, 2019. [Paper] [Code]
Neural question generation with answer pivot. Wang, Bingning and Wang, Xiaochuan and Tao, Ting and Zhang, Qi and Xu, Jingfang. AAAI, 2020. [Paper]
Learning to ask more: Semi-autoregressive sequential question generation under dual-graph interaction. Zi Chai and Xiaojun Wan. ACL, 2020. [Paper] [Code]

Graph-based Models

Reinforcement Learning Based Graph-to-Sequence Model for Natural Question Generation. Chen, Yu and Wu, Lingfei and Zaki, Mohammed J.Zaki. ICLR, 2020. [Paper] [Code]
Semantic Graphs for Generating Deep Questions. Liangming Pan and Yuxi Xie and Yansong Feng and Tat-Seng Chua and Min-Yen Kan. ACL, 2020. [Paper] [Code]
Multi-hop Question Generation with Graph Convolutional Network. Dan Su and Yan Xu and Wenliang Dai and Ziwei Ji and Tiezheng Yu and Pascale Fung. EMNLP Findings, 2020. [Paper] [Code]
Iterative GNN-based decoder for question generation. Fei, Zichu and Zhang, Qi and Zhou, Yaqian. EMNLP, 2021. [Paper] [Code]
CQG: A Simple and Effective Controlled Generation Framework for Multi-hop Question Generation. Zichu Fei and Qi Zhang and Tao Gui and Di Liang and Sirui Wang and Wei Wu and Xuanjing Huang. ACL, 2022. [Paper] [Code]
Graph augmented sequence-to-sequence model for neural question generation. Hui Ma and Jian Wang and Hongfei Lin and Bo Xu. Appl. Intell., 2023. [Paper]

Pre-trained Seq2Seq Models

PLMs-based

A Recurrent BERT-based Model for Question Generation. Ying-Hong Chan and Yao-Chung Fan. MRQA@EMNLP, 2019. [Paper]
Unified Language Model Pre-training for Natural Language Understanding and Generation. Dong, Li and Yang, Nan and Wang, Wenhui and Wei, Furu and Liu, Xiaodong and Wang, Yu and Gao, Jianfeng and Zhou, Ming and Hon, Hsiao-Wuen. NeurIPS, 2019. [Paper] [Code]
MiniLM: Deep Self-Attention Distillation for Task-Agnostic Compression of Pre-Trained Transformers. Wenhui Wang and Furu Wei and Li Dong and Hangbo Bao and Nan Yang and Ming Zhou. NeurIPS, 2020. [Paper]
ERNIE-GEN: An Enhanced Multi-Flow Pre-training and Fine-tuning Framework for Natural Language Generation. Dongling Xiao and Han Zhang and Yu-Kun Li and Yu Sun and Hao Tian and Hua Wu and Haifeng Wang. IJCAI, 2020. [Paper] [Code]
Learning to generate questions by learning to recover answer-containing sentences. Back, Seohyun and Kedia, Akhil and Chinthakindi, Sai Chetan and Lee, Haejun and Choo, Jaegul. ACL Findings, 2021. [Paper]
CoHS-CQG: Context and History Selection for Conversational Question Generation. Xuan Long Do and Bowei Zou and Liangming Pan and Nancy F. Chen and Shafiq R. Joty and Ai Ti Aw. COLING, 2022. [Paper] [Code]
Diversity Enhanced Narrative Question Generation for Storybooks. Hokeun Yoon and JinYeong Bak. EMNLP, 2023. [Paper] [Code]
Modeling What-to-ask and How-to-ask for Answer-unaware Conversational Question Generation. Xuan Long Do and Bowei Zou and Shafiq R. Joty and Anh Tran Tai and Liangming Pan and Nancy F. Chen and Ai Ti Aw. ACL, 2023. [Paper] [Code]
Improving Question Generation with Multi-level Content Planning. Zehua Xia and Qi Gou and Bowen Yu and Haiyang Yu and Fei Huang and Yongbin Li and Cam-Tu Nguyen. EMNLP Findings, 2023. [Paper] [Code]
TAGNet: a tiny answer-guided network for conversational question generation. Zekun Wang and Haichao Zhu and Ming Liu and Bing Qin. Int. J. Mach. Learn. Cybern., 2023. [Paper]
Guiding the Growth: Difficulty-Controllable Question Generation through Step-by-Step Rewriting. Yi Cheng and Siyao Li and Bang Liu and Ruihui Zhao and Sujian Li and Chenghua Lin and Yefeng Zheng. ACL/IJCNLP, 2021. [Paper]
Explainable Multi-hop Question Generation: An End-to-End Approach without Intermediate Question Labeling. Seonjeong Hwang and Yunsu Kim and Gary Geunbae Lee. LREC/COLING, 2024. [Paper] [Code]
Non-Essential is NEcessary: Order-agnostic Multi-hop Question Generation. Kyungho Kim and Seongmin Park and Junseo Lee and Jihwa Lee. LREC/COLING, 2024. [Paper]
Agenda-Driven Question Generation: {A} Case Study in the Courtroom Domain. Yi Ren Fung and Anoop Kumar and Aram Galstyan and Heng Ji and Prem Natarajan. LREC/COLING, 2024. [Paper]
{SGCM:} Salience-Guided Context Modeling for Question Generation. Chuyao Ding and Yu Hong and Jianmin Yao. LREC/COLING, 2024. [Paper]
Syntax-guided question generation using prompt learning. Zheheng Hou and Sheng Bi and Guilin Qi and Yuanchun Zheng and Zuomin Ren and Yun Li. Neural Comput. Appl., 2024. [Paper]
Zero-shot Clarifying Question Generation for Conversational Search. Zhenduo Wang and Yuancheng Tu and Corby Rosset and Nick Craswell and Ming Wu and Qingyao Ai. WWWW, 2023. [Paper]

LLMs-based

Towards Human-Like Educational Question Generation with Large Language Models. Zichao Wang and Jakob Valdez and Debshila Basu Mallick and Richard G. Baraniuk. AIED, 2022. [Paper]
How Teachers Can Use Large Language Models and Bloom's Taxonomy to Create Educational Quizzes. Sabina Elkins and Ekaterina Kochmar and Jackie C. K. Cheung and Iulian Serban. EAAI, 2024. [Paper]

Visual2Seq Models

CNN-based

Visual question generation as dual task of visual question answering. Li, Yikang and Duan, Nan and Zhou, Bolei and Chu, Xiao and Ouyang, Wanli and Wang, Xiaogang and Zhou, Ming. CVPR, 2018. [Paper]
iVQA: Inverse Visual Question Answering. Feng Liu and Tao Xiang and Timothy M. Hospedales and Wankou Yang and Changyin Sun. CVPR, 2018. [Paper]
Difficulty-Controllable Visual Question Generation. Feng Chen and Jiayuan Xie and Yi Cai and Tao Wang and Qing Li. APWeb-WAIM, 2021. [Paper]
Deconfounded Visual Question Generation with Causal Inference. Jiali Chen and Zhenjun Guo and Jiayuan Xie and Yi Cai and Qing Li. ACM MM, 2023. [Paper] [Code]

GNN-based

Radial graph convolutional network for visual question generation. Xu, Xing and Wang, Tan and Yang, Yang and Hanjalic, Alan and Shen, Heng Tao. TNNLS, 2020. [Paper] [Code]
Multiple objects-aware visual question generation. Xie, Jiayuan and Cai, Yi and Huang, Qingbao and Wang, Tao. ACM MM, 2021. [Paper]
Knowledge-Based Visual Question Generation. Jiayuan Xie and Wenhao Fang and Yi Cai and Qingbao Huang and Qing Li. IEEE Trans. Circuits Syst. Video Technol., 2022. [Paper]
Visual Question Generation Under Multi-granularity Cross-Modal Interaction. Zi Chai and Xiaojun Wan and Soyeon Caren Han and Josiah Poon. MMM, 2023. [Paper]

Generative Networks-based

Information Maximizing Visual Question Generation. Ranjay Krishna and Michael S. Bernstein and Li Fei-Fei. CVPR, 2019. [Paper]
C3VQG: category consistent cyclic visual question generation. Shagun Uppal and Anish Madan and Sarthak Bhagat and Yi Yu and Rajiv Ratn Shah. ACM MM Asia, 2020. [Paper] [Code]

PLMs-based

Look before You Leap: Dual Logical Verification for Knowledge-based Visual Question Generation. Xumeng Liu and Wenya Guo and Ying Zhang and Xubo Liu and Yu Zhao and Shenglong Yu and Xiaojie Yuan. LREC/COLING, 2024. [Paper] [Code]
Knowledge-Guided Cross-Topic Visual Question Generation. Hongfei Liu and Guohua Wang and Jiayuan Xie and Jiali Chen and Wenhao Fang and Yi Cai. LREC/COLING, 2024. [Paper]

Hybrid NQG Models

MultiQG-TI: Towards Question Generation from Multi-modal Sources. Zichao Wang and Richard G. Baraniuk. ACL, 2023. [Paper] [Code]
ConVQG: Contrastive Visual Question Generation with Multimodal Guidance. Li Mi and Syrielle Montariol and Javiera Castillo Navarro and Xianjie Dai and Antoine Bosselut and Devis Tuia. AAAI, 2024. [Paper]
A Unified Framework for Contextual and Factoid Question Generation. Chenhe Dong and Ying Shen and Shiyang Lin and Zhenzhou Lin and Yang Deng. TKDE, 2024. [Paper]
Synthetic Multimodal Question Generation. Wu, Ian and Jayanthi, Sravan and Viswanathan, Vijay and Rosenberg, Simon and Pakazad, Sina and Wu, Tongshuang and Neubig, Graham. Arxiv, 2024. [Paper]

Knowledge Base-based Datasets

WebQuestions. Introduced by Vishwajeet Kumar and Yuncheng Hua and Ganesh Ramakrishnan and Guilin Qi and Lianli Gao and Yuan-Fang Li in Difficulty-controllable multi-hop question generation from knowledge graphs. ISWC, 2019. [Paper] [Data] [Code]
PathQuestions. Introduced by Mantong Zhou and Minlie Huang and Xiaoyan Zhu in An Interpretable Reasoning Network for Multi-Relation Question Answering. COLING, 2018. [Paper] [Data] [Code]
GrailQA. Introduced by Yu Gu and Sue Kase and Michelle Vanni and Brian M. Sadler and Percy Liang and Xifeng Yan and Yu Su in Beyond I.I.D.: Three Levels of Generalization for Question Answering on Knowledge Bases. WWW, 2021. [Paper] [Data] [Code]

Text-based Datasets

SQuAD. Introduced by Pranav Rajpurkar and Jian Zhang and Konstantin Lopyrev and Percy Liang in SQuAD: 100, 000+ Questions for Machine Comprehension of Text. EMNLP, 2016. [Paper] [Data] [Code]
MS MARCO. Introduced by Tri Nguyen and Mir Rosenberg and Xia Song and Jianfeng Gao and Saurabh Tiwary and Rangan Majumder and Li Deng in MS MARCO: A Human Generated MAchine Reading COmprehension Dataset. NeurIPS, 2016. [Paper] [Data] [Code]
NewsQA. Introduced by Adam Trischler and Tong Wang and Xingdi Yuan and Justin Harris and Alessandro Sordoni and Philip Bachman and Kaheer Suleman in NewsQA: A Machine Comprehension Dataset. ACL, 2017. [Paper] [Data] [Code]
HotpotQA. Introduced by Zhilin Yang and Peng Qi and Saizheng Zhang and Yoshua Bengio and William W. Cohen and Ruslan Salakhutdinov and Christopher D. Manning in HotpotQA: A Dataset for Diverse, Explainable Multi-hop Question Answering. EMNLP, 2018. [Paper] [Data] [Code]
CoQA. Introduced by Siva Reddy and Danqi Chen and Christopher D. Manning in CoQA: A Conversational Question Answering Challenge. TACL, 2019. [Paper] [Data] [Code]

Visual-based Datasets

VQA. Introduced by Stanislaw Antol and Aishwarya Agrawal and Jiasen Lu and Margaret Mitchell and Dhruv Batra and C. Lawrence Zitnick and Devi Parikh in VQA: Visual Question Answering. ICCV, 2015. [Paper] [Data] [Code]
VQG COCO. Introduced by Nasrin Mostafazadeh and Ishan Misra and Jacob Devlin and Margaret Mitchell and Xiaodong He and Lucy Vanderwende in Generating Natural Questions About an Image. ACL, 2016. [Paper] [Data] [Code]
Visual7W Introduced by Yuke Zhu, Oliver Groth, Michael Bernstein, Li Fei-Fei in Visual7w: Grounded question answering in images. CVPR, 2016. [[Paper]]([https://arxiv.org/pdf/1511.03416] [Data] [Code]
FVQA Introduced by Peng Wang, Qi Wu, Chunhua Shen, Anton van den Hengel, Anthony Dick in FVQA: Fact-based Visual Question Answering. IEEE Trans. Pattern Anal. Mach. Intell., 2018. [Paper] [Data]

PersistenceForever / Neural-Question-Generation-Survey-List

Neural Question Generation Survey

Table of Contents

Structured NQG Models

Traditional Seq2Seq Models

RNN-based

Transformer-based

Graph2Seq Models

Pre-trained Seq2Seq Models

PLMs-based

LLMs-based

Unstructured NQG Models

Traditional Seq2Seq Models

RNN-based

Transformer-based

Graph-based Models

Pre-trained Seq2Seq Models

PLMs-based

LLMs-based

Visual2Seq Models

CNN-based

GNN-based

Generative Networks-based

PLMs-based

Hybrid NQG Models

Knowledge Base-based Datasets

Text-based Datasets

Visual-based Datasets

About