linzeqipku / Dissertation

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

博士研究生综合考试报告

一个软件项目在其生命周期中往往会产生大量相关数据(包括源代码以及各种文本形式的资料等),其中蕴含着丰富的软件知识。本文作者的研究兴趣是对这些知识进行提炼、理解与利用,从而为软件开发人员提供智能辅助,以提高软件维护与复用的效率与质量。围绕这一目标,本文对特征定位、问答系统与知识表示学习这三个方面的技术进行了文献综述,并提出了博士论文的研究设想。

第一章介绍特征定位技术,这是在软件维护与复用过程中为软件开发人员提供智能辅助的一类典型工作。特征定位,指的是:对于开发人员指定的一个功能,自动从包含该功能的程序源代码中找出实现该功能的那部分代码。特征定位有助于软件开发人员进行程序理解,从而提高软件维护与复用的效率与质量。根据特征定位技术所采用的具体技术,本章将其分为静态特征定位技术、动态特征定位技术、文本特征定位技术以及它们的组合特征定位技术,并对各类特征定位技术进行了文献综述。

第二章介绍问答系统,动机是希望通过问答的形式将软件知识释放给软件开发者。问答系统是信息检索的高级形式,能够自动理解用户输入的自然语言问句的语义,并找到该问题的答案。问答系统研究兴起的主要原因是信息规模的不断增长与人们对快速、准确地获取信息的需求之间的矛盾。本章将问答系统的整体结构归纳为三部分:问题处理、段落检索与答案处理,分别进行了文献综述,并以IBM Watson问答系统这作为实例进行具体介绍。

第三章介绍知识表示学习技术,动机是希望能借助此类技术对软件知识进行语义分析与推理,以支持问答。知识表示学习是近年来人工智能领域新兴的一个研究热点,指的是通过机器学习的方法,将结构化的知识库映射为潜在语义空间中的表示向量的过程。对于规模庞大、结构复杂的知识库,知识表示学习技术可以有效地表示其中的实体与关联关系的潜在语义,从而提升知识融合、补全、推理等各种任务的性能。本章对目前提出的多种知识表示学习模型进行了文献综述,并以其中最受关注的翻译模型为主,介绍了知识表示学习在面对复杂知识时的处理方法。

综合上述文献综述与作者在读博过程中的研究工作,第四章提出了博士论文的研究设想:面向软件复用的智能问答。

About