当前位置:主页 > 科技论文 > 软件论文 >

面向程序员问答论坛的高质量代码库自动挖掘与检索方法

发布时间:2024-04-26 05:51
  随着软件技术的迅速发展,软件规模越来越大,所涉及的知识领域也越来越多。如何有效提升软件开发效率成为程序开发人员必须面对的重要问题。发掘互联网上各类程序员在线问答网站上已有的高质量代码片段和对应的自然语言描述并利用它们构建代码仓库,不失为一种较为高效可行的方法。高质量代码片段指能够独立解决问题的代码片段。提供与代码问答系统相结合的高质量代码片段仓库,开发者便能在有需要时即时搜索相关代码片段并插入到自己的工程中使用。既缩短了编码时间,又提高了代码的可靠性。然而,构建高质量的代码仓库和代码问答系统也面临着诸多难题。其中核心的问题有两个,即高质量代码问答对的挖掘与问答系统相似问句的检索。在高质量代码挖掘方法上,目前多为人工进行筛选挖掘,这是一项费时费力的工作。在传统代码问答系统中,具有相同或相似的问句之间通常具有文本的不匹配。传统的基于文本匹配的检索难以满足我们检索语义相同的问题的要求。同时,基于语义匹配的算法效率通常低下。针对以上问题本文做出了以下工作。首先,我们收集了在线问答网站Stack Overflow上的Python语言的问题答案对,并提取了其中“How to do it”类型的问句...

【文章页数】:72 页

【学位级别】:硕士

【部分图文】:

图1-1百度搜索引擎搜索结果示例

图1-1百度搜索引擎搜索结果示例

哈尔滨工业大学工学硕士学位论文第1章绪论1.1课题来源本文来源于国家自然科学基金项目:基于启发式选择变异和软件掘的软件错误定位方法(编号61672191)。1.2课题研究的背景和意义随着软件技术的迅速发展,软件规模也越来越大所涉及的知识领多。因此,开发人员开发软件所需要....


图1-2玄机宝盒界面

图1-2玄机宝盒界面

哈尔滨工业大学工学硕士学位论文应的解决方案进行整理,形成自己的知识库。当再次遇到同类问题时,则可以对库中的内容进行查阅,以获得对应的解决方案。玄机宝盒[1]便是开发者用该方法解决开发中遇到问题的一个产物,其界面如图1-2所示。从图中可以看到若要检索某些功能对应的代码,则要通过....


图1-3面向开发者在线论坛StackOverflow的高质量代码挖掘与搜索框架

图1-3面向开发者在线论坛StackOverflow的高质量代码挖掘与搜索框架

图1-3面向开发者在线论坛StackOverflow的高质量代码挖掘与搜索框架本文的工作主要分为三个部分,首先研究高质量代码挖掘方法,即使用深度学习方法从StackOverflow的问答数据中提取出能独立解决问题的代码片段(即高质量代码)。采用Yao[2]等人提出....


图2-1StackOverflow问题答案形式

图2-1StackOverflow问题答案形式

哈尔滨工业大学工学硕士学位论文第2章面向StackOverflow的高质量代码挖掘2.1引言在快节奏的当今社会,软件开发效率对互联网公司来说十分重要,有时系的公司的生死存亡。为了提升软件开发效率,快速实现产品原型,各种适开发的编程语言被创建,各种快速开发框架被开发。虽然....



本文编号:3964805

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3964805.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户1ff35***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]