《基于图像理解的众包测试报告抽样分析烟研究计算机科学与技术专业.docx》由会员分享,可在线阅读,更多相关《基于图像理解的众包测试报告抽样分析烟研究计算机科学与技术专业.docx(32页珍藏版)》请在优知文库上搜索。
1、摘要1Abstract2前言3第一章绪论41.1 研究背景及意义41.2 研究内容概述61.3 本文的主要工作71.4 本文的组织结构8第二章相关工作与理论基础92.1 众包测试技术92.2 测试报告分析技术102.3 图像处理技术112.4 抽样技术122.5 本章小结13第三章众包测试报告抽样分析流程143.1 问题描述143.2 文本处理15321提取关键词153.2.2文字距离163.3 截屏处理163.3.1 图像理解17332截屏距离173.4 混合距离183.5 聚类193.6 抽样193.7 本章小结20第四章实验结果与分析214.1 实验设置214.2 实验结果214.2.1
2、 评价标准224.2.2 对比结果224.3 实验分析244.4 本章小结25第五章总结与展望275.1 本文总结275.2 后续工作展望28参考文献29致谢错误!未定义书签。摘要众包测试可以通过模拟真实使用场景的方式,提供真实用户反馈,达到全面可靠的错误检测。缺陷报告是描述软件缺陷的重要软件构件,由于程序员很难编写没有任何缺陷的程序,所以在软件开发过程中,发现和修正缺陷是很有必要的。在众包软件测试中,检查大量的测试报告是一项工作量很巨大但又不可避免的软件维护任务。在移动测试领域,测试报告通常包含更多的屏幕截图和更短的描述性文字,由于文本信息不足,以及自然语言的模糊性,重现缺陷的文本描述可能会
3、被编写的不明确甚至是误导,通过截屏辅助移动众包测试技术具有深远的研究意义。通过查阅相关文献,了解了相关技术的研究现状,本文提出了一种分析测试报告的方法,即在原本对文本描述进行处理的基础上,加入基于图像理解的技术对众包测试报告进行聚类,并在聚类的类簇中进行抽样,进而帮助开发人员更高效地发现报告中描述的移动应用中的错误。本文选取了华为运动等多个移动应用的测试报告,对其进行抽样分析,并设计了文本聚类、截屏聚类、文本和截屏的混合聚类以及随机情况下四种不同抽样基准的对比实验。通过对实验结果的观察分析,可以肯定的是,对测试报告中的屏幕截图进行处理是一项很有意义的工作,随着移动应用的普及,图像已经成为了十分
4、基本的信息源之一。关键词:众包测试;测试报告;图像理解;抽样技术AbstractCrowdsourcingtestscanproviderealuserfeedbackbysimulatingreal-worldusagescenariostoachievecomprehensiveandreliableerrordetection.Bugreportsisanimportantsoftwarecomponenttodescribesoftwarebugs.Becauseprogrammerscantwriteprogramswithoutanybugs,intheprocessofsoftw
5、aredevelopment,itisnecessarytofindandcorrectbugs.Incrowdsourcingsoftwaretesting,checkingalargenumberoftestreportsisahugebutinevitabletaskofsoftwaremaintenance.Inthefieldofmobiletesting,testreportsusuallycontainmorescreenshotsandshorterdescriptivetext.Becauseofthelackoftextinformationfortestreports,a
6、lsobecauseoftheambiguityofnaturallanguageandthedescriptionofthereproducingbugsthatcanbewritteninambiguousorevenmisleading,itisofgreatsignificancetostudythetechnologyofcrowdsourcingbyscreen.Byconsultingtherelevantliteratureandrealizingtheresearchstatusofrelatedtechnologies,thispaperpresentsamethodfor
7、analyzingtestreports.Thatis,onthebasisoftheoriginaldescriptionofthetext,introducingimage-basedtechnologytoclustertestreportsandsamplinginclustercluster.Thisinturnhelpsdevelopersmoreefficientlyfindbugsinthemobileapplicationsdescribedinthereport.Inthispaper,thetestreportsofmobileapplicationssuchasHuaW
8、eiareselectedandanalyzed.Wedesignthecomparisonexperimentoffourdifferentsamplingbenchmarksofthemixedclusteringoftextclustering,screenshotclustering,textandscreenshot,andrandom.Throughobservationandanalysisofexperimentalresults,thereisnodoubtthat,handlingscreenshotsinthetestreportisaworthwhileeffort.W
9、iththespreadofmobileapplications,imageshavebecomeoneofthemostbasicsourcesofinformation.Keywords:CrowdsourcingTest;BugReports;ImageUnderstanding;SamplingTechnique众包技术目前已经被广泛应用于软件工程领域。众包是指,将原本应该由公司内部员工完成的工作任务,以自由自愿的形式包给非特定的大众网络的做法,这为个人和商业提供了一种利用互联网上大量人力资源来解决问题的新途径。采用众包技术,可以向开发人员提供真实用户的信息和操作,并且这些用户提供的数
10、据是来自于真实、多样的软件和硬件平台上执行的任务。也正是由于众包测试的这一特性,会以大量的用户群为基础,产生的测试报告数量亦将是一个庞大的数字。尽管大量的测试报告有助于提高软件的质量,但是分析这些测试报告也是一个非常具有挑战性的任务,开发人员也就有必要寻找更好的发现缺陷、确定有用信息的方法。在过去的几十年里,软件工程的研究人员提出了许多处理方法。大多数关于测试报告分析的工作会关注如何对测试报告进行有效的预处理,如重复测试报告的识别、测试报告分类等。在几乎所有的这些方法中,都是根据测试报告的文本相似性”或是执行轨迹一进行捕获和分析的。然而对于移动应用众包测试的报告来说,由于在移动平台上截图比打字
11、更方便,测试人员往往会在测试报告中包含更多的截屏而使描述性的文字更简短。本文提出了一种方法,即通过一种基于图像理解的技术对移动应用众包测试的报告进行聚类,在聚类的类簇中进行抽样,进而帮助开发人员更快地处理测试报告,从中更高效地发现移动应用中的错误。通过将数个移动应用的测试报告作为样本,进行文本聚类、截屏聚类、文本和截屏的混合聚类以及随机情况下这四种不同抽样基准的对比实验,以检测到的故障的平均百分比(APFD)作为评估标准,验证了这种方法的优势。可以发现,随着移动应用越来越普及,图像已然成为一种十分基本的信息源,截屏在移动应用众包测试的报告中举足轻重。第一章绪论本章首先介绍了众包测试报告抽样分析
12、的研究背景和意义,其次简单介绍了基于图像理解的众包测试报告抽样分析的研究内容,并概述了本文所做的主要工作,在本章的最后介绍了本文的组织结构。1.1 研究背景及意义随着移动应用的普及,由于众包测试能够在短时间内提供反馈,提高移动应用的可用性和质量,应用众包测试己经成为一种十分流行的方法。众包技术的一个关键优势是,它们可以向工程师提供真实用户的信息和操作,而这些用户提供的数据来自于真实、多样的软件和硬件平台上执行的任务。例如,众包测试(如beta测试)可以为大量用户、硬件和操作系统提供验证数据。这样的好处对于移动应用程序测试来说是十分理想的,因为它通常需要快速的开发和部署迭代,并且支持许多移动平台
13、。此外,众包移动测试可以为开发人员提供真实用户的反馈、新特性请求和用户体验信息,这些信息很难通过常规的软件测试实践获得。基于这些原因,在过去的5年里出现了一些较为成功的众包移动测试平台(如uTest,Testin)o众所周知,软件维护活动通常是十分昂贵且具有挑战性的。在具体的实践中,移动众包测试的目标是通过充分利用庞大的劳动力来提供真实用户的反馈,众包测试报告的数量往往会很多,如图1.1和图1.2,显示了APaChe和ECIiPSe两个软件项目在2013年的连续时间段里,每天的测试报告提交和处理的相关数据。可以发现,在众包测试中,存在着大量的测试报告需要开发人员进行分析和处理。如何有效地处理测
14、试报告并发现其中描述的缺陷,对于在移动应用程序中应用众包测试来说,是一项关键的挑战。并且这也使得众包测试涉及到许多终端用户,他们的软件工程知识差异可能会很大。在这种情况下,对于开发人员来说,重现缺陷的文本描述可能会被编写得很糟糕(甚至是误导),而对屏幕截图信息进行分析处理,可以有效提升对移动众包测试报告的理解。测试报告的数量图1.2EdiPSe每天提交和处理的测试报告数量与桌面软件或网络软件的测试报告相比,移动应用程序的测试报告中所包含的文本描述更短。对于移动测试来说,屏幕截图比手动键入长段的文本描述要方便的多,因此记录者通常更倾向于提供简短的文字描述而在报告中添加活动视图的必要截屏。在这种情
15、况下,图像对于众包测试报告的理解有着重要的作用,在对文本信息进行处理的基础上,加入图像的分析处理,能够在一定程度上帮助开发人员更快更高效地发现测试报告中报告的缺陷信息。在软件工程领域,与自然语言处理(NLP)技术相比,图像分析和理解技术很少被研究和学习,这些技术旨在分析文本信息,并被广泛应用于协助各种软件工程任务。图像理解是计算机视觉领域的一个重要问题。由于匹配算法必须考虑到缩放、光照和旋转等因素,图像匹配真实对象尤其具有挑战性。幸运的是,在本文的相关工作中比较的图像是由不同设备的不同应用程序所呈现的应用程序视图的屏幕截图。本实验针对具有至少一张图片的测试报告,捕获了文本和图像信息,测量了这些
16、部分之间的相似性,在此基础上进行聚类和抽样,目的是帮助开发人员更快地发现移动应用中存在的错误。在众包移动应用测试的场景下,传统的缺陷报告分析理解技术不能很好地适用,已有少数研究学者开始关注如何结合移动众包测试的特性,研究对应的缺陷报告分析和理解技术,这也逐步成为研究的热点。1.2 研究内容概述对于众包软件测试,在实践中,测试报告中会存在各种形式的多媒体信息,例如语音信息和简短的操作视频。但根据以往的经验来看,在这些信息中,文本描述和屏幕截图是被最广泛使用的两种。对于众包的移动应用测试来说,测试人员则更倾向于针对移动应用的特性,使用更容易捕捉的完整的活动视图的截屏来描述错误。于是,在本文中,我们将重点放在移动屏幕截图的处理上。我们假设每个测