如何对软件质量进行评估(1)
1.2 软件质量特征按照软件质量国家标准GB-T8566--2001G,软件质量可以用下列特征来评价:a.功能特征:与一组功能及其指定性质有关的一组属性,这里的功能是满足明确或隐含的需求的那些功能。
b.可靠特征:在规定的一段时间和条件下,与软件维持其性能水平的能力有关的一组属性。
c.易用特征:由一组规定或潜在的用户为使用软件所需作的努力和所作的评价有关的一组属性。
d.效率特征:与在规定条件下软件的性能水平与所使用资源量之间关系有关的一组属性。
e.可维护特征:与进行指定的修改所需的努力有关的一组属性。
f.可移植特征:与软件从一个环境转移到另一个环境的能力有关的一组属性。
其中每一个质量特征都分别与若干子特征相对应。
2 评估指标的选取原则选择合适的指标体系并使其量化是软件测试与评估的关键。
评估指标可以分为定性指标和定量指标两种。
理论上讲,为了能够科学客观地反映软件的质量特征,应该尽量选择定量指标。
但是对于大多数软件来说,并不是所有的质量特征都可以用定量指标进行描述,所以不可避免地要采用一定的定性指标。
在选取评估指标时,应该把握如下原则:a.针对性即不同于一般软件系统,能够反映评估软件的本质特征,具体表现就是功能性与高可靠性。
b.可测性即能够定量表示,可以通过数学计算、平台测试、经验统计等方法得到具体数据。
c.简明性即易于被各方理解和接受。
d.完备性即选择的指标应覆盖分析目标所涉及的范围。
e.客观性即客观反映软件本质特征,不能因人而异。
应该注意的是,选择的评估指标不是越多越好,关键在于指标在评估中所起的作用的大小。
如果评估时指标太多,不仅增加结果的复杂性,有时甚至会影响评估的客观性。
指标的确定一般是采用自顶向下的方法,逐层分解,并且需要在动态过程中反复综合平衡。
3 软件质量评估指标体系通常,我们在软件的测试与评估时,主要侧重于功能特征、可靠特征、易用特征和效率特征等几个方面。
在评价活动的具体实施中,应该把被评估软件的研制任务书作为主要依据,采用自顶向下逐层分解的方法,并参照有关国家软件质量标准。
3.1 功能性指标功能性是软件最重要的质量特征之一,可以细化成完备性和正确性。
目前对软件的功能性评价主要采用定性评价方法。
a.完备性完备性是与软件功能完整、齐全有关的软件属性。
如果软件实际完成的功能少于或不符合研制任务书所规定的明确或隐含的那些功能,则不能说该软件的功能是完备的。
b.正确性正确性是与能否得到正确或相符的结果或效果有关的软件属性。
软件的正确性在很大程度上与软件模块的工程模型(直接影响辅助计算的精度与辅助决策方案的优劣)和软件编制人员的编程水平有关。
对这两个子特征的评价依据主要是软件功能性测试的结果,评价标准则是软件实际运行中所表现的功能与规定功能的符合程度。
在软件的研制任务书中,明确规定了该软件应该完成的功能,如信息管理、提供辅助决策方案、辅助办公和资源更新等。
那么即将进行验收测试的软件就应该具备这些明确或隐含的功能。
目前,对于软件的功能性测试主要针对每种功能设计若干典型测试用例,软件测试过程中运行测试用例,然后将得到的结果与已知标准答案进行比较。
所以,测试用例集的全面性、典型性和权威性是功能性评价的关键。
软件质量评估的评估指标的选取原则
选择合适的指标体系并使其量化是软件测试与评估的关键。
评估指标可以分为定性指标和定量指标两种。
理论上讲,为了能够科学客观地反映软件的质量特征,应该尽量选择定量指标。
但是对于大多数软件来说,并不是所有的质量特征都可以用定量指标进行描述,所以不可避免地要采用一定的定性指标。
在选取评估指标时,应该把握如下原则:a.针对性即不同于一般软件系统,能够反映评估软件的本质特征,具体表现就是功能性与高可靠性。
b.可测性即能够定量表示,可以通过数学计算、平台测试、经验统计等方法得到具体数据。
c.简明性即易于被各方理解和接受。
d.完备性即选择的指标应覆盖分析目标所涉及的范围。
e.客观性即客观反映软件本质特征,不能因人而异。
应该注意的是,选择的评估指标不是越多越好,关键在于指标在评估中所起的作用的大小。
如果评估时指标太多,不仅增加结果的复杂性,有时甚至会影响评估的客观性。
指标的确定一般是采用自顶向下的方法,逐层分解,并且需要在动态过程中反复综合平衡。
软件测试的基本标准是什么?
1)所有的测试都应追溯到用户需求。
软件测试的目标在于揭示错误。
从用户角度来看,最严重的错误是那些导致程序无法满足需求的错误。
(2)应当把“尽早地和不断地进行软件测试”作为软件测试者的座右铭。
应该在测试工作真正开始前的较长时间内就进行测试计划。
测试计划可以在需求模型一完成就开始,详细的测试用例定义可以在设计模型被确定后立即开始。
因此,所有测试应该在任何代码被产生前就进行计划和设计。
(3)pareto原则:测试发现的错误中80%很可能起源于20%的模块中。
当某个功能出问题,其对用户的影响有多大?然后根据风险大小确定测试的优先级。
优先级高的测试,优先得到执行,一般来讲,针对用户最常用的20%功能(优先级高)的测试会得到完全执行,而低优先级的测试(另外用户不经常用的80%功能)就不是必要的,如果时间或经费不够,就暂时不做或少做。
(4)完全测试是不可能的,测试需要终止。
测试无法显示软件潜在的缺陷,“测试只能证明软件存在错误而不能证明软件没有错误”。
最初的测试通常把焦点放在单个程序模块上,进一步测试的焦点则转向在集成的模块簇中寻找错误,最后在整个系统中寻找错误。
在测试中不可能运行路径的每一种组合。
然而,充分覆盖程序逻辑,并确保程序设计中使用的所有条件是有可能的。
(5)应由独立的第三方来构造测试。
第三方测试最大的特点在于它的专业性、独立性、客观性和公正性。
对于软件开发商来说,经过第三方测试机构的测试,不仅可以通过专业化的测试手段发现软件错误,帮助开发商提升软件的品质,而且可以对软件有一个客观、科学的评价,有助于开发商认清自己产品的定位。
对于行业主管部门以及软件使用者来说,由于第三方测试机构独立公正的地位,可以对被测试的软件有一个客观公正的评价,帮助用户选择合适、优秀的软件产品。
(6)充分注意测试中的群集现象。
测试后程序残存的错误数目与该程序中已发现的错误数目或检错率成正比。
不要在某个程序段中找到几个错误就误认为该程序段就没有错误而不再测试,相反应该对错误群集的程序段进行重点测试。
(7)尽量避免测试的随意性。
测试计划应包括:所测软件的功能,输入和输出,测试内容,各项测试的进度安排,资源要求,测试资料,测试工具,测试用例的选择,测试的控制方法和过程,系统的配置方式,跟踪规则,调试规则,以及回归测试的规定等以及评价标准。
(8)兼顾合理的输入和不合理的输入数据。
(9)程序修改后要回归测试修改程序后,应该重新进行测试以确认修改没有引入新的错误或导致其他代码产生错误。
(10)应长期保留测试用例,直至系统废弃。
妥善保存测试计划,测试用例,出错统计和最终分析报告,为维护等提供方便。
软件质量保证和软件测试的区别
概括地说,软件质量就是“软件与明确的和隐含的定义的需求相一致的程度”。
具体地说,软件质量是软件符合明确叙述的功能和性能需求、文档中明确描述的开发标准、以及所有专业开发的软件都应具有的隐含特征的程度。
影响软件质量的主要因素,这些因素是从管理角度对软件质量的度量。
可划分为三组,分别反应用户在使用软件产品时的三种观点。
正确性、健壮性、效率、完整性、可用性、风险(产品运行);可理解性、可维修性、灵活性、可测试性(产品修改);可移植性、可再用性、互运行性(产品转移)。
软件质量保证(SQA)是建立一套有计划,有系统的方法,来向管理层保证拟定出的标准、步骤、实践和方法能够正确地被所有项目所采用。
软件质量保证的目的是使软件过程对于管理人员来说是可见的。
它通过对软件产品和活动进行评审和审计来验证软件是合乎标准的。
软件质量保证组在项目开始时就一起参与建立计划、标准和过程。
这些将使软件项目满足机构方针的要求。
关系:简要的理解,软件质量是一个名词,软件质量保证是一个动词,是一种技术方法,是为了实现优秀的软件质量的一个工作。
在某一层次上说,软件质量保证和软件测试异曲同工。
软件质量是测试人员测试出来的 这句话正确吗
360硬件大师,原鲁大师,国人都爱用,但是也是相对不靠谱的软件。
下边推荐一些国际上比较出名的软件。
整机类测试软件 LavalysEverest和SiSoftSandraPro是目前使用最多的两款软件,它们分别有各自不同的特点和使用方法。
LavalysEVEREST,也就是以前著名的AIDA32,是一个测试软硬件系统信息的工具,它可以详细的显示出PC每一软件提高电脑性能个方面的信息。
支持上千种(3400+)主板和上百种(360+)显卡,支持对并口/串口/USB这些PNP设备的检测,支持对各式各样的处理器和内存的侦测。
EVEREST有HomeEdition和Professional两个版本。
其中Professional是收费的商业版本,HomeEdition则是免费软件。
相比Professional,HomeEdition只是少了数据分析和数据库连接功能,而在硬件检测方面,HomeEdition没有任何缩水。
相比EVEREST,SiSoftSandraPro更侧重于系统分析与评测,它有超过30种以上的测试项目,主要包括CPU、Drives、CD-ROM/DVD、Memory、SCSI、APM/ACPI、鼠标、键盘、网络、主板、打印机等。
SiSoftSandraPro在硬件信息检测上没有EVEREST细致和繁多,但却可以得到各种硬件的大致性能。
因此这两款软件经常一起使用,EVEREST取得系统软硬件的详细信息,SiSoftSandraPro则了解系统性能所处的水平。
稳定性测试软件 Superπ 顾名思义,Superπ是一款用来计算圆周率的软件,但它更多的被用于测试CPU速度和系统的稳定性。
由于运行圆周率计算时需要大量的系统资源,且CPU一直处于高负荷运行,因此即使你的系统运行一天的Word、Photoshop都没有问题,而运行Superπ也不一定能通过。
使用方法:选择你要计算的位数(一般采用104万位),点击开始就可以了。
性能上,运算所需要的时间越短越好;稳定性上,以没有出现任何错误为判断依据。
Prime95 和Superπ类似,Prime95也是利用不停计算函数来达电脑测试软件到测试系统稳定性的目地,只不过它计算的是梅森质数。
不过Prime95的测试环境非常苛刻,即使能在Superπ中顺利通过419万次测试的系统,也不见得能在Prime95中熬过1分钟。
因此很多玩家用Prime95来测试超频后的CPU,并以此作为超频成功的证据。
Prime95的使用也很简单,从官方网站下载最新版本安装运行,点击菜单栏“Option(选项)”中的“CPU”即可对测试进行设置。
在这里,用户可以设置测试的时间、测试所使用的内存容量、测试的起始和结束时间,以及CPU的型号、实际频率以及缓存等信息。
设置好后点击“Option(选项)/TortureTest(稳定性测试)”开始启动测试。
由于Prime95的系统稳定性测试消耗的系性能测试工具统资源并不多,用户可以在测试期间进行其它操作,这时Prime95会在系统托盘中生成一个红色的图标,代表测试正在顺利进行着,如果这个图标的颜色在测试还没有结束之前就变成黄色了,说明测试失败,你的系统没有达到Primr95所要求的稳定性。
Prime95默认的测试时间为12小时,如果通过12小时的测试,那说明系统稳定;如果能通过24小时以上的测试,那么这个系统就基本不会因为稳定性而出现故障。
Prime95同样也有性能测试功能。
只要选择“Option(选项)/Benchmark(性能测试)”就可以对系统性能进行测试,测试以运算一定函数量所花费的时间作为标准,耗时越少说明系统性能越强。
PassMarkBurnInTestProfessional 与Superπ和Prime95不同,PassMarkBurnInTe计算机性能测试软件stProfessional是一款专业的系统可靠性和稳定性测试工具,它通过对CPU、硬盘、声卡、显卡(2D/3D)、打印机、内存、串口、网络、磁带机、并口以及计算机系统与其它外围设备的持久运行,来测试系统是否稳定,可以说非常的全面。
测试时,首先在软件界面中点击菜单“Configuration/Testdutycycles”选择测试项目,一些测试项目,如CD-RW/DVD(光驱)、Printer(打印机)、USB等,需要准备有满容量的光盘、打印纸和USB等必须设备,我们可以不进行选择。
选择好测试项目后可以在“Testpreferences”中对每个项目进行微调,并可以将此配置保存为文件(Saveconfigas)在需要时载入(LoadConfig)。
完毕后选择菜单“Test/Starttestrun”运行测试,屏幕上出现很多个窗口,可以看到各个设备的实时运行情况。
测试运行一段时间后请按下“Stop”按钮,停止测试,在主界面的ResultSheet中就会出现测试结果,看是否有错误。
CPU测试软件 WCPUID、CPU-Z、Intel官方CPU检测软件(IntelProcessorIdentificationUtility) 内存测试软件 MemTest、Memtest86+ 注意:Memtest86+的安装和使用和其它内存测试软件有些不同,因为它不能在Windows下运行。
不过还是有四种方式可以运行此程序,分别为ISO引导盘、Linux下使用的bin文件、USB启动盘使用的EXE文件和软盘引导制作包(官方网站:) 硬盘测试软件 硬盘测试方面,有很多软件可供使用,包括系统自带的工具,硬盘厂商提供的电脑性能测试软件下载专用软件以及第三方软件,如HDTune、DriverHealth等。
光驱测试软件 常用的软件有NeroInfoTool和NeroCD-DVDSpeed 显卡测试软...
软件测试中对软件质量进行度量的指标常用的有哪些?
你好! 有N多种指标:缺陷统计数据的度量(I)所有缺陷数量的时间走势或趋势统计 (Bug Trends By Time)未被处理的缺陷按照严重程度的统计 (Active Bugs By Severity) 未被处理的缺陷按照优先程度的统计 (Active Bugs By Priority)未被处理的缺陷数量的时间走势或趋势统计 (Active Bugs Over Time)已发现缺陷的数量和已修复的缺陷的数量的比率 (Fixed/Found)。
也被称为修改率或纠错率(Fix Rate) 未处理的缺陷数量和已处理的的缺陷数量的比率 (active/resolved)已处理的被修复的缺陷数量和已处理的缺陷数量的比率(Resolved as Fixed/resolved)重新被激活的已修复的缺陷数量(Bug re-activation rate)通过测试找到的缺陷的统计(Bugs opened by testing activity)所有的缺陷按照严重程度的统计(All Bugs By Severity)新被发现的缺陷按严重程度的统计 (Opened Bugs By Severity) 已处理的缺陷按照严重程度的统计 (Resolved Bugs By Severity) 被修复的缺陷按照严重程度的统计 (Fixed By Severity)不同语言版本缺陷数量的统计(Bugs opened by Language version)被报告存在缺陷的各功能统计(Where your bugs were found)处理缺陷的平均时间的统计(Average Time to Resolve)关闭缺陷的平均时间的统计(Average Time to Close)被处理缺陷的不同结论统计(Resolved Bugs By Resolution)详细的信息你可以留下邮箱,我发给你文件!