测试之道——阿里巴巴八年测试专家倾情奉献

发表于：2018-06-15 作者：雷藏来源：云栖社区

　　摘要：我从事测试工作将近八年了，从起初的不懂测试，怀疑测试，到相信测试，再到坚定测试，其中经历的辛酸、煎熬无法言表。在从事测试工作的这八年里，有人质疑，也有人追捧，唇枪舌剑，没完没了，貌似测试永远都是个站在舆论风口浪尖的角色。

　　一、前言

　　我从事测试工作将近八年了，从起初的不懂测试，怀疑测试，到相信测试，再到坚定测试，其中经历的辛酸、煎熬无法言表。在从事测试工作的这八年里，有人质疑，也有人追捧，唇枪舌剑，没完没了，貌似测试永远都是个站在舆论风口浪尖的角色。本文乃在下之精血所作，是我对测试的高度概括，旨在帮助大家了解测试，新人可以更好地从事测试工作，老人可以进行测试探讨，交流思想。为了尽量让更多的人理解测试，本文重在述道，少说测试之术，相信看完之后，各位自有论断，功过是非留于各位看官说。

　　二、测试的万能模型

　　为什么上来就谈这个？测试的模型既是我对测试认知的高度建模，也是帮助大家理解测试，理解我观点的出发点，正所谓“风，生于地，起于青萍之末”，任何事情都是有本因的，大道至简，理解了核心思想再看观点，就有了论据，这正如修炼武功，根基决定了以后武术达到的高度，否则就如“无本之木，无源之水”，虽然我言之凿凿，但大家却都不知吾之所云。

　　佛家修炼有三个境界：看山是山，看水是水；看山不是山，看水不是水；看山还是山，看水还是水。从我对测试的经历和认知来说非常吻合，起初开始做测试的时候感觉测试工作是无聊的，枯燥的，而且并没有太大技术含量，以为这就是测试。但是随着工作阅历的增加，觉得测试越来越难，面对各种被测系统，我真的无法用一种通用的方法，或者通用工具满足所有的测试需求。于是开始拼命学习各种系统的实现，尝试去了解我的被测系统。我测试过的系统有java开发的，也有C++开发的，也有其它语言开发的，于是我对各种语言都有一定了了解，开始研究如何测试他们。随着光阴流逝，对测试认识的逐步加深，我发现所有的测试理念都是相通的，渐渐的，我悟出了万能的测试模型：y= f(x)。对，你没看错，就是我们所学的函数表达式。

　　x是我们的输入，y是f(x)的输出，f(x)表示的是被测系统的功能。测试的思路就是：选择适当的x，代入f(x)，得到y，跟我的预期结果y’进行对比，从而得出被测流程是pass还是fail。用图表示：

　　对于测试人员来说SUT（System Under Test，被测系统）是个黑盒，测试人员一般不太会关注f(x)的具体实现逻辑，只会关注f(x)的功能。比如，假设f(x)= 2^x，程序可以用“x个2相乘”实现，也可以用“左移位”的方法实现，作为测试人员关注点只在于“有没有正确实现需求？”，“功能满足后性能如何？有没有安全问题？”，关注点不在“怎么实现”，而在“实现的怎么样”上面（这也是测试思维跟开发思维的本质区别）。是故，弄懂业务，理解产品需求是测试的前提。

　　也许有人会问，没那么简单吧，系统那么复杂，仅仅一个y= f(x)，怎么能全部归纳？你这里只有一个请求，一个响应，系统那是多复杂啊，数据库，缓存，异步消息，日志等。这里得强调的是，x，y表示的绝不仅仅是request和response，而是广义的输入和输出，什么区别？request和response只是输入输出的一种，对于SUT来说，只要是读的数据都算输入，比如：用户登陆的功能，当我填入一个用户名进行登录时，我的输入除了在页面上填入的“用户名”和“密码”，DB中也必须有这条用户记录（当然用户不存在也是一种测试场景），所以DB中的这条用户记录也算输入，甚至如果登录系统处理过程中去查询安全系统，安全系统返回的“用户安全策略”也算输入。所以，这里的输入是广义的输入，包含了用户页面填入的“用户名/密码”，DB中的“用户记录”，安全返回的“用户安全策略”等。同理，输出也是广义的，包括“DB的写”，“对其它系统的请求”，“打印的日志”，“对缓存的put”，“发出的异步消息”等。于是我们的测试万能公式可以进化成下面的样子：y1,y2,y3,…,yn= f(x1,x2,x3,…,xn)。我们测试工作其实就是确定每一个x的取值范围，然后选用合适的x1到xn的组合数据（一组数据其实就是一个测试用例），代入f，然后将得到的y1…yn跟预期的y1’…yn’进行比较，从而判断被测场景的正确性。用图表示：

　　所以，一个合格的测试，必须理清“SUT的功能”，“SUT的所有输入”，“每一个输入的取值范围”，“SUT的所有输出”，“根据功能推出每一个输出的预期值”。

　　这里还要强调的一点是，这里的SUT是很有讲究的，在我看来除了静态走读代码的方式算是白盒测试外，其它的一切测试都算黑盒，只是这个“盒子”的大小不同而已。单元测试中“盒子”比较小，就是一个或者若干个方法；接口测试的“盒子”就会扩大到应用级别；集成测试的“盒子”就会扩大到系统级别。

　　弄懂了测试的模型，就可以开始剖析测试各个的关键点。

　　三、测试的目的

　　测试的目的就是规避Bug。为什么用“规避”而不是“找”？因为对于所有的测试用例来说，并不是每一条都能测出Bug，对于没能测出Bug的用例执行，你能说测试工作没有价值吗？显然不能，对于测试人员来说，在未执行测试之前，假设的前提是所有的被测流程都处于未知状态，只有执行完对应的测试用例这个流程状态才变得可知——pass或者fail，对于fail的测试用例我们是找到了Bug，而对于pass的测试用例我们没有也不可能找到Bug，所以不管pass还是fail，测试执行工作都是有价值的，这里只能用“规避Bug”来精确地阐述测试工作的目的。

　　四、测试的步骤

　　再来看一下测试的模型图：

　　如前面所述，测试工作其实就是确定每一个x的取值范围，然后选用合适的x1到xn的组合数据（一组数据其实就是一个测试用例），代入f，然后将得到的y1…yn跟预期的y1’…yn’进行比较，从而判断被测场景的正确性。由此可以总结出，测试工作步骤就是：

　　“确定x1至xn的组合数据”

　　“将每组数据传入SUT”

　　“根据需求确定每组输入数据输入后产生的预期输出结果y1’至yn’”

　　“将预期结果和实际结果y1,y2,…,yn进行比对，从而得出结论”

　　五、测试的难点

　　对于上面四步，第3点和第4点相对容易，测试的主要难点在于第1点和第2点：

　　1. 如何找齐所有的x和y？

　　想要找齐所有的x和y，就必须要求你对系统非常熟悉，对流程非常熟悉。系统依赖如何？流程调用，系统如何处理、交互？产生哪些反应？典型的输入有：调用请求，读DB数据，读缓存数据，被依赖系统的返回数据，收到的异步消息等；典型的输出有：写DB，写缓存，写日志，调用依赖系统的请求，发出的异步消息等。所以这个需要你对你的被测系统和流程必须非常非常的熟悉。

　　2. 如何确定合适的x1至xn的组合？

　　首先，你要熟悉每个x的可能取值，除了正常值，还有异常值，这个对测试工程师的要求非常高。为了清楚所有x的可能取值：

　　不仅需要，你对业务、业务数据非常非常的熟悉。注意，这里我把“业务”和“业务数据”分开，指的是两个不同的东西。“业务”指的是产品提供的功能，比如：登录可以用账密登录，也可以用手机扫码登录。“业务数据”指的是产品在线上日以继夜的运行后产生的数据，如，注册功能，有通过淘宝注册的淘宝用户，也有通过支付宝注册的支付宝用户，甚至还有数据打通从其它地方同步过来的其它用户数据，你要对这些个业务数据非常熟悉。

　　还需要，你要对系统间依赖的接口非常熟悉。这个主要是为了弄清楚你的SUT对依赖系统的调用，哪些调用请求的传参是合法的？哪些是不合法的？依赖方会传回给你哪些可能的数据或者响应，最好有规范的接口文档（可惜现在奇缺）。

　　还需要，你对其它的输入方式的数据类型有比较深刻的认识。针对我负责的系统，主要是前面两个方面，当然根据不同的系统情况也有所不同，这个得具体问题具体分析。

　　其次，当所有的x可能取值确定以后，这里就会利用专业的测试用例设计方法，对x1至xn的组合进行设计。设计方法有：等价类，边界值，因果图，判定表，正交法等等，这些在很多的软件测试书中都有详细的介绍，在此不作细表，有兴趣的可以自行查阅。

　　3. x1至xn如何传入SUT？

　　这个用一个词来精准形容就是“驱动”，如何驱动你的测试流程？其实这个很体现测试工程师的水平。如果你用的是手工测试，那肯定得搭建测试环境，必须让你的SUT运行起来，然后预置各种数据，调用你的流程。如果你是自动化测试，这里其实是有两种方式：

　　部署被测系统，模拟客户端发送请求驱动；

　　直接依赖被测系统代码，用本地代码调用的方式驱动。

　　总体来说，“驱动”的方式就是两种，跟语言无关，各种语言通用：

　　代码驱动。这个没什么好说的，就是把你SUT的代码直接依赖过来，通过代码直接调用的方式进行驱动。

　　协议驱动。这个也包含广义上的一些RPC调用，主要有http，https，ftp，telnet，hsf，dubbo等。

　　六、测试系统理念的提出

　　如前面所述，测试工作的步骤就是：

　　确定x1至xn的组合数据

　　将每组数据传入SUT

　　根据需求确定每组输入数据输入后产生的预期输出结果y1’至yn’

　　将预期结果和实际结果y1,y2,…,yn进行比对，从而得出结论

　　我们对上述步骤的产出进行分析，1、3两点产出的是“数据”，2、4两点产出的是“逻辑”。第4点的逻辑非常固定，就是预期输出结果和实际输出结果的比对逻辑，而第2点的“驱动”逻辑虽然有代码驱动和协议驱动，而且协议驱动也有很多种，但是因为涉及到的是接口和协议，相对还是比较固定的，不容易发生变化，非常适合将2、4做成应用。我们想象一下，如果有一个测试系统，能根据传给它的数据，完成对各种SUT的测试，那岂不是测试工程师只要产出数据（测试用例）就行了。思路完全可行，因为测试用例本质上就是一个“描述，”一个“用什么样的数据，调用什么样的流程，预期会产生什么样的结果”的描述。这种描述可以是汉语，也可以是英文，也可以是xml格式，又或者是脚本，只要能描述清楚这种语义即可，只不过我们肯定需要对这种描述制定一些格式规范，保证测试系统能够识别这种描述。这样我们的测试系统就可以集用例管理、测试执行、Bug提交、测试报告于一身，成为测试中台（不知道这个用词对不对）的完美转身。我大胆画出这种测试系统的架构示意图：

　　目前我正在这个方面做一些研究，也有一些实质性的产出（驱动模块和用例管理模块），但还待琢磨完善，如果有人有兴趣的也欢迎一起探讨。

　　七、测试人员的核心价值

　　常常被人问起，测试人员的核心价值是什么？跟PD、开发比区别是什么？如果没有经过上面的一系列分析，被人炸一问起还真不好回答。可是今天就不一样了，今天我就谈一下自己认识的测试人员的核心价值。这些是每个测试Leader必须清楚的东西，否则你如何给你团队的成长指明方向，为你的组员答疑解惑授业？

　　测试的核心价值就是：对于任何被测系统，能够全面、高效地规避Bug——发现、定位、解决。注意，这里有四个要素：任何被测系统，全面，高效，Bug

　　1. 要素一：任何被测系统

　　系统的多样性可能会迷惑你的双眼，正如人往往容易在这花花世界中迷失一般，认识不到什么才是真正值得追求的东西，什么才是真财富。有了上面的分析做铺垫，这个就很简单了，其实就是解决“驱动问题嘛”。总是有人对测试框架的搭建，测试环境的搭建产生畏惧，弄懂了这个原理，你就会变得一往无前，就两种驱动嘛，万变不离其宗，只是根据不同的语言略有差异而已，但是我们都已经看到明灯的方向了还会恐惧吗？

　　2. 要素二：全面

　　这个其实就是测试用例的设计问题。这个上面已经分析的很清楚了不在赘述，请参看上面x1,x2,…,xn组合数据的设定。

　　3. 要素三：高效

　　这个主要体现在三个方面：数据准备服务，自动化测试，测试的维护和传承。

　　目前做的最多的也是最成熟的就是数据准备服务，基本上每个产品线都有自己的数据准备工具，如，数据工厂，TAP等。

　　自动化测试也是提升测试效率的主要手段，但是手工测试是不可完全被取代的。自动化测试有其适用场景：手工无法测试；功能稳定不容易变动；频繁回归。即使不可全部自动化，也要想办法进行半自动化，半自动不行就1/4自动化。总之，条件允许我们要自动化，条件不允许我们创造条件也要自动化，将一切可以让电脑干的事情坚决不能让人来干，所以，自动化的程度也体现了一个测试工程师的能力水平。

　　测试的维护和传承，这个是最容易造成劳动力浪费的地方。“宁可全部重写也不愿改别人代码”是工程师的通病，对于开发工程师来说这个问题还好一点，毕竟你不能单独开一个应用，还得在原来的应用中去改，但是对于测试工程师来说，这个问题暴露的尤为严重。测试脚本的独立性决定了每个人写出的自动化脚本风格都不一样，一旦换人，后来的人是能自己写的就坚决不维护别人写的脚本。对于自己写的代码还能做到一些复用和扩展，但也很难让别人来复用你的代码，再换人了继续恶性循环。究根结底，测试脚本没有统一的规划，不仅没有统一风格，也没有统一架构，确实需要也很必要制定一些脚本编码规范，规划一下测试脚本的架构，让测试脚本做到可维护，可复用，可扩展，并沉淀一些测试的服务供测试使用。另一方面，刚毕业的人在写脚本，工作干了五六年的也在写脚本，不信你去看，这两者写出来的脚本还是有很大差距的。刚写脚本的人会把所有的逻辑放在一个testcase里，而一个老手就有了一定的架构意识，该抽象的抽象，该封装的封装。所以，对测试脚本的统一规划，也为测试新人提供了成长的方向，有利于测试新人的迅速成长。另一个思路就是用上面说的“测试系统”来解决这个问题，大家只要按照固定的规范编写用例，测试执行的事情交给系统去做，这个应该是最完美地解决传承问题的解决方案，但前提是“测试系统”需要足够的稳定、强大。

　　4. 要素四：Bug

　　什么是Bug？只要不能满足预期的东西都可以称之为Bug。所以，Bug也是广义的Bug，可以分为功能Bug，性能Bug，安全Bug，甚至流程Bug。对于一个Bug，优秀的测试工程师要能够定位Bug原因，并给出解决方案。

　　对于功能性Bug，没什么好说的，测试工程师的大部分时间都花在了这里。Bug定位的方法，主要的手段就是看日志，Debug。

　　对于非功能性Bug，就有点复杂了，不能一概而论，但还是有方法的。如性能测试中，发现程序卡住了，你会猜测是否出现了线程死锁，对于java应用，你需要使用一些jvm工具去查看线程堆栈，根据线程状态做出判断。只要掌握了一些非功能性Bug的定位方法，定位起来也是有迹可循，最后做到游刃有余的。Bug的定位和解决考验的不仅是测试人员的技术深度，更是知识的广度，所以这一点也是判断一个测试工程师能力水平的重要方面。

　　另外，对于一些流程上面的问题，考验的又是测试工程师的沟通、协调能力。因为真的很难，主导权在PD、开发，作为最后一个环节的测试，有时候真的需要用一些沟通技巧，和修炼出的人格魅力去说服和推进。

　　八、测试岗位性质

　　总结来说，测试属于软件质量把控的最后一环，测试的好坏直接决定了软件质量的好坏。历史上面不乏因为测试不力而造成重大损失的案例：如，程序bug导致了天大的损失，要枪毙程序猿吗？同时，测试又是一个支撑型的岗位，虽然它不直接产出代码，但对测试人员的要求不但不低，而且还非常之高，很多业界的测试大牛都是先成为开发大牛以后再转成测试的，逻辑很简单，因为一个人的能力达到很高的水平以后，如何把自己的能力复制给别人就成了一门学问，最简单直接的办法是，去评估别人的代码，指出别人代码、架构的问题。测试是一个入门简单，越做越难，甚至最后对人的要求高到极为苛刻的地步。测试的管理也是非常难做工作，现实中大家负责的都是不同的需求，你很难去评判两个测试工程师之间的优劣，因为测试的深度体现在思想上，也许你可以从测试用例上面去找到一点蛛丝马迹，又或从沟通中去寻找，又或从发现的Bug上做参考，又或从线上产生的故障上面去找。

　　九、说一说测试的现状

　　测试是个很容易被人误解的一份工作，测试工作本身的复杂性和综合性，决定了测试人员的成长不如单维度作战的开发、PD快，以至于让很多人对测试岗位产生误解，也就不能责怪时不时兴起的“我们需不需要专职QA”的口水战，以至于很多测试人自己都会开始怀疑。这是由于对测试本质认识不清造成的，测试有点像练内家拳，很难修炼，甚至有人修炼三年都不得其门而入，这就不能责怪中途退场者甚众，坚定信念者寥寥。一句话来说，懂测试的人太少了。现在也有很多部门把测试人员强制转成开发人员，试问真的行吗？我从来不怀疑测试存在的价值，也坚定地认为测试不可能被砍掉。试问那些强制把测试转成开发的，转换后产品质量如何？有多少是顶着开发title干着测试的活？当然我没有详细调查过，知道的人可以说说。

　　测试工作的开展需要规范的合作流程，对于管理不严谨的开发流程，测试工作的开展就显得处处掣肘。阿里是个以结果为导向的公司，很多团队对过程都疏于管理：项目延期对绩效无影响；只要线上不出大故障，即使小故障不断对绩效也无影响；发布出故障又怎么样，大不了回滚嘛。在这样的环境里，开发的质量意识也达到了低谷，各种评审省掉，各种评审不叫测试，各种开发完了来找测试验证一下，各种压缩测试时间，甚至我遇到过项目经理的项目计划中竟然没有测试计划，开发完成还死活不肯提测（因为过不了冒烟），再加上鼓吹开发自测，开发完全可以绕过测试，自己随便测测，发布代码上线，出现问题了，再来找测试回归。通过历史经验来看，出现过几次严重的大故障，大部分都是绕过测试，或者开发自测造成的。

　　十、测试与生活

　　生活又何尝不是如此，试想生活中我们对什么东西是了解的很透彻呢？很多事物对于我们来说都是个“黑盒”，你无法了解其中的缘由，但是你知道该怎么使用它。你清楚中医的原理吗？我们的老祖宗还不是用它治病治了数千年；人也是一个“黑盒”，你如何得知你身边都是什么样的人？还不是通过日常中很多事情来测试，了解他，让你交到知心朋友，让你能够知人善用，带好团队；CEO选接班人，一定会让候选人经历不同的部门，通过顺境、逆境来多方面测试，考察其在不同的环境中的表现，最后确定是否让其上位；年终绩效打好以后提交上去让大老板审批，大老板如何审批？还不是通过设定的各个指标的内在关联，整体比例等维度来对这份绩效考评表进行测试的。这样的例子举不胜举，生活处处皆测试，我们都是测试人。

　　我爱测试，测试教会了我很多，教会了我业务，教会了我技术，更重要的是教会了我全局的结构化思维能力，和对事物本因的思考方式，教会了我如何做好管理，教会了我如何做人。

周排行
月排行

软件测试技术

软件测试工具

软件测试管理

软件开发专栏

测试之道——阿里巴巴八年测试专家倾情奉献

热门标签

软件测试技术

软件测试工具

软件测试管理

软件开发专栏

测试之道——阿里巴巴八年测试专家倾情奉献

相关文章

热门标签