从用户数据到测试用例?语音测试改良记

发表于：2017-01-09 作者：网络转载来源：

　　在前面的话
　　车联ROM系统是搭载腾讯TAS智能车载系统。系统搭载在路畅华阳合作伙伴硬件平台上，实现了车机联网，实现了智能语音、网络音乐、实时路况、在线升级等特有功能，并且延伸了腾讯的社交基因，微信和QQ社交能力在乘驾上得以延伸。
　　村长下面讲的故事，就是围绕车联ROM中智能语音APP展开，请各位看官了解~

　　一、村长为啥干这事儿
　　村长是一名腾讯移动客户端测试工程师。跟其他的测试同学一样，从需求、计划、用例设计评审、执行、报告、发布按部就班的进行了自己本职的工作，比如说，车联ROM中语音APP的测试。但是有一天村长回头看自己的语音APP的测试用例，发现测试用例越来越多，测试回归验证时间周期不断加长，同时，仍旧有用户反馈的漏侧等各种问题。
　　她不禁思考：测试用例真的“足够好”么？真的可以反应真实用户的使用场景么？回归测试时真的需要去运行如此多的测试用例么？
　　有了这样的疑问和困惑，她去查找很多资料，突然一次例会上交流让她有了新灵感：产品同学对于新功能都会加上埋点以看到用户对新功能的使用反馈，进而对产品设计进行调整。
　　测试：为何不从用户使用角度来对用例进行划分优化呢？
　　二、村长想怎么干
　　在腾讯，倡导的理念就是“一切以用户的价值为依归”。那么在以用户价值为导向的理念下，产品、运营都是从用户使用角度出发，为何测试不能也从用户数据上做文章呢？
　　下一个问题？这个文章怎么做？怎么指导测试用例？那就需要从用户数据入手，抓住用户主要使用场景，进而优化测试策略，最终又通过版本发布反向验证方式的可行性。
　　基础思路：基础数据提取——基础数据清洗——基础数据整合——用例修改——版本发布&用户反馈总结

　　
测试用例优化思路

　　三、村长实际操作
　　说干就干，说着村长就撸袖子挽裤腿的去干活了。
　　步骤1：基础数据提取
　　村长先着手查看运营数据。看到运营数据后，村长脸上写了大大的“蒙圈”。运营数据那么多，具体要从哪些数据里来提取所需信息呢？下面先看看用户数据基本有哪些：

　　图片3

　　结合项目特点：村长选取了所有事件&点击流作为分析基础数据；
　　为什么选取这两个基础数据：
　　1. 抓住主要工作流，这里就是主要是用户输入流，保证80%以上的场景可覆盖；
　　2. 其他20%事件可以作为补充用例，可以分不同版本&情况来覆盖；
　　最终语音APP选取出来的数据字段是这样的，包含了日期、id、用户名、版本号、用户语音识别文本、语音调用应用类型等等。
　　基础数据ready，怎么分析呢？
　　步骤2：基础数据清洗
　　目的：清除无用数据，为下一步数据整合提供输入；
　　村长拿到基础数据后，哭的心都有了，数据不但多，而且杂，中间夹杂了不少无效数据，也就是“脏数据”。这些数据肯定不能直接整合使用的。那么哪些是不需要的“脏数据”？怎么清洗“脏数据”呢？
　　通过观察，语音APP中上报字段中，先去除关键字段为空的数据，表现为下面几个字段：
　　1.SessionID为NULL;
　　2. SpeechID为NULL;
　　3. Speechtext为NULL;
　　在拿到的数据样本中，工具语音会话4499次，脏数据共占比941次，其中840次是操作了语音但是实际并未声音输入，可能就是用户误操作的行为。同时意外发现埋点上报一个BUG，即sessionID=NULL&speechID =NULL，但是speechtext非空（QA中彩蛋，发现这个BUG后，村长默默的乐了）。

　　捕获3

　　最终，剩余的3558次语音会话，就是有效样本数据。Binggo~~有了阶段性成果~继续加油

　　步骤3：基础数据整合
　　目的：按照所需处理格式，对基础数据进行重新整合，分类整理。
　　村长拿到基础数据清洗后结果，问题又来了：怎么归纳整理成修改用例的输入？归纳整理的结果是什么样的？
　　答案就是：结合需求开搞。啊呸~说的容易，也不举个例子。呃，各位村民，别急，村长慢慢给你说。
　　话说从软件研发起，就有传说中的需求，也就是指导开发实现的文档。这个文档说明了软件实现的功能点、软件性能指标等方方面面。也就是有了这么一个神圣的文档，测试同学就有据可依去跟开发GG直面PK，是否完成需求的实现等等。
　　语音APP也有语音需求，如语音需求总表，详细说明了需要调用的APP，具体的每个话术、每个结果状态等等。
　　在村长的项目中，语音有几方面的话术：导航音乐电话节目等等。每个主功能上又会对应具体的话术，如“打电话给张三”“打电话给张三的联通号码”等等详细话术的要求。村长灵机一动，根据每个类型的的话术进行统计。从统计结果上看，导航类的语音请求最多，详细的语料展示如下。

　　拿到统计结果，村长粗略核对了下产品详细需求，发现39类导航语音话术中，实际用户使用的只有7种。这7种语料中，“我要去我想去”+“导航到XXX”占比最高，也就是用户在发起路线规划的需求是最高的。于此同时，可以看出用户直接说出地名占比也较高。产品层面分析：发起语音时，产品页面会有文字等方面的提示，也就是这些语料占比高的原因。另一些问题：沿途查找导航过程中查询时间路况等方面，均未有用户使用。
　　分析到这里，村长在想下一步，怎么来指导用例的修改呢？是全面替换原有用例么？
　　步骤4：修改用例
　　目的：使用基础数据分析结果，来指导测试用例的编写&修改，最终达到保证用户场景80%的使用。
　　上文提到了，已经得到了基础统计结果&分析结果。村民一般反馈，那直接用这些数据去修改测试用例得了，还墨迹啥。不，其实还是需要对用例区别对待。不可以全部只按照用户反馈修改，不可以不参考用户反馈修改。这句话很拗口，说白了就是：需要对原有用例按照用户实际路径进行修改，并且修改优先级。在语音APP修改时，按照测程进行重新规划。
　　原来case，因为不清楚用户实际使用频次，所以所有的语料都必须全量覆盖测试。新case，修改一部分case，并且重新按照用户使用频次标注优先级，在测程中得以优化。
　　如下语音唤起导航case：原本P1-case：175条。新修改P1-case：31条。同时将原本的“回家去公司查找XX地点放大缩小地图”类case归类为P4，即统计中用户并未使用过的语料。

　　步骤5：版本发布&用户反馈总结
　　目的：修改后用例，需要在真正版本发布后，对用户反馈进行归纳整理，选出语音模块漏侧case，完善测试用例和场景。
　　村长就根据分析出结果，修改后的用例，对V2.1.1版本进行语音APP集成测程重新规划，并最终发布以观察效果。具体效果待后续展示。
　　四、村长实践后效果
　　村长在实际实践中，对比了V2.1.0&V2.1.1的的case量、测试耗时、漏侧等相关数据，结果如下图所示，对case量进行调整，case级别进行调整后，实际上用户反馈漏侧也没有任何变化。看来这么干是可行的。

　　图片5

　　五、村长后续的打算
　　做完语音测试用例优化后，村长想从后续几个方面去优化推广：
　　打算1：统计数据，从运营平台上自动化获取；
　　打算2：统计数据中，数据整合&数据清洗自动化处理。
　　打算3：推广到其他测试周期长应用中~
　　以上是村长在实际测试中，从用户数据逐步提取关键信息，最终指导测试用例删减的故事，希望大家能够喜欢&提出建议和意见。

周排行
月排行

软件测试技术

软件测试工具

软件测试管理

软件开发专栏

从用户数据到测试用例?语音测试改良记

热门标签

软件测试技术

软件测试工具

软件测试管理

软件开发专栏

从用户数据到测试用例?语音测试改良记

相关文章

热门标签