数据创新的窘境
这是一个真实的案例。
某大型多业态地产集团,其业务涵盖地产、商业、物业三大领域,同时也在开辟和扩展商业的边界,在租赁、电商领域也有所试水。对于一个地产项目来说,最重要的一个环节就是在投研阶段。在哪里买地,花多少钱买地,买了地盖什么类型的房子?这三个问题直接决定了一个项目是否能成功。而这么重要的一个环节,过去这么多年,靠的都是以人的经验为主的决策方法,很难找到一个相对客观,可度量可描述的投研方法。该企业希望建立数据驱动的投研的体系,所有的一切决策都是有数据支撑的,比如在标的地块所在地区的经济发展水平,周边的消费生态,居民结构,竞品情况等。
一个智能投研的项目启动了,自然语言识别、统计学、数据挖掘加机器学习的多个科技服务公司都蜂拥而至做POC,从政府公开数据、社交数据、历史交易数据、第三方数据等多方面采集数据,构建消费者画像,竞品画像,预测沙盘等众多模型, 希望构建一个全方位的能够从多维度做销量预测的投研模型。但是,即使是在POC阶段,大家也发现了众多难以解决的问题:
1、业务目标模糊,领域太宽
这个地段应该盖什么类型的房子?看上去这个命题很清晰,但是拆解后就会发现这个业务目标非常模糊,领域太宽。业务度量的标准是什么?潜在用户的范围应该如何界定?是周边还是全市,还是全省,还是全国?如何利用数据产生比常识更加精准的结论?如果把这个业务目标所有的可能性都列举一遍,会发现基本上会涵盖所有的业务领域,是很难用一个模型就能够清晰的定义出一个最佳实践的。
2、需要的数据集太广,大部分数据处理较复杂
投研本身是一个非常宽的业务领域,所需要的数据集非常的广泛,从宏观政策数据、市场行情数据、交易数据、消费者数据等多方面,而且数据之间的相关性较弱。而通过前期的POC,我们会发现,如果要让这些数据都能够被建模,这过程中的数据处理会非常的复杂,基本上会涉及所有的人工智能技术的应用场景。
3、项目范围庞大,建设周期长,业务见效慢
经过两周左右的POC,大家都发现,这样的一个业务命题本身是一个研究领域,如果作为一个项目来做,哪这个项目的范围会非常的庞大,周期也会变得无法控制的长。而这也就意味着,项目的投资需要很长的时间才能看到业务上的回报。
所以最后客户放弃了这样的一个项目。
数据驱动创新的几个关键成功因素
通过这个POC的过程,我们发现要成功的利用数据产生新的洞察来做创新,支撑决策,需要具备以下几个关键成功因素:
1、清晰的业务愿景和目标
一定要制定清晰的业务愿景和目标。
在现状调研,数据分析这样的具体的工作开始之前,首先要定义可理解,简单,简短和可以衡量的目标,这一点非常重要。这些目标可以以问题的形式列出,比如“我们的用户转化率能否提高到40%以上?”和“如何能够提升高端产品销量?”。
当然,很多时候我们会发现,我们的业务愿景本身是挺复杂的,不可以被衡量,那我们需要将这个愿景,相对模糊的目标分析,拆解成可理解,简单和可衡量的目标。
这个环节非常重要,定义问题本身是产生有价值的创新的基础,否则就是漫无目的的探索,那可能带来的是资源的浪费和无效的投入。
2、能够带来价值的业务场景
在定义了清晰的目标以后,为了达到这个目标,一定要探索出有价值的业务场景。业务场景是可被实现,可落地,与真实业务可以紧密结合的端到端的一系列流程的组合。这个场景一定要与业务相关联,能够为业务产生价值。也就意味着通过数据关联、分析产生的洞察是能与具体的业务挂钩的,而不是一个飘在空中的不可实现的幻想和空想。
3、可实现的数据资产和技术支撑
有价值的创新场景需要被实现,这里面就需要数据和技术支撑。我们需要在一开始的时候就有顶层设计的思路,把这些创新场景所需要的数据集,技术的支撑,对于工具平台的要求从架构层面列示清楚,然后在实现过程中快速迭代,只有这样才能保证体系上一开始就是可实现的,是集成的。