您还未登录! 登录 | 注册 | 帮助  

您的位置: 首页 > 软件开发专栏 > 大数据 > 正文

大数据如何成功实施三个V

发表于:2023-01-10 作者:李源 来源:e-works

在全球范围内,企业都希望能够利用大数据的力量。而在这个过程的第一步通常是了解大数据和更传统数据环境之间的区别。调研机构Gartner公司在2012年就将大数据的特征描述为3个V:数量(volume)、速度(Velocity)和多样性(Variety)。数据量也就是捕获数据的规模,是描述大数据平台的关键组成部分。

根据IBM公司最近进行的一项研究,现在世界每天都会产生超过2.5万亿字节的数据,为大数据平台提供了潜在的海量数据。由于移动设备、传感器​和其他物联网设备的快速扩张,产生了无穷无尽的数据流,数据捕捉的频率也在不断提高。大数据已经把人们从一个结构化交易数据的世界带到了一个捕捉各种各样的数据的世界,其内容从社交媒体内容到可穿戴设备的健康数据。

一旦企业高管理解了大数据和传统数据环境之间的区别,下一步往往就是选择物理平台。在20世纪90年代中期,数据仓库的出现引起了类似的反应。随着企业认识到需要有一个独特的信息分析平台,以防止对事务环境的影响,其重点立即转移到技术选择过程。在采用大数据的这一点上,就像数据仓库的情况一样,避免成为行业领域的牺牲品是很重要的。那些急于选择和建立大数据平台的企业可能采用了构建平台就会有数据的策略,与过去失败的数据仓库项目类似,在没有首先确定特定业务价值的情况下构建大数据平台可能会导致企业成为受害者。

最初的三个V很好地定义了大数据的概念。但是,需考虑在企业中实施大数据时另外三个极其重要的V——价值(Value)、有效性(Validity)和活力(Vitality)。为了防止大数据平台建立而不使用的情况,必须提前理解业务价值,解决方案的有效性必须为业务采纳而合理,最后,企业必须有活力进行实施过程。以下更深入地研究这些领域。

企业需要创建一个大数据平台,为每个客户吸收、分析和制定定制策略,如果得到关键业务领域的适当支持,就有可能带来巨大的价值。

行业专家表示,最近参加了一些关于大数据的会议,其中演讲者的关键卖点是“我们的大数据解决方案很棒,因为可以将所有数据加载到低成本的商品服务器​上,几乎没有任何磁盘存储成本,源数据的任何格式存在,并弄清楚以后如何使用它”。不要让这种方法的吸引力导致企业成为下一个受害者。大数据之旅的一个关键成功因素始于对如何交付业务价值的清晰愿景。例如,如今可以从车辆上数千个传感器中捕获流数据,范围从制动水平到转弯时的速度。如果使用得当,这些数据可以让保险公司根据客户的驾驶行为调整保验费用的价格。企业创建一个大数据平台,为每个客户吸收、分析和生成定制策略,如果得到关键业务领域的适当支持,就有可能带来巨大的价值。

行业专家建议的下一个重点领域是解决方案的有效性。从技术上说,一个合理配置的大数据平台可以轻松处理来自几乎无限数量车辆的流传感器数据。

因此,可以创建大数据解决方案,并且它具有驱动重大业务价值的潜力,但是它有效吗?在例举的保险公司开始实现这种类型的解决方案之前,必须探索一些领域。在保险公司经营的范围内,根据个人和团体的驾驶模式为汽车保单定价是否合法?负责定价的业务部门是否有能力在这个水平和速度下设定和管理价格?随着消费者越来越关注隐私,客户会同意这种级别的监控,以换取更有针对性的定价吗?一旦初始解决方案可操作,有效性可能会变得更加有趣和重要。通过捕获大量客户的驾驶模式,可以确定其他潜在的业务价值领域。例如,保险公司将位置和行为数据洞察力出售给其他公司用于基于位置的营销是否有效?企业必须解决诸如此类的问题,这些问题超出了大数据解决方案的技术可行性。

 最后,企业必须确定它是否具有实现解决方案的活力。在企业内实施第一个大数据解决方案将是困难的。成功将取决于选择强大的合作伙伴,交叉培训现有资源,并可能增加新的资源。目前,熟练的大数据资源的可用性是一个挑战。

大数据领域的软件和应用程序的成熟度正在迅速提高,但仍远远低于标准的数据和应用程序开发解决方案。大数据解决方案在某些方面类似于电动汽车。电动汽车具有极高的能源效率、非常大的扭矩和更快的加速度,但仍然面临着充电站有限、电池成本高以及行驶距离问题等痛点。大数据平台(例如Hadoop)已经显示出支持海量数据的能力,其结构化和非结构化模块可以处理大量数据。然而,就像电动汽车一样,该平台也面临着一些痛点,例如有限的可用资源、新兴的开发工具以及与现有环境集成的问题。

当企业开始其大数据之旅时,利用数量、速度和多样性来更好地理解潜力,但不要忘记价值、有效性和活力,因为它与成功的执行有关。​