您还未登录! 登录 | 注册 | 帮助  

您的位置: 首页 > 最新动态 > 正文

预测2019年大数据、云存储将发生什么

发表于:2019-01-22 作者:风车云马编译 来源:51cto

据相关大数据专家预测,2019年很可能成为数据湖重新产生兴趣的一年,私有云也可能卷土重来。其他与大数据相关的预测有,hybrid混合式并行处理方式将成为通用环境,大数据被整合成“小数据”,透明化将成为人工智能的关键要求。

也有专家认为,“将会有更多的开发人员重新审视他们的应用程序如何处理数据,因为他们要将数据发送到业务相关的其他客户端,供他人使用。”对于混合了云服务、传统服务和现代应用的大企业来说,解决数据问题将是他们的首要任务。

如今人工智能和机器学习将对企业进行更深入的挖掘。在2018年,我们看到没有采用大数据的劳动密集型人工流程开始消失。自动化、人工智能和机器学习不仅在速度上得到了证实,而且在准确性上也得到了证明,现在正被越来越多的业务功能所应用。

例如,大学正在研究学生录取和接受的趋势,以确定谁更有可能被录取,以及奖学金会在多大程度上影响他们的决定。目前还有另一种信贷风险分析,以确定首次或低收入借款人的信誉。所有这些应用程序的关键是构建良好稳定的数据模型,而构建良好稳定模型的关键是能够找到正确的数据和正确的特性。2019年,人工智能和机器学习将在发现和理解构建这些模型所需的数据方面发挥重要作用。

向混合式开发环境招手问好。去年预测云的广泛应用将使对象存储得到加强和适当的管理,而新的标准将要求数据管理与云、位置和平台无关。到2019年,您将看到越来越多的企业已经习惯了云计算,他们正在构建一个混合的、异构的数据资产,其中包括多用途的大数据、关系数据和非关系型(NoSQL)数据,这些数据存储在本地和云中。

虽然这样做会带来更大的复杂性,但是在2019年,您将看到越来越多的解决方案通过位置和计算透明性来简化这种复杂性。从创建单一名称空间的MapR数据结构这样的文件系统,到解决虚拟数据中心复杂性的AIOps,最终用户将越来越多地免受混合架构的复杂性的影响,同时还能充分利用其提供的通用的、灵活的解决方案。

数据湖将产生巨大回报。虽然传统上关注创建和补充数据湖的机制,但经常是创建数据沼泽,2019年将重新关注数据湖的应用。这与我们在数据仓库方面的经验非常相似,最初的数据仓库生成常常被误导,但是它们教会了我们创造价值和实现广泛应用的真正需求。我相信2019年将从关注数据湖的机制, 转向如何使湖泊中的数据具有可查找性、可用性、可规模化和自动化的管理方式。

新的数据湖将以一种更严谨的方式推出,具有清晰的初始用例、使用和管理策略。随着越来越多的组织开始采用跨多个系统的虚拟数据湖,我们还将看到越来越多的数据湖被构建或迁移到云上,以充分利用托管的基础设施、弹性存储和各种计算能力,使数据湖生态系统将不断丰富和完善起来。

大数据变成了“小数据”。相关机构不会整合所有储存的数据,会在有限的范围内精简。”随着对数据的更大可见性,他们将有机会对存储成本进行合理化整合,并进行更精确的分析。他们分析知道哪些数据已经损坏,可以丢弃。而且,“变少”也意味着过去大量数据现在变得容易管理,更加便以使用。

可解释性将成为人工智能的关键要求。随着越来越多的企业(和政府)使用人工智能和机器学习算法,将更加注重透明度和可解释性。比如为什么抵押贷款被拒绝?银行能否证明没有任何非法统计数据(如种族、性别等),被用于决策或培训决策模型? 找到合适的数据集并记录它们的特征和质量,是实现这种透明性和可解释性的第一步。如果我们不知道数据从何而来,也不知道数据意味着什么,我们就无法解释这个模型,也无法确保它是正确合法的。

技术的进步将使云更适合于关键应用程序。随着IT人员越来越多的将云应用于关键应用程序,他们对安全性和可靠性的担忧,还有对正常运行时间的担忧已经大大减少。最初,组织将倾向于使用高可用性故障转移集群技术来保护迁移到云中的关键应用程序。这种集群技术还将针对云中的增强操作进行调整和优化。与此同时,云服务提供商将继续提供更高服务水平的能力,最终使云成为所有企业应用程序的首选平台。

动态利用将使HA和DR在更多应用程序中更具成本效益进一步推动向云的迁移。云几乎可以将无限的资源遍布全球,是交付高负荷运行时间的理想平台。但是,对于许多应用程序来说,提供大部分时间处于空闲状态的备用资源的成本太高了。部署在多个区域和地区的云资源越来越复杂,所有这些资源都通过高质量的互联网络连接,现在只在需要时动态分配备用资源,这将大大降低提供高可用性和灾难恢复保护的成本。

云将成为SAP部署的首选平台。随着云服务提供商提供的平台不断成熟,它们托管SAP应用程序的能力将变得具有商业可行性,也具有重要的战略意义。对于服务供应商来说,SAP托管将是一种确保与企业客户长期合作的方式。对于企业来说,“SAP-as-a-Service”将是一种在不牺牲性能或可用性的情况下充分利用云的最经济的方法。

“快速启动”模板将成为复杂软件和服务部署的标准。快速启动模板是基于向导的接口,它使用自动化脚本动态地提供、配置和编排运行特定应用程序所需的资源和服务。它们的主要好处是减少了训练要求,提高了速度和准确性,以及能够尽量减少甚至消除主要的问题来源——人为错误。快速启动模板将大大减少开发运营人员测试和配置所需的时间和精力。

高级分析和人工智能将无处不在,包括基础设施运营。高级分析和人工智能将简化IT运营,提高基础设施和应用程序的健壮性,降低总体成本。随着这一趋势的发展,人工智能和分析技术将被嵌入到高可用性和灾难恢复解决方案以及云服务提供商的产品中,以提高服务水平。由于能够快速、自动、准确地理解问题并诊断复杂配置中的问题,从云平台交付的关键服务的可靠性和可用性将大大提高。

由于成本和控制,公共云用户将转向私有云。过去向公共云迁移的吸引力在于,企业可以支付更少的费用,控制更多的数据。但是2019年将是收回公司所有资产的一年,因为在公共云中,还有许多额外的成本。例如,数据的进入可能是免费的,但是云提供商对网络流量按每兆字节收费。

就私有云而言,云提供商每月提供统一的费率,这有利于成本预算。此外,数据长期存储在公共云端,在SEC(美国证监会)频繁的审计之下,导致了企业失去对数据的控制。总体而言,在公共云中,设计、功能和成本的难度可能比前几年最初认为的要高。

混合/多云世界中未来企业的需求。更多的公司希望推出混合和多云应用程序,但他们也必须考虑混合云数据的问题,这是一项更难完成的任务。2019年人们将不再只关注应用程序组件,而是关注更广泛的应用程序基础设施问题,数据方面的问题更难解决。

原文标题:Predictions 2019: What Will Happen in Big Data, Cloud Storage,原文作者:Chris Preimesberger