您还未登录! 登录 | 注册 | 帮助  

您的位置: 首页 > 软件开发专栏 > 大数据 > 正文

2023展望:大数据会更加繁荣

发表于:2023-01-04 作者:AI时代前沿 来源:今日头条

大数据是数字化转型和人工智能的基石。对于未来大数据发展趋势。2023将近,众多专业人士发表了自己对大数据前景的观点和态度。

Fivetran产品负责人Alexander Lovell认为明年对于大数据领域是关键一年:“2023年数据团队要么增长或要么关闭。尽管各企业的大数据应用回报质量差异很大,公司仍在保持投资。随着经济的广泛混乱,数据团队现在是时候通过提供有价值的见解来驱散迷雾,因为当市场不断变化时,靠直觉执行太不可靠。最好的数据团队将会成长并变得更加重要,而不能够产生可操作洞察力的团队将面临更大的压力。”

Datometry的首席执行官兼联合创始人Mike Waas说,到2023年,SQL会再度崛起。NoSQL社区开始反思SQL的价值,承认企业需要标准,并且SQL具有通用而强大的查询语言的简单性。实际上,每个仍然活着的NoSQL数据库目前都在向他们的系统添加SQL或SQL接口以吸引企业。2023几乎所有想要在企业中取得成功的数据管理系统都会尝试利用SQL,看起来像一个合适的数据库。”

数据历史上也经历了分分合合的阶段,从集中到分布再到集中,如今再次盛行分布。Denodo首席执行官兼创始人Angel Viña说,我们目前处于分布式阶段,不太可能回到以前,因此需要采取新的方法来处理它,包括数据经纬(Data Fabric)或数据网格(Data Mesh)。

“虽然两者之间存在固有的差异,但数据经纬是一组可组合的数据管理技术,数据网格是分布式团队管理企业数据的过程导向。两者都可以在企业范围内的数据访问,集成,管理和交付中发挥关键作用,如果正确的数据基础架构到位,那么在2023年,预计在中大型企业内这两种架构方法的采用将迅速增加。”

你听说过现代数据堆栈。但是在2023年,你会听到更多关于后现代数据堆栈的信息,Snowplow的CDO Chris Lubasch说:“这是围绕现代数据堆栈进行的一年快速讨论。尽管经济形势充满挑战,但仍有许多新供应商涌现,Snowflake和Databricks等主要供应商继续接管许多技术组件。同时,出现质疑现代数据堆栈的声音,因为其方法往往导致许多工具成本过高,更不用说将它们整合在一起的复杂性了。围绕“后现代数据堆栈”(作为许多术语中的一个)的讨论已经开始,我们都渴望看到这将在未来几年引导我们去哪里。”

作为对象存储提供商Cleversafe(2015年被IBM收购13亿美元)的创始人,Chris Gladwin预测,2023年是超大规模数据成为主流的一年。

数据密集型企业正在超越大数据,进入指数级更大的超大规模数据领域,这需要对数据基础设施进行重新评估,到2023年,数据仓库供应商将开发新的方法来构建和扩展系统和服务。

这不仅仅是技术人员必须计划的数据总量,还有新兴的数据集和待处理的工作量。一些领先的IT组织现在正在处理包含数十亿和数万亿记录的数据集。到2023年,我们甚至可以在数据密集型行业(比如广告、电信和地理空间)看到数十亿行的数据集。随着组织利用来自运营,客户以及移动设备的近实时数据量的增加,超大规模数据集将变得越来越普遍。”

Immuta首席执行官兼联合创始人Matt Carroll表示,2023年将看到数据处理协议(DPAs:data processing agreements)的兴起。“到2023年,我们将看到DPA成为SaaS合同和数据共享谈判的标准要素。组织如何处理这些合同将从根本上改变他们如何构建数据基础架构并定义数据的业务价值。因此,数据领导者最有兴趣在2023年及以后完全接受DPA。这些冗长的文件将很复杂,DPA的数字化和法律团队的参与将使他们更容易理解和实施。

“到2023年,随着数据共享的不断增长,数据和IT团队被迫跟上,数据交换将成为新标准。随着组织生产现代化数据堆栈,规模和数量将会爆炸式增长。数据集在共享之前制作副本将不再可行。到2023年,企业将涌入已建立的平台,如Snowflake的数据交换和Databricks的Delta共享协议,以使安全地共享和货币化流通数据更加容易。”

而在Rockset的联合创始人兼首席技术官Dhruba Borthakur和RocksDB的创始工程师看来,2023年将成为数据应用程序的一年。

“在过去的10年中,我们看到了web应用程序和移动应用程序的兴起,但2023年是数据应用程序的一年。可靠,高性能的数据应用程序将被证明是成功的关键工具,因为企业寻求新的解决方案以改善面向客户的应用程序和内部业务运营。我们的指尖可以使用Uber,Lyft和Doordash等按需数据应用程序。在实时分析基础的支持下,我们将看到数据应用程序不仅是实时的,而且故障安全的压力越来越大。”

你的新年购物清单上可能有很多东西。但Tamr首席产品官Anthony Deighton今年希望有一件事:干净的数据。

“‘脏’数据是不正确,不完整,不一致,过时,重复的数据,可能会杀死你的业务,这是一个常见问题。避免混乱和沮丧。客户掌握可以跨系统和来源创建统一,准确和丰富的客户数据视图,以及能够一致跟踪客户的唯一标识符。大规模掌握客户数据为销售,营销和客户体验团队提供了加速数据驱动销售的有效途径。它还可以为客户提供洞察力以获得竞争优势。”

根据Google Cloud Google数据库副总裁兼总经理Andi Gutmans的说法,交易和分析工作量之间的障碍将在2023年开始消失。

Gutmans说:“传统上,数据体系结构已经将这些工作负载分开,因为每个工作负载都需要一个适合目的的数据库,交互数据库则针对快速读取和写入进行了优化,分析数据库则针对聚合大数据集进行了优化。随着基于云的数据体系结构的发展,这些体系结构通过高性能网络利用高度可扩展,分类的计算和存储,我们预测将会有新的数据库体系结构,允许在一个系统内进行交易和分析工作负载,而不需要应用程序折中工作负载需求。”

不看好大数据的人也有很多。但Altair数据分析和物联网的高级副总裁Christian Buckner说,不相信炒作。

“大数据还没有死,”他说。“提供商将尝试领先趋势,我们将看到许多人开始宣传'大数据已经死亡'。相反,许多组织倾向于'智能数据'以获得更深入的见解。但大数据仍将继续在业务运营中发挥重要作用。关键是确保拥有易于使用的自助工具来实现清洁,验证和准备数据,然后可以将其插入数据分析模型中以获得有价值的结果和智能决策。将大数据转化为智能数据的公司将从新的数据思考方式中受益。”

根据Snowflake产品管理总监Torsten Grabs的说法,在数据民主化方面,将以Python的形式出现。

“到2023年,Python将成为整个组织中每个人对数据的访问和见解民主化的主要媒介,随着Python周围的运行时基础架构变得更简单,更直接,并且包含更多安全性,Python将变得更加企业化,同时,生成Python结果将进一步简化,该代码将被包裹在有意义的用户体验中,以便公司营销团队等非IT用户可以轻松消费和理解它。我们将看到Python与15到20年前自助商业智能工具的出现相比,具有相同或更大的可能性,对数据民主化的转型影响更大。”