57%参与调查者表示,Cloudera Spark是其最重要用例的首选平台

2016年11月7日,北京 – 为了更好地理解Apache Spark在大数据领域日益增强的作用,Taneja Group进行了一次大规模市场调查,约7000人参与了此次调查活动。这些人来自世界各地,均是从事大数据工作的技术和管理人员。此次调查得到了非常积极的响应,并获得了宝贵信息,例如了解了采用和部署Spark的体验、人们目前对Spark的看法、用户喜欢的厂商以及Spark的未来。作为基于Apache Hadoop和最新开源技术提供最快速、最简便、最安全的数据管理及分析平台的全球提供商,以及本次市场调查活动的赞助商,Cloudera今天发布调查结果。

 

Spark是灵活的内存数据处理的开放标准,支持在Apache Hadoop平台上批量、实时地进行先进的数据分析。Spark既集成到了CDH中,也可在Cloudera 企业版上获得支持。

Taneja Group高级分析师、顾问Mike Matchett表示:“Apache Spark正在迅速成长为领先的大数据开源项目之一。我们发现,一半以上参与调查者所在公司正在积极使用Spark,这些公司所处行业多种多样、规模大小不一、大数据成熟度水平各异。在目前正在使用Spark的公司中,64%计划在未来一年内大幅提高使用量,这证明Spark非常有价值。要求实时数据流用于分析的工作负载的数量在增加,与此同时,机器学习应用和数据科学用例也已出现,显然,Spark得到了普遍认可。”

Cloudera在Spark领域拥有领先优势

Cloudera 在2014年初开始,是第一家交付Spark并提供商业支持的Hadoop厂商,当时Spark正在迅速成为提高成批处理速度的首选框架。Cloudera很早就开始为Spark开发投资。如今,很多Cloudera用户都已将其生产系统中的数据处理工作负载从MapReduce转移到了Spark上,从而显著减小了数据处理窗口。从此次市场调查结果看,这种趋势还在加速。

Cloudera的客户要求能够以企业级规模提供Spark,为Spark提供支持的专家从一开始就参与了使Spark成为Hadoop真正的数据处理引擎这一工作,。Cloudera通过统一平台计划(One Platform Initiative)不断创新,该平台旨在围绕管理、信息安全、规模、数据流和云加速,来增强Spark功能。通过统一平台计划,Cloudera承诺帮助生态系统合作伙伴采用Spark,使其成为数据分析工作负载的默认数据执行引擎。

 

Cloudera与合作伙伴携手为基于Spark的新解决方案提供认证,并提供使这些差异化解决方案快速上市所需的资源和支持,从而确保客户能够应对新的、富有挑战性的用例。

 

市场调研结果

 

此次市场调研题为Apache Spark市场研究(Apache Spark Market Research Study),调研结果除了意料之中的数据处理/工程/ETL工作负载以外,Spark的使用量增长及采用势头均达到了更高水平;未来将转向云部署。其他值得注意的调研结果包括:

 

  • 将近一半参与调查者(54%)所在公司正在积极使用Spark。目前正在使用Spark的公司中,64%表示,Spark非常有价值,并有意在未来一年内增大Spark的使用量。

  • 采用Spark的新用户也在增加,4/10熟悉这一大数据计划的人表示,其所在公司准备在不久的将来采用Spark。

  • 57%参与调查者使用Cloudera提供的Spark处理其最重要的用例,这一数字是排在Cloudera之后的三家Apache Hadoop厂商之和的2倍还多。客户们提到,Cloudera解决方案提供符合监管要求的信息安全和治理模式、高稳定性和高性能、云可移植性以及与一整套数据处理、查询、分析和机器学习服务的集成,这是他们选择Cloudera而不是其他厂商解决方案的主要原因。

  • 在目前大家熟知的Spark用途中,数据处理/工程/ETL工作负载占55%,除了这些意料之中的工作负载,最活跃的Spark使用还涉及实时数据流处理、探索性数据科学和新出现的机器学习。这些新的使用领域均是Cloudera持续投资的领域。

  • 不过,采用Spark的障碍和挑战仍然未变,而且大部分可以归结为大数据技能不足,以及通过各种形式(在线、面对面、会议或贸易展)获得相关培训的能力不足。Cloudera培训的Apache Spark专业人员比其他任何厂商都多,Cloudera还通过专业服务、价值咨询和广泛的合作伙伴为这些专业人员提供支持。

 

Cloudera公司创始人、首席战略官Mike Olson表示:“我们公司的关注点是在企业级市场保持领先优势,我们提供客户所需的、关键的信息安全、数据治理及合规功能。此次市场调查结果证实,做到既完全满足企业目前的需求、又为支持未来的Spark用例做好准备,确实很重要。这是客户大量选择Cloudera Spark而不是其他厂商的商用解决方案的主要原因。”

 

此次调查还发现,公有云和Spark的作用在增大。Taneja Group的Matchett还提到:“尽管眼下Spark内部数据中心部署占据主导地位,但是对于未来将Spark部署转变为云计算部署,人们的兴趣越来越大。总之,在公有/私有云(IaaS或PaaS)中的Spark部署预计将从今天的23%大幅增长到未来的36%。”

 

Cloudera已绘制了详细说明此次调查结果的信息图

 

更多信息

###

关于Taneja Group

Taneja Group是一家著名分析公司,为技术行业提供高质量市场分析和咨询服务。我们的所有研究和建议都是针对技术厂商、IT最终用户和风险投资公司的。我们的分析涵盖的技术涉及以下领域:存储、服务器虚拟化、WAN优化、存储和应用加速、eDiscovery和企业治理的所有方面。云存储、大数据和数据中心融合是这些领域的固有组成部分。数据中心正在经历根本性变化,我们为此提供最前沿的分析,告诉客户哪些技术是至关重要的,应该何时部署这些技术以取得最大成效。就eDiscovery行业而言,我们的分析涵盖诉讼工作流程以及包括治理、合规、记录管理和数据保留管理在内的相关业务流程的所有方面。

 

Cloudera简介

Cloudera公司提供了现代化的数据管理和分析平台。全球领先的企业机构都信赖 Cloudera 公司可以帮助他们通过利用 Cloudera 企业版产品,解决其所面临的最具挑战性的业务问题。Cloudera 企业版是 Cloudera 公司开发的基于 Apache Hadoop 的最快速、最便捷、最安全的数据平台。我们的客户可以有效地捕捉、存储、处理、分析大量的数据,使其能够利用先进的分析技术以迅速、灵活、更低成本的方式推动业务决策。为了确保客户取得成功,我们将为客户提供全面的支持、培训和专业服务。欲了解更多信息,请登录访问:cloudera.com。

 

关注Cloudera

Cloudera公司:http://www.cloudera.com/about-cloudera.html

阅读Cloudera公司博客:blog.cloudera.com/ 及vision.cloudera.com/

关于我们的Twitter:twitter.com/cloudera

访问我们的Facebook:facebook.com/cloudera

观看我们的YouTube视频:youtube.com/user/clouderahadoop

加入Cloudera社区:community.cloudera.com

阅读客户成功案例:cloudera.com/customers.html

 

Cloudera以及相关注册商标均为Cloudera Inc.的拥有的或已注册的商标,其他所有的公司或产品名是他们各自拥有者的商标。