首页 > 科技 >>正文

Cloudera Spark是57%用户最重要用例的首选平台

  美国加利福尼亚州帕洛阿尔托,2016年11月7日–为了更好地理解Apache Spark在大数据领域日益增强的作用,Taneja Group进行了一次大规模市场调查,约7000人参与了此次调查活动。这些人来自世界各地,均是从事大数据工作的技术和管理人员。此次调查得到了非常积极的响应,并获得了宝贵信息,例如了解了采用和部署Spark的体验、人们目前对Spark的看法、用户喜欢的厂商以及Spark的未来。作为基于Apache Hadoop和最新开源技术提供最快速、最简便、最安全的数据管理及分析平台的全球提供商,以及本次市场调查活动的赞助商,Cloudera今天发布调查结果。

  Spark是灵活的内存数据处理的开放标准,支持在Apache Hadoop平台上批量、实时地进行先进的数据分析。Spark既集成到了CDH中,也可在Cloudera企业版上获得支持。

  Taneja Group高级分析师、顾问Mike Matchett表示:“Apache Spark正在迅速成长为领先的大数据开源项目之一。我们发现,一半以上参与调查者所在公司正在积极使用Spark,这些公司所处行业多种多样、规模大小不一、大数据成熟度水平各异。在目前正在使用Spark的公司中,64%计划在未来一年内大幅提高使用量,这证明Spark非常有价值。要求实时数据流用于分析的工作负载的数量在增加,与此同时,机器学习应用和数据科学用例也已出现,显然,Spark得到了普遍认可。”

  Cloudera在Spark领域拥有领先优势

  Cloudera在2014年初开始,是第一家交付Spark并提供商业支持的Hadoop厂商,当时Spark正在迅速成为提高成批处理速度的首选框架。Cloudera很早就开始为Spark开发投资。如今,很多Cloudera用户都已将其生产系统中的数据处理工作负载从MapReduce转移到了Spark上,从而显著减小了数据处理窗口。从此次市场调查结果看,这种趋势还在加速。

  Cloudera的客户要求能够以企业级规模提供Spark,为Spark提供支持的专家从一开始就参与了使Spark成为Hadoop真正的数据处理引擎这一工作,。Cloudera通过统一平台计划(One Platform Initiative)不断创新,该平台旨在围绕管理、信息安全、规模、数据流和云加速,来增强Spark功能。通过统一平台计划,Cloudera承诺帮助生态系统合作伙伴采用Spark,使其成为数据分析工作负载的默认数据执行引擎。

  Cloudera与合作伙伴携手为基于Spark的新解决方案提供认证,并提供使这些差异化解决方案快速上市所需的资源和支持,从而确保客户能够应对新的、富有挑战性的用例。

  市场调研结果

  此次市场调研题为Apache Spark市场研究(Apache Spark Market Research Study),调研结果除了意料之中的数据处理/工程/ETL工作负载以外,Spark的使用量增长及采用势头均达到了更高水平;未来将转向云部署。其他值得注意的调研结果包括:

  ● 将近一半参与调查者(54%)所在公司正在积极使用Spark。目前正在使用Spark的公司中,64%表示,Spark非常有价值,并有意在未来一年内增大Spark的使用量。

  ● 采用Spark的新用户也在增加,4/10熟悉这一大数据计划的人表示,其所在公司准备在不久的将来采用Spark。

  ● 57%参与调查者使用Cloudera提供的Spark处理其最重要的用例,这一数字是排在Cloudera之后的三家Apache Hadoop厂商之和的2倍还多。客户们提到,Cloudera解决方案提供符合监管要求的信息安全和治理模式、高稳定性和高性能、云可移植性以及与一整套数据处理、查询、分析和机器学习服务的集成,这是他们选择Cloudera而不是其他厂商解决方案的主要原因。

  ● 在目前大家熟知的Spark用途中,数据处理/工程/ETL工作负载占55%,除了这些意料之中的工作负载,最活跃的Spark使用还涉及实时数据流处理、探索性数据科学和新出现的机器学习。这些新的使用领域均是Cloudera持续投资的领域。

  ● 不过,采用Spark的障碍和挑战仍然未变,而且大部分可以归结为大数据技能不足,以及通过各种形式(在线、面对面、会议或贸易展)获得相关培训的能力不足。Cloudera培训的Apache Spark专业人员比其他任何厂商都多,Cloudera还通过专业服务、价值咨询和广泛的合作伙伴为这些专业人员提供支持。

  Cloudera公司创始人、首席战略官Mike Olson表示:“我毛司的关注点是在企业级市场保持领先优势,我们提供客户所需的、关键的信息安全、数据治理及合规功能。此次市场调查结果证实,做到既完全满足企业目前的需求、又为支持未来的Spark用例做好准备,确实很重要。这是客户大量选择Cloudera Spark而不是其他厂商的商用解决方案的主要原因。”

  此次调查还发现,公有云和Spark的作用在增大。Taneja Group的Matchett还提到:“尽管眼下Spark内部数据中心部署占据主导地位,但是对于未来将Spark部署转变为云计算部署,人们的兴趣越来越大。总之,在公有/私有云(IaaS或PaaS)中的Spark部署预计将从今天的23%大幅增长到未来的36%。”

  Cloudera已绘制了详细说明此次调查结果的信息图。

  更多信息

  ● 下载Apache Spark市场研究执行摘要

  ● 查看Apache Spark信息图

  ● 下载Spark 2.0测试包

  ● 了解Cloudera数据工程平台

  关于Taneja Group

  Taneja Group是一家著名分析公司,为技术行业提供高质量市场分析和咨询服务。我们的所有研究和建议都是针对技术厂商、IT最终用户和风险投资公司的。我们的分析涵盖的技术涉及以下领域:存储、服务器虚拟化、WAN优化、存储和应用加速、eDiscovery和企业治理的所有方面。云存储、大数据和数据中心融合是这些领域的固有组成部分。数据中心正在经历根本性变化,我们为此提供最前沿的分析,告诉客户哪些技术是至关重要的,应该何时部署这些技术以取得最大成效。就eDiscovery行业而言,我们的分析涵盖诉讼工作流程以及包括治理、合规、记录管理和数据保留管理在内的相关业务流程的所有方面。

  关于Cloudera

  Cloudera提供基于Apache Hadoop和最新开源技术的现代数据管理和分析平台。众多全球领先机构都信赖Cloudera,凭借Cloudera Enterprise这一面向现代IT环境的、最快速、最简便和最安全的数据平台,解决最富挑战性的业务难题。我们帮助客户高效获取、存储、处理和分析海量数据,使客户能够利用最先进的数据分析技术,以更低的成本,快速、灵活地做出各项决策。为了确保客户成功,我们提供全面的支持、培训和专业服务。

 

中国都市网:中国都市营销门户!(通过我们让您的信息快速传播到互联网,传遍全国!)

资讯标签:

分享到