提供一个安全数据探索、可视化和建模的协作式自助环境可供数据科学家、分析师和商业团队共同使用

2017年3月15日,北京 — 今天,基于最新开源技术的全球领先机器学习和先进分析平台提供商Cloudera发布了测试版Cloudera数据科学工作台(Data Science Workbench),它是一款基于Cloudera 企业版运行数据科学的自助工具。Cloudera数据科学工作台以去年所收购的数据科学初创企业Sense.io的技术为基础,使数据科学家可以使用其偏好的开源语言(包括R、Python和Scala),集成原生Apache Spark和Apache Hadoop的安全企业平台上的资源库,从而加快分析项目从探索到生产的进展速度。

Cloudera产品高级副总裁Charles Zedlewski表示:“Cloudera的工作重点在于改善数据科学和工程团队的用户体验,尤其是那些希望借助Spark进行数据处理和机器学习、并以此提高分析能力的用户。Sense.io及其团队的加入为我们带来了坚实的基础,使我们的数据科学工作台可以为客户提供大规模的自助式数据科学支持。”

 

Cloudera数据科学工作台具有如下优势:

对于数据科学家:

• 支持将R、Python或Scala搭配个人优选的资源库和框架,通过网页浏览器直接使用

• 可通过Spark和Impala直接访问安全的Hadoop集群上的数据

• 与整个团队分享洞察,实现可复制、协作式的研究

对于IT专业人士:

• 令数据科学团队可自由选择工作方式和时间

• 与外部支持保持合规,实现Hadoop、尤其是Kerberos的充分安全性

• 可在本地或云端运行,无论身在何处,均可轻松管理数据

随着开放数据科学跨越了广泛的Python和R生态系统,拓展到了Tensorflow、Microsoft Cognitive Toolkit、MXnet和BigDL等深度学习框架中,加之越来越多的数据被储存在Hadoop环境里,数据科学团队正在努力寻求利用这些工具的方法。Cloudera数据科学工作台提供了一个安全可靠的环境,可将最新的开源创新技术与Cloudera客户所信赖的统一平台相结合。

 

“凭借随时可访问的数据,Cloudera数据科学工作台可缩短使用DataRobot自动化机器学习平台的人工智能应用的时间。”DataRobot CEO及联合创始人Jeremy Achin表示,“DataRobot的高度集成性,使Cloudera用户能够以简单易用的界面使用全球顶尖算法和数据科学技术提升商业价值。”

 

Zedlewski还表示:“鉴于数据科学家们的需求非常多样化,让他们进入共享环境往往给用户的IT团队带来巨大的挑战,特别是涉及开源工具的情况下,常造成重复工作、分析孤岛,以及降低安全性和管理能力等挑战。与此同时,数据科学家正在为其事业不断追求更大的数据集和更强大的计算平台。凭借我们的数据科学工作台,Cloudera可以帮助IT团队和数据科学家开展协作,让更多用户以灵活和合规的方式加入共享环境。”

 

 

Cloudera简介

Cloudera公司提供了现代化的数据管理和分析平台。全球领先的企业机构都信赖 Cloudera 公司可以帮助他们通过利用 Cloudera 企业版产品,解决其所面临的最具挑战性的业务问题。Cloudera 企业版是 Cloudera 公司开发的基于 Apache Hadoop 的最快速、最便捷、最安全的数据平台。我们的客户可以有效地捕捉、存储、处理、分析大量的数据,使其能够利用先进的分析技术以迅速、灵活、更低成本的方式推动业务决策。为了确保客户取得成功,我们将为客户提供全面的支持、培训和专业服务。欲了解更多信息,请登录访问:cloudera.com。

 

关注Cloudera

Cloudera公司:http://www.cloudera.com/about-cloudera.html

阅读Cloudera公司博客:blog.cloudera.com/ 及vision.cloudera.com/

关于我们的Twitter:twitter.com/cloudera

访问我们的Facebook:facebook.com/cloudera

观看我们的YouTube视频:youtube.com/user/clouderahadoop

加入Cloudera社区:community.cloudera.com

阅读客户成功案例:cloudera.com/customers.html

 

Cloudera以及相关注册商标均为Cloudera Inc.的拥有的或已注册的商标,其他所有的公司或产品名是他们各自拥有者的商标。