Your browser is out of date

Update your browser to view this website correctly. Update my browser now

×

Cloudera数据科学与工程

预测不是猜测

Cloudera数据科学通过熟悉的可执行工具,更好地访问Apache Hadoop数据,解决现代预测分析的各个方面。使用Cloudera,您的组织将能够进行大规模的高级数据工程,探索性数据科学和机器学习。无论您的数据在何处生活 — 内部部署,跨公有云或两者兼而有之。因为今天的正确洞察将引领明天更好的商业决策。

我们可以提供的灵活性和性能

对于批处理,实时和流式传输工作负载没有比Cloudera更好的现代数据处理解决方案。通过利用像 Apache Spark的技术, 您的高级处理作业可以比传统技术快得多 — 为您的业务带来海量分布式数据上更快速,可扩展的SQL,以及灵活的处理引擎和功能样式编程API。而且对正在摄取的数据有更好的可见性,因为有了 交互式搜索 和流式传输数据上的SQL访问。

了解有关Apache Spark的更多信息

全能的云计算

为什么不能在云中做尽可能多的工作负载?无论您是在多租户环境中启动多个工作负载,还是利用云基础架构为特定作业(如ETL和探索性数据科学)开展的工作,Cloudera Enterprise解放了计算和存储约束,实现更低的拥有成本,同时数据在环境的整个生命周期中持续存放。您甚至可以利用基础设施降低更多成本,比如通过亚马孙的现货实例。

公有云中的数据工程与数据科学

更上一层楼

Cloudera使您能够对大型数据集进行数据科学探索,同时为工程师提供构建所需数据管道和启动多租户应用程序所需的工具 — 所有这些都可以通过可靠策略,访问和安全控制的单个产品来实现数据的整个生命周期的可见性。

了解有关Cloudera数据科学工作台的更多信息

扫清障碍

为了雄心勃勃的目标扩大业务并不容易。我们将使您的企业能够大规模地进行探索性数据科学,并提供可以利用大规模并行计算和扩展数据流的机器学习模型。使用Cloudera,您可以使用丰富的编程接口和现代化库来确保您的模型在生产中部署和稳定。

观看视频:机器学习爱hadoop

关键使用案例

数据处理
选择最适合您的工作负载:批处理,实时或交互:

  • 高速实时数据摄取:能够从所有来源和所有类型的数据采集数据
  • 可扩展,高性能的架构
  • 更多的数据类型和更好的数据访问

机器学习
支持更多用户的高性能,临时访问和最快的洞察时间:

  • 分布式机器学习
  • 熟悉的API
  • 集成批量和流媒体

流处理
数据流的实时和连续处理:

  • 连续数据流的容错和高性能处理
  • 用于批处理和流处理的类似API和编程范例
  • 用于常见流式传输任务的简化API
  • 结合MLlib进行流数据预测分析

探索性数据科学
将统计编程的功能扩展到大型数据集:

  • 熟悉的API
  • 集成批量和流媒体
Analyst Report

Taneja Group Spark market adoption report

Whitepaper

What is Data Science?

Your form submission has failed.

This may have been caused by one of the following:

  • Your request timed out
  • A plugin/browser extension blocked the submission. If you have an ad blocking plugin please disable it and close this message to reload the page.