Your browser is out of date

Update your browser to view this website correctly. Update my browser now

×

立即免费在 Cloudera Data Platform 上试用Data Hub版本。

概览

可快速又便捷地在公有云中部署各种分析。

CDP Data Hub 是 Cloudera Data Platform(CDP)公有云平台上的一项功能强大的分析服务,可以更便捷、更快速地在云端熟悉的集群模型中实现从边缘到人工智能的高价值分析。CDP Data Hub 具有包括流、ETL、数据集市、数据库和机器学习在内的最广泛的分析工作负载,能够让您轻松地将现有工作负载从本地部署环境迁移到云端或直接在云端构建。

该综合性的基于云计算的解决方案由 Cloudera Runtime 提供支持,Cloudera Runtime 是基于 SDX 构建的一整套开源技术的集成。它提供了集群形态、工作负载类型、预建模板和配置选项等多种选择,为熟悉传统体系架构的用户提供非常直观且定制化的体验。

Data Hub 用例

简化您的云之旅

由于利用了该跨公有云和私有云的平台,可以轻松地将本地 Cloudera 工作负载提升转移到公有云,并具备以下特性:

  • 改进的性能、强大的治理和公有云的可用性
  • 可以在两种部署模型中优化工作负载的灵活性
  • 与传统集群模型比较相近的形式有助于您迁移到云端 
  • 具备通往 CDP 容器化体验的无缝迁移路径 
快速部署复杂的多分析工作负载

可以加速跨数据生命周期的公有云中复杂工作负载的部署: 

  • 凭借基于云计算的体系架构,可让您部署各种灵活的自定义分析工作负载 
  • 无论是选择模板化方法还是构建您自身的工作负载,都可以使用熟悉的基于节点的集群来获得直观的体验
  • 具备高度定制化功能,可让您部署满足特定业务需求的量身定制的工作负载

选择工作负载

  • 实时数据集市
  • 面向复杂管道的数据工程
  • 混合云上的流式传输
  • 操作型数据库

实时数据集市


可对海量快速到达的数据进行分析。 

使用 Data Hub 中的实时数据集市模板,可以每秒撷取数百万条记录,并且可以根据需要进行就地更新。数据能够以最佳格式立即可供查询。此模式非常适合时间序列应用程序、事件分析、CDC 调谐和实时数据处理管道。该模板具有 Apache Kudu 分析存储引擎,用于快速 SQL 执行的 Apache Impala,用于 SQL 开发和分析的 HUE,以及用于流处理/分析的 Apache Spark Streaming。

 

面向复杂管道的数据工程


丰富、转换和加载数据。 

通过 Data Hub,您可以丰富、转换和清理数据,从而以高度的灵活性和定制性来创建、执行和管理端到端数据管道。Data Engineering模板使您能够执行各种数据处理工作负载,包括使用 Apache SparkHive 进行批处理和实时流处理。

混合云上的流式传输



收集、处理和构建实时分析

DataFlow for CDP Data Hub 是一款综合性的边缘到云端流数据平台,使用 Apache NiFiKafka 解决混合环境中的一些流数据挑战。用户可以将 Cloudera DataFlow 的本地部署流体验扩展到云端,而无需耗费大量的资源来开发、配置和维护它们。

了解有关 DataFlow 云服务的更多信息

操作型数据库


构建高度可靠的企业级应用程序。 

Data Hub 可以让您运行支持 ANSI SQL 的高性能 NoSQL 数据库。这对使用 Apache Hbase 的业务关键型操作应用程序提供了无与伦比的规模和性能。Operational Database提供了演进式模式支持,使开发人员能够在充分利用数据的功能的同时保留应用程序设计的灵活性。它还可以根据集群的工作负载利用率提供自动扩展功能,从而优化基础架构利用率和成本。

特征

Data Hub 适用于需要综合考量灵活性、可扩展性和易用性的用户。它可以允许您重新安排工作人员角色,配置 GPU 支持,调整资源管理设置以及调优集群,从而大规模实施复杂的多功能分析用例。

可使用基础架构预构建或自定义的配置选项快速配置和处置 Data Hub 集群。通过特定于云服务提供商设置的预配置集群定义和具有 Cloudera Runtime 服务配置的集群模板,可以快速为规范性用例配置工作负载集群。还可以保存自己的集群定义和模板,以备将来重用。

Data Hub可以轻松地以相近的形态将传统工作负载迁移到云模式中。这种基于云计算的体系架构可以将数据与计算基础设施分离,并且数据交付层从原始数据中抽象出来。这种分离式的体系架构显著提高了灵活性、敏捷性、数据保护和扩展性。

由于在共享数据上配置多个集群是比较容易的,因此客户可以启用新的应用程序,可以通过适当的安全与治理完全隔离这些应用程序,而不会中断现有的生产应用程序。

Data Hub 由 Cloudera SDX 提供支撑,可以通过专用的集成界面来管理、保护和治理平台数据和元数据以及控制功能。数据安全、治理和控制策略仅设置一次就能持续地执行,从而可以降低运营成本和业务风险,同时实现完整的基础架构选择性和灵活性。

Cloudera Runtime 是 CDP 中的核心开源软件发行版,包括大约 50 个开源项目。Data Hub 内置在 Cloudera Runtime 中。通过 Runtime,您可以采取适宜的开源工具集来构建工作负载和应用程序。

开始

CDP 演示

了解 CDP 如何帮助企业通过集成的安全与治理为混合云构建端到端数据管道。

了解详情

探索 CDP 系列视频导览


通过视频演示揭开 Cloudera Data Platform 的神秘面纱,了解其如何管理和保护数据生命周期。

立即点击观看

教程

通过分步教程,初步了解如何在 Cloudera Data Platform 上创建、调整和终止 Data Hub。

现在就开始

免费培训

学习 Cloudera Essentials for CDP 课程,了解如何通过将数据转化为可行的洞察力来使业务团队和 IT 员工提高生产效率。

立即注册

定价

使用非常方便的计算器评估价格、账单条款、许可详细信息和小时费率,并估算成本。

查看定价

产品文档

从正确的资源计划、产品配置和产品管理最佳实践入手。

立即阅读

Datasheet

CloudSmart:开始您的云分析之旅

Webinar

在公有云中充满信心地扩展分析

Ebook

成功迁移到公有云的三个步骤

Solution Brief

利用 Cloudera 和 IQVIA 促进更好的健康结果

世界级的训练,技术支持和服务

Your form submission has failed.

This may have been caused by one of the following:

  • Your request timed out
  • A plugin/browser extension blocked the submission. If you have an ad blocking plugin please disable it and close this message to reload the page.