安全地存储、处理和分析所有静态的结构化和非结构化数据
Hortonworks Data Platform(HDP)是一种适用于分布式存储和处理大规模多源数据集的开源框架。HDP 实现 IT 基础设施现代化,安全保护您的云端或内部数据,促进新的收入来源,改善客户体验和控制成本。
HDP 提供了在 Apache Hadoop 群集中支持 GPU 的基础,提高了数据科学和 AI 用例所需的计算性能。它使 GPU 池化能够促进 GPU 资源与更多的工作负载共享,以提高成本效益。它还支持 GPU 隔离,将 GPU 专用于某一应用程序,则其他应用程序就不能访问该 GPU。
HDP 包括容器化化的 TensorFlow 技术预览,它与 GPU 池化相结合,更易于提供深度学习模式的设计、构建和培训。
HDP使您可以自由地在混合和多云环境中部署大数据工作负载,而不必依赖于供应商锁定的特定云架构。客户能够在任何云环境中无缝地创建和管理大型数据群集。HDP 与云不可知,能够自动配置,在优化云资源使用的同时简化大数据部署。
云存储支持以本机格式存储无限量的数据,包括 Microsoft ADLS、WASB、AWS S3 和 Google Cloud Storag。Cloudbreak 通过将 HDP 部署到您选择的云提供商来提供云端群集的轻松配置
HDP 包括改进的查询性能,专注于更快捷的查询。Hive LLAP 是最快捷的 Apache Hive 引擎,可以在多租户环境中运行,而不会引起资源竞争。这种集成极大地加快了商务智能场景中常用的查询,如联接和聚合查询。除了查询优化之外,Hive 还允许创建资源池,以进行精细的资源分配。
HDP 在默认情况下启用 ACID 事务,从而更易于在 Hive 表格中更新和支持 GDPR 需求。Hive 作为实时数据库消除了低延迟和高吞吐量工作负载之间的性能差异,以更快的速度处理更多的数据。
HDP 继续提供全面的安全和治理。HDP 的安全性以多个层次集成,包括用于身份验证、授权、问责和数据保护的功能。安全和治理的集成使安全专业人员能够设置基于分类的安全策略。此外,数据治理工具使组织可以在数据生态系统中应用一致的数据分类。
其他功能允许对事件进行更精细和更详细的审核,从而使审核人员更容易完成工作。审核人员和用户可以看到数据在整个生态系统中移动时的完整监管链。标签传播允许审核人员和用户查看数据在整个企业中的去向,并保留敏感数据的上下文。基于时间的策略允许对特定用户进行临时访问。