参加线上Sessions

参与2018年Cloudera E-Sessions的线上活动,获得关于Hadoop生态系统项目的最新知识,不论您是开发人员、数据工程师还是数据科学家,都能在Cloudera E-Sessions找到您所感兴趣的产品详解、最佳实践、实操演示、用户案例等各类信息。

注册报名

议程内容

议题一:数据科学家的新利器Cloudera Data Science Workbench 数据科学工作站

本演讲讨论了在常用的大数据数据科学和探索应用场景下会遇到的问题,Cloudera数据科学工作台如何直接在 Web 浏览器中使用 Python、R 和 Scala等数据科学家们所熟悉的语言提供灵活而安全的自助服务。数据科学家可以在自己的笔记本电脑上可自定义的项目环境中下载并体验最新的库和框 架。除了广泛的 Python 和 R 生态系统之外,还纳入了 Tensorflow、Microsoft Cognitive Toolkit、MXnet、BigDL 等深度学习框架。Cloudera 数 据科学工作台提供了一个安全可靠的环境,将最新的开源创新与客户所信任的统一平台Cloudera 企业版融合在一起。

议程二:大数据的近实时分析系统架构Impala + Kudu

该系统适合在需要同时支持顺序和随机读/写的应用场景下,需要准实时的同步插入和修改,同时汇总分析和单条查询。比如在线交互式BI分析(银行的贷后风险实时监测)、实践序列数据(股市行情数据)、IoT机器日志数据分析(故障预警)等。

本演讲将对Impala和Kudu分别做介绍,并演示Impala + Kudu的使用。

议程三:Hadoop上的数据安全管理 Cloudera Navigator

大数据为企业带来了数据管理上的重大挑战:大量的业务用户想自助访问可发掘数据;管理员需要知道数据是怎么被用来优化分析性能的;安全团队需要看见数据的访问方式以及它们是怎么满足合规性的。一个企业大数据平台必须有能力在整个机构内解决数据管理以及合规性需求,但同时不能牺牲大数据本身的灵活性和优势。 Cloudera Navigator是唯一为大数据和Apache Hadoop提供集成数据管理和监管的解决方案。Cloudera Navigator作为Cloudera 企业版的核心,它提供了必要的审计和数据保护,来满足最严苛的规范限制。

议程四:Cloudera - 新一代机器学习平台

各种规模的企业在超链接世界的数据量中手足无措,需要解决方案来分析和采取行动。 机器学习和人工智能(AI)的出现能够帮助了解数据模式,预测结果,并制定最佳行动来影响这些结果。 机器学习的新用例每天都在涌现 - 从预测性维护和欺诈检测到产品推荐引擎和主动客户支持。 我们将介绍世界上最好的组织如何使用数据驱动的洞察来发展业务及更高效地运营。

议程五:数据科学自动化

在这个专题报告中,我们将概要介绍数据科学的概念、典型应用场景案例以及目前面临的常见问题,解释我们如何充分利用现有Hadoop上的全量数据,如何有效的把算法迭代、机器学习、深度学习等大规模并行计算任务运行于Hadoop集群并与现有的数据集群结合,最终把数据科学的“实验环境”和生产集群打通并且加速模型和算法投产过程。