适用对象:需要了解大数据,或者需要熟知大数据管理、维护、开发和数据分析的人
课程列表
企业级大数据技术与应用
面授时长:18 小时

课程简介:1. 了解大数据业内最新发展趋势,深入掌握Hadoop的原理,Hadoop生态系统
2. 深入学习yarn 框架下的MapReduce,掌握MapReduce研发
3. 掌握HDFS 开发
4. 了解Hadoop集群规划,应用案例解析
5. 列式数据库HBase的基本原理,应用场景,掌握基本的编程技巧
6. 学习掌握 Hive工具 , 分布式协调系统Zookeeper的基本原理,应用场景,掌握基本的编程技巧
7. 掌握Spark技术
8. 掌握Impala
9. 掌握相关的大数据核心组件
Scala从基础到开发实战
面授时长:12 小时

课程简介:通过学习本课程能具备初步的Scala语言实际编程能力,更好地参与Spark等大数据课程学习。
数据仓库模型建设与数据挖掘实战
面授时长:18 小时

课程简介:能够进行建模和数据仓库管理工作
、对ETL有更深入的认识及对方法的掌握
、充分理解数据挖掘和数据仓库的方法论
、提高自己分析问题解决问题的实际能力
数据中台与大数据建设案例分析和最佳实践
面授时长:12 小时

课程简介:1、理解数据中台的概念,理解数据驱动,以及数据价值变现
2、理解如何在数据中台中实践“尽可能采集数据、更好地整理数据、有效地挖掘数据价值”
3、理解如何将“自顶向下”与“自下而上”向结合,制订切实可行的开展数据中台建设
大数据平台Storm实践
面授时长:24 小时

课程简介:了解大数据业内最新发展趋势,深入掌握Storm的原理,Storm生态;
掌握Storm大数据平台技术及原理;
深入学习yarn框架下的Storm,掌握Storm研发;
掌握Storm开发;
了解Storm集群规划,应用案例解析;
列式数据库Storm的基本原理,应用场景,掌握基本的编程技巧。
大数据平台Spark深入实践
面授时长:24 小时

课程简介:Spark 是一种与 Hadoop 相似的开源集群计算环境,但是两者之间还存在一些不同之处,这些有用的不同之处使 Spark 在某些工作负载方面表现得更加优越,换句话说,Spark 启用了内存分布数据集,除了能够提供交互式查询外,它还可以优化迭代工作负载。本课程深入学习Spark技术,通过本课程的学习,可以掌握:
1. 掌握Spark 部署中常见的方法与注意事项;
2. 掌握Spark集群规划方法及配置优化方法;
3. 掌握Spark 原理 RDD,PariRDD;
4. 掌握Spark读取与存储数据的方法;
5. 掌握Spark SQL 使用;
6. 掌握Spark Streaming 原理与使用及优化办法。