BDM111:Hadoop大数据分析培训

开班计划时间:30 小时
上课地点 上课方式 预计上课时间
深圳 线下面授
2019/5/4、5、11、12
预约试听 马上咨询
课程介绍
适用对象:具备初步的IT基础知识的人员
学习收获:掌握大数据的关键技术和挖掘分析技术使用,便于把大数据技术落地到自己的工作实践中
详细大纲
1 Hadoop分布式文件系统
1.1 HDFS进阶:存储思路
1.2 HDFS进阶:元数据节点
1.3 HDFS进阶:心跳原理
1.4 HDFS数据块结构及接口API
2 Hadoop分布式计算框架 – MapReduce
2.1 MapReduce概述
2.2 MapReduce进阶
2.3 MapReduce关键过程: Shuffle和Sort
2.4 MapReduce的缺陷与分布式缓存Distribute Cache
3 Hadoop集群规格与搭建
3.1 Hadoop集群的规划与搭建
3.2 Hadoop集群资源管理:调度器
3.3 实现Hadoop集群的多租户架构
3.4 图形化管理工具
4 Hadoop集群高级配置与性能监控
4.1 Hadoop集群的高级配置
4.2 Hadoop性能调优
4.3 Hadoop系统监控
5 Hadoop集群数据查询与分析Hive
5.1 查询数据与分析: Hive
5.2 Hive的数据格式
5.3 Hive数据库表管理及查询
5.4 Hive数据访问控制及数据管理
6 Hadoop集群数据查询与分析Impala
6.1 Impala基础
6.2 Impala Shell
6.3 Impala 的查询及性能提升
6.4 使用Impala的交互式数据分析
7 HBase介绍
7.1 HBase基础及HBase体系结构
7.2 HBase Shell及读写操作
7.3 Hbase管理及性能优化
7.4 Hbase复制和备份机制
8 Spark基础
8.1 Spark简介及业务应用场景
8.2 Spark与Hadoop
8.3 Spark运行模式及scala基础
8.4 RDD、DataFrame的异同
9 Spark SQL与大数据平台
9.1 Spark SQL简介
9.2 Spark SQL架构
9.3 Spark SQL操作Hive
10 python与Spark结合进行数据挖掘分析
10.1 Spark数据分析框架及PySpark的应用
10.2 python基础
10.3 pyspark大数据分析应用及落地应用建议
课程评价

课程评价({{EvaluationTotal}})

课程满意度

评价

您还没有给课程评分哦

满意度

    追加评价:

课程咨询
内容:

您还没有填写内容!

暂无问答,赶紧去提问吧
{{item.AnswerState==1?"已解决":"未解决"}}
{{item.Content}}
{{item.StudentAskTime}}
{{itemanswer.UserName}}
{{itemanswer.Content}}
{{itemanswer.StudentAskTime}}
同类课程推荐 more
嘉为大讲堂 more
原创文章 more

您好! 欢迎来到学领未来 !

学领未来提供线上及线下的学习服务,根据您的位置,为您推荐最近的线下培训地点 分站,你选择: