BDM125:Hadoop大数据开发精品实战

开班计划时间:36 小时
  • 具体开课时间请咨询课程顾问
预约试听 马上咨询
课程介绍
适用对象:需要了解大数据,或者需要熟知大数据管理、维护、开发和数据分析的人
学习收获:1、了解大数据在行业的发展情况 2、了解大数据的理论基础知识 3、了解大数据的发展趋势 4、动手Clouders Manager的安装和部署 5、熟知CDH的安装配置和解决越到的问题 6、熟悉Hadoop分布式文件系统 7、懂得hdfs分布式文件系统的使用 8、了解MapReduce工作原理 9、熟知Hadoop集群硬件配置规划 10、懂得Hadoop集群配置及优化 11、学会如何维护和监测Hadoop集群 12、学会怎么使用Sqoop连接关系数据库进行数据导入导出 13、了解Hive数据仓库的开发和应用 14、Hue的web页面的数据库开发 15、精通Hbase列式数据库的开发 16、熟悉hadoop衍生数据处理 17、学会kettle等数据处理的工具
详细大纲
1 大数据的基础介绍
1.1 什么是大数据?
1.2 大数据时代的背景
1.3 学术上怎么定义大数据?
1.4 大数据的构成
1.5 大数据的演进过程
2 大数据带来的影响
2.1 大数据的关键技术
2.2 大数据分布式系统的构成
2.3 计算模式
2.4 大数据产业
2.5 大数据与云计算的关系
2.6 大数据和物联网的关系
3 安装和配置
3.1 VMware虚拟机安装和配置
3.2 CentOS5且64位系统安装
3.3 简单的配置和遇到的问题
3.4 动手和实操
3.5 Cloudera Manager的离线安装
3.6 Cloudera CDH的离线安装的环境准备 和配置,注意事项
3.7 单机版、伪分布式、真分布式介绍和区别
3.8 详细介绍了CDH的部署配置,遇到的问题,怎么解决
3.9 HDFS分布式文件系统的安装配置和测试
3.10 1hdfs的权限配置,目录创建,目录查看等命令的使用
4 如何构建分布式数据仓库平台
4.1 怎么样才算是真正意义的大数据平台
4.2 开源Hadoop生态系统的介绍
4.3 数据采集过程与分布式存储
4.4 数据仓库与数据分析介绍
4.5 集群监控与调度组件
4.6 Hue介绍和例子讲解
4.7 练习
4.8 案例讲解
5 Hive数据仓库及案例
5.1 Hive基本介绍
5.2 Hive命令
5.3 Hive优化
5.4 Hive的用户自定义函数
5.5 Hive练习和案例
6 大数据平台部署及案例
6.1 我们应该选哪种Hadoop?
6.2 集群硬件应该如何选配?
6.3 部署案例讲解
7 Hbase列数据库及应用案例
7.1 Hbase感性认识
7.2 Hbase主要组成
7.3 Hbase性能测试
7.4 Hbase设计原则和优化
7.5 例子和练习
7.6 项目案例:
8 Kafka详解及应用案例
8.1 Kafka的基本介绍
8.2 Kafka的原理解析
8.3 Kafka安装和部署
8.4 Kafka的Java应用开发
8.5 Kafka与Hadoop集成
8.6 练习
8.7 案例
9 Hadoop衍生数据处理详解
9.1 ETL数据处理介绍
9.2 Kettle 介绍
9.3 Kettle适用
9.4 Kettle案例
9.5 JAVASCRIPT的基本应用
9.6 文件FTP下载、上传
9.7 作业调用作业、转换
9.8 启动脚本说明
9.9 JAVA调用作业、转换
9.10 kettle使用原则
课程评价

课程评价({{EvaluationTotal}})

课程满意度

评价

您还没有给课程评分哦

满意度

    追加评价:

课程咨询
内容:

您还没有填写内容!

暂无问答,赶紧去提问吧
{{item.AnswerState==1?"已解决":"未解决"}}
{{item.Content}}
{{item.StudentAskTime}}
{{itemanswer.UserName}}
{{itemanswer.Content}}
{{itemanswer.StudentAskTime}}
同类课程推荐 more
嘉为大讲堂 more
原创文章 more

您好! 欢迎来到学领未来 !

学领未来提供线上及线下的学习服务,根据您的位置,为您推荐最近的线下培训地点 分站,你选择: