济南东方瑞通培训学校

济南东方瑞通培训学校除了在十个城市提供传统面授外,还通过专业直播平台为其他城市学员提供专业的直播教学服务,通过在线助教,预习复习视频等保证教学质量和学习效果。

课程导航
IT认证 软件开发 云计算 网络安全 大数据与人工智能 营销与管理

位置:学校课程 >济南大数据Spark实战培训

济南大数据Spark实战培训

济南大数据Spark实战培训

上课时段: 详见内容

已关注: 1905

课程价格: 电询

优惠价格: 电询

预约试听

授课: 济南东方瑞通培训学校

教学点: 7个

开班时间: 滚动开班

咨询电话: 132-1050-8723

在线咨询

课程介绍

更新:2022/4/21

课程亮点

1师资:优秀讲师团队,丰富行业经验和企业培训经验

2特色:小班培训,精品课程,面授+直播+录播,上课方式多样

3培训:免费重听

4服务:提供全套复习视频及考前辅导视频

学习目标

(1)了解大数据业内最新发展趋势,深入掌握Hadoop的原理,Hadoop生态系统

(2)深入学习yarn 框架下的MapReduce,掌握MapReduce研发

(3)掌握HDFS 开发

(4)了解Hadoop集群规划,应用案例解析

(5)列式数据库HBase的基本原理,应用场景,掌握基本的编程技巧

(6)学习掌握 Hive工具

分布式协调系统Zookeeper的基本原理,应用场景,掌握基本的编程技巧

(7)深入掌握Spark

课程内容

大数据背景与思维

1. 什么是大数据

2. 大数据技术的产生背景

3. 大数据应用场景

4. 大数据思维

5. 大数据产业链

6. 大数据是如何变革各行业的技术架构、商业模式和组织方式

7. 大数据必备的技术基础

第一天

互联网电信大数据应用案例深度解析

大数据在通信及互联网行业的应用案例解析-以下几个案例将贯穿整个培训内容, 作为每个章节的案例分析细化到每个大数据的知识点

互联网企业遇到大数据的问题

案例分享:海量数据通信行业解决方案

案例分享:基于通信网元实时数据的海量数据解决方案

案例分享:中国电信用户画像分析系统的大数据变现案例分析

案例分享:淘宝大数据分析案例分析

第一天

海量数据处理系统

的架构设计

这个部分主要讲解海量数据处理的架构设计,针对海量数据的问题设计海量数据的架构解决方案。

海量数据处理的系统场景

大数据时代的数据架构解决方案

海量数据处理的架构汇总

8种海量数据处理的架构设计比较

分布式系统架构的海量数据处理设计

海量数据处理设计

典型案例分析:结合一个500强实时数据系统的实例案例进行分析,详细分析海量数据处理的架构设计

第二天

案例及动手实验

HDFS实战-Java API使用

PB 级大数据存储系统的项目案例分析

HDFS部署、配置与性能调优实战

典型案例分析:通过HDFS API完成一个复杂数据系统的操作过程

Hadoop MapReduce深入解析

使用 Hadoop MapReduce Streaming 编程

MapReduce流程

基本MapReduceAPI 概念

MapReduce的优化

MapReduce的任务调度

MapReduce编程实战

满足解决实际数据分析问题的高级Hadoop API

第三天

Hive架构及实践案例沙盘演练

Hive系统部署与搭建

Hive工作机制

基于Hive的大数据加载过程

Hive程序编写性能建议

MapJoin

数据倾斜

Join顺序

UDF编写注意事项

快速获取结果TopN

通过Explain观察Hive行为

动手实验:完成Hive的搭建与配置

典型案例分析:基于Hive的大型电信通话记录分析示例,详细分析Hive的架构应用、性能调优及其使用场景与整体系统架构的结合

第四天

Spark架构及实践

案例沙盘演练

1.2 Spark的重要扩展

1.2.1 Spark SQL和DataFrame

1.2.2 Spark Streaming

1.2.3 Spark MLlib和ML

1.2.4 GraphX

1.2.5 SparkR

2.3 运行Spark应用程序

2.3.1 Local模式运行Spark应用程序

2.3.2 Standalone模式运行Spark应用程序

2.3.3 YARN模式运行Spark

2.3.4 应用程序提交和参数传递

3 Spark程序开发

3.1 使用Spark Shell编写程序

3.1.1 启动Spark Shell

3.1.2 加载text文件

3.1.3 简单RDD操作

3.1.4 简单RDD操作应用

3.1.5 RDD缓存

3.2 构建Spark的开发环境

3.2.1 准备环境

3.2.2 构建Spark的Eclipse开发环境

3.2.3 构建Spark的IntelliJ IDEA开发环境

3.3 独立应用程序编程

3.3.1 创建SparkContext对象

3.3.2 编写简单应用程序

3.3.3 编译并提交应用程序

第五天

Spark Streaming应用开发

Spark Streaming Java实例开发、运行

Spark Streaming Java实例的运行过程分析

Spark Streaming内部数据传输过程分析

Spark Streaming应用开发总结(API回顾,典型应用模式总结)

Spark Streaming消息可靠性保证机制介绍

Spark Streaming实时大数据算法解析案例

Spark Streaming实时大数据报警案例

Spark Streaming实时大数据的调整与改进

济南东方瑞通培训学校:http://www.91soxue.com/2440/

学校相册
学校动态
招生问答

温馨提示:提交留言后老师会第一时间与您联系!热线电话:132-1050-8723

扫码免费预约试听

扫码免费预约试听