开篇词 学了就能用的 Spark?.mp4
彩蛋 如何成为 Spark Contributor.mp4
第01讲 MapReduce 计算框架和编程模型.mp4
第02讲 Hadoop 集群的操作系统.mp4
第03讲 如何设计与实现统一资源管理与调度系统.mp4
第04讲 解析 Spark 数据处理与分析场景.mp4
第05讲 如何选择 Spark 编程语言以及部署 Spark.mp4
第06讲 Spark 抽象、架构与运行环境.mp4
第07讲 Spark 核心数据结构 弹性分布式数据集 RDD.mp4
第08讲 算子 如何构建你的数据管道?.mp4
第09讲 函数式编程思想 你用什么声明 你在声明什么?.mp4
第10讲 共享变量 如何在数据管道中使用中间结果?.mp4
第11讲 计算框架的分布式实现 剖析 Spark Shuffle 原理.mp4
第12讲 如何处理结构化数据 DataFrame 、Dataset和Spark SQL.mp4
第13讲 如何使用用户自定义函数?.mp4
第14讲 列式存储 针对查询场景的极致优化.mp4
第15讲 如何对 Spark 进行全方位性能调优?.mp4
第16讲 Tungsten 和 Hydrogen Spark 性能提升与优化计划.mp4
第17讲 实战 探索葡萄牙银行电话调查的结果.mp4
第18讲 流处理 什么是流处理?以及你必须考虑的消息送达保证问题.mp4
第19讲 批处理还是流处理 Spark Streaming 抽象、架构与使用方法.mp4
第20讲 如何在生产环境中使用 Spark Streaming.mp4
第21讲 统一批处理与流处理 Dataflow.mp4
第22讲 新一代流式计算框架 Structured Streaming.mp4
第23讲 如何对 Spark 流处理进行性能调优?.mp4
第24讲 实战 如何对股票交易实时价格进行分析?.mp4
第25讲 什么是图 图模式 图相关技术与使用场景.mp4
第26讲 数据并行 Spark 如何抽象图 如何切分图 如何处理图.mp4
第27讲 像顶点一样思考 大规模并行图挖掘引擎 GraphX.mp4
第28讲 Pregel 还是 MapReduce 一个有趣的算子 AggregateMessage.mp4
第29讲 实战 1 用 GraphX 实现 PageRank 算法.mp4
第30讲 实战 2 用 GraphX 求得顶点的 n 度邻居.mp4
第31讲 机器学习是什么 机器学习与机器学习工作流.mp4
第32讲 标准化机器学习流程 ML pipeline.mp4
第33讲 如何对数据进行预处理?.mp4
第34讲 少数服从多数 随机森林分类器.mp4
第35讲 物以类聚 Kmeans 聚类算法.mp4
第36讲 推荐引擎 协同过滤.mp4
第37讲 如何对模型性能进行评估并调优?.mp4
第38讲 数据仓库与商业智能系统架构剖析.mp4
第39讲 作为 Yelp 运营负责人 如何根据数据进行决策?.mp4
第40讲 如何获取业务数据库的数据.mp4
第41讲 如何构建数据立方体.mp4
第42讲 如何通过 OLAP 与报表呈现结果.mp4
第43讲 两个简化了的重要问题 数据更新和数据实时性.mp4
第44讲 另一种并行 Lambda 架构与 Kappa 架构.mp4
结束语 统一的编程模型 统一的编程语言 统一的架构.mp4
请先
!