Skip to content

大数据学习路线

第一阶段:先看全貌

  • 理解批处理、流处理、数据仓库的基本概念
  • 先知道每个组件解决什么问题,再去学具体工具

第二阶段:进入计算引擎

  • 学 Spark 的核心抽象
  • 理解任务调度、执行计划、宽窄依赖和容错思路

第三阶段:走向数据链路

  • 明白采集、存储、计算、服务是怎么串起来的
  • 关注任务治理、数据质量和资源成本

第四阶段:回到业务场景

  • 用案例沉淀经验
  • 不把大数据只学成“会写几个 API”

以体系化知识沉淀为主,持续迭代中。