大数据运维实战，给大数据工程师的运维修炼手册

admin 发表于 2024-11-21 07:30:01

<img src="/wp-xxx/uploads/images/20224231704629147.jpg"> 大数据在这个互联网时代的重要意义，已经无需再多赘述。阿里、腾讯、美团等几乎你听过名字的公司，都有自己的大数据平台。
过去我们都关注大数据开发，随着大数据平台的逐渐完善，如何保障数据的安全、高效，如何保证系统架构的平稳运行，都成为各数据平台的“心病”。
于是，大数据运维这个岗位一跃成为大数据领域的热词。很多公司会让开发来兼大数据运维的工作，这对开发人员来说也是不小的挑战。
相比大数据开发，大数据运维方向需要更多的经验积累，比如什么架构才能支撑这个数据量、什么资源配置才能满足分析需求，这需要你实际接触过、操作过才能给出答案，而不是靠理论或者猜测。
专栏共七大模块， 26 个课时，引用大量大数据运维的实战案例，来讲述大数据平台的架构设计与部署、大数据平台的监控告警、性能调优，涵盖了大数据运维工作的全方位技能点。
课程目录
 开篇词：掌握大数据，把握未来.md
 第01讲：大话 Hadoop 生态圈.md
 第02讲：Hadoop 发行版选型和伪分布式平台的构建.md
 第03讲：自动化运维工具 Anible 在部署大数据平台下的应用（上）.md
 第05讲：手动模式构建双 Namenode+Yarn 的 Hadoop 集群（上）.md
 第07讲：通过 Ambari 工具自动化构建 Hadoop 大数据平台和外围应用（上）.md
 第09讲：如何通过 Hivetez 与 Hadoop 的整合快速实现大数据开发（上）.md
 第11讲：HDFS 组件运行机制剖析及 HDFS Shell 的使用.md
 第12讲：Hadoop 分布式资源管理器 Yarn、MR 运行机制剖析.md
 第13讲：Spark Standalone 模式的构建以及 Spark 与 Yarn 的整合.md
 第14讲：HBae 与 Hadoop 的整合应用实践.md
 第15讲：Flink Standalone、Flink on Yarn 集群构建与应用场景.md
 第16讲：轻量级日志收集工具 Filebeat 应用案例.md
 第17讲：日志收集、分析过滤工具 Logtah 应用实战.md
 第18讲：Elaticearch 应用架构的实现与调优.md
 第19讲：Kafka 应用场景、集群容量规划、架构设计应用案例.md
 第20讲：日均数据量 30 亿的 Filebeat+Kafka+Mirrormaker 跨机房实时日志传送案例.md
 第21讲：Filebeat+Kafka+Logtah+Elaticearch 构建可视化日志分析系统.md
 第22讲：通过 Ganglia 实现对 HDFS、Yarn、Spark 运行状态监控.md
 第23讲：Namenode、Datanode、Nodemanager 等服务状态监控策略.md
 第24讲：通过 Kafka Eagle 实现对 Kafka 消息队列的监控.md
 第25讲：Yarn 资源调度 Fair Schedule 与 Capacity Scheduler 配置选型.md
 第26讲：HDFS 存储权限 ACL 控制策略以及与系统权限整合应用.md
 第27讲：Yarn、HDFS、Kafka 内存调优策略以及性能瓶颈.md
 第28讲：Hadoop 平台常见故障汇总以及操作系统性能调优.md
 第29讲：大数据平台的硬件规划、网络调优、架构设计、节点规划.md
 第30讲：Hadoop 跨集群数据迁移应用实践.md
 第04讲：自动化运维工具 Anible 在部署大数据平台下的应用（下）.md
 第06讲：手动模式构建双 Namenode+Yarn 的 Hadoop 集群（下）.md
 第08讲：通过 Ambari 工具自动化构建 Hadoop 大数据平台和外围应用（下）.md
 第10讲：如何通过 Hivetez 与 Hadoop 的整合快速实现大数据开发（下）.md
 结语：大数据运维，大有作为.md
文档
 开篇词：掌握大数据，把握未来.mp4
 第01讲：大话 Hadoop 生态圈.mp4
 第02讲：Hadoop 发行版选型和伪分布式平台的构建.mp4
 第03讲：自动化运维工具 Anible 在部署大数据平台下的应用（上）.mp4
 第05讲：手动模式构建双 Namenode+Yarn 的 Hadoop 集群（上）.mp4
 第07讲：通过 Ambari 工具自动化构建 Hadoop 大数据平台和外围应用（上）.mp4
 第09讲：如何通过 Hivetez 与 Hadoop 的整合快速实现大数据开发（上）.mp4
 第11讲：HDFS 组件运行机制剖析及 HDFS Shell 的使用.mp4
 第12讲：Hadoop 分布式资源管理器 Yarn、MR 运行机制剖析.mp4
 第13讲：Spark Standalone 模式的构建以及 Spark 与 Yarn 的整合.mp4
 第14讲：HBae 与 Hadoop 的整合应用实践.mp4
 第15讲：Flink Standalone、Flink on Yarn 集群构建与应用场景.mp4
 第16讲：轻量级日志收集工具 Filebeat 应用案例.mp4
 第17讲：日志收集、分析过滤工具 Logtah 应用实战.mp4
 第18讲：Elaticearch 应用架构的实现与调优.mp4
 第19讲：Kafka 应用场景、集群容量规划、架构设计应用案例.mp4
 第20讲：日均数据量 30 亿的 Filebeat+Kafka+Mirrormaker 跨机房实时日志传送案例.mp4
 第21讲：Filebeat+Kafka+Logtah+Elaticearch 构建可视化日志分析系统.mp4
 第22讲：通过 Ganglia 实现对 HDFS、Yarn、Spark 运行状态监控.mp4
 第23讲：Namenode、Datanode、Nodemanager 等服务状态监控策略.mp4
 第24讲：通过 Kafka Eagle 实现对 Kafka 消息队列的监控.mp4
 第25讲：Yarn 资源调度 Fair Schedule 与 Capacity Scheduler 配置选型.mp4
 第26讲：HDFS 存储权限 ACL 控制策略以及与系统权限整合应用.mp4
 第27讲：Yarn、HDFS、Kafka 内存调优策略以及性能瓶颈.mp4
 第28讲：Hadoop 平台常见故障汇总以及操作系统性能调优.mp4
 第29讲：大数据平台的硬件规划、网络调优、架构设计、节点规划.mp4
 第30讲：Hadoop 跨集群数据迁移应用实践.mp4
 第04讲：自动化运维工具 Anible 在部署大数据平台下的应用（下）.mp4
 第06讲：手动模式构建双 Namenode+Yarn 的 Hadoop 集群（下）.mp4
 第08讲：通过 Ambari 工具自动化构建 Hadoop 大数据平台和外围应用（下）.mp4
 第10讲：如何通过 Hivetez 与 Hadoop 的整合快速实现大数据开发（下）.mp4
 结语：大数据运维，大有作为.mp4
<div> </div>

页: [1]

奇缘网's Archiver

大数据运维实战，给大数据工程师的运维修炼手册