BigData-Notes

  • 2022-08-14
  • 浏览 (876)

Azkaban Flow 1.0 的使用

Azkaban Flow 2.0的使用

Azkaban简介

Flink Sink

Flink Data Source

Flink Transformation

Flink Windows

Flink 开发环境搭建

Flink 核心概念综述

Flink 状态管理

Flume 整合 Kafka

Flume 简介及基本使用

HDFS Java API

HDFS 常用 shell 命令

Hadoop分布式文件系统——HDFS

分布式计算框架——MapReduce

集群资源管理器——YARN

HBase Java API 的基本使用

Hbase 常用 Shell 命令

Hbase 协处理器

Hbase容灾与备份

Hbase的SQL中间层——Phoenix

HBase简介

Hbase系统架构及数据结构

Hbase 过滤器详解

Hive CLI和Beeline命令行的基本使用

Hive分区表和分桶表

Hive常用DDL操作

Hive 常用DML操作

Hive数据查询详解

Hive简介及核心概念

Hive 视图和索引

Kafka消费者详解

深入理解Kafka副本机制

Kafka生产者详解

Kafka简介

函数和闭包

List & Set

Scala基本数据类型和运算符

Scala 数组相关操作

Map & Tuple

Scala模式匹配

流程控制语句

Scala简介及开发环境配置

类和对象

类型参数

继承和特质

隐式转换和隐式参数

集合

DataFrame和Dataset简介

Spark SQL 外部数据源

聚合函数Aggregations

Spark SQL JOIN

弹性式数据集RDDs

Spark Streaming与流处理

Spark Streaming 基本操作

Spark Streaming 整合 Flume

Spark Streaming 整合 Kafka

Structured API基本使用

Transformation 和 Action 常用算子

Spark简介

Spark 累加器与广播变量

Spark部署模式与作业提交

Spring/Spring Boot 整合 Mybatis + Phoenix

Sqoop基本使用

Sqoop 简介与安装

Storm三种打包方式对比分析

Storm和流处理简介

Storm 核心概念详解

Storm 编程模型

Storm集成HDFS和HBase

Storm集成Kafka

Storm 集成 Redis 详解

Zookeeper ACL

Zookeeper Java 客户端 ——Apache Curator

Zookeeper常用Shell命令

Zookeeper简介及核心概念

Azkaban 3.x 编译及部署

Flink Standalone Cluster

HBase基本环境搭建

HBase集群环境配置

Hadoop单机版环境搭建

Hadoop集群环境搭建

Linux下Flume的安装

Linux下JDK的安装

Linux下Python安装

Linux环境下Hive的安装

Spark开发环境搭建

基于ZooKeeper搭建Spark高可用集群

Storm单机版本环境搭建

Storm集群环境搭建

Zookeeper单机环境和集群环境搭建

基于ZooKeeper搭建Hadoop高可用集群

基于Zookeeper搭建Kafka高可用集群

虚拟机静态IP及多IP配置

大数据学习路线

大数据常用软件安装指南

大数据应用常用打包方式

大数据技术栈思维导图

:book: 经典书籍

0  赞