Skip to content

gottaBoy/big-data-parent

 
 

Repository files navigation

阅读标签

Java基础】【设计模式】【结构与算法】【Linux系统】【数据库
分布式架构】【微服务】【大数据组件】【SpringBoot进阶】【Spring&Boot基础
数据分析】【技术导图】【 职场

大数据框架体系

ZooKeeper组件

序号 文章标题
01 Linux搭建ZooKeeper中间件,常用命令总结
02 SpringBoot2整合Zookeeper服务协调组件
03 分布式系统调度组件,Zookeeper集群化管理

Hadoop框架系列

序号 标题
01 大数据简介,技术体系分类整理
02 Hadoop框架:单服务下伪分布式集群搭建
03 Hadoop框架:集群模式下分布式环境搭建
04 Hadoop框架:HDFS简介与Shell管理命令
05 Hadoop框架:HDFS读写机制与API详解
06 Hadoop框架:NameNode工作机制详解
07 Hadoop框架:DataNode工作机制详解
08 Hadoop框架:HDFS高可用环境配置
09 Hadoop框架:MapReduce基本原理和入门案例
10 Hadoop框架:Yarn基本结构和运行原理

基础组件系列

序号 标题
01 数据仓库组件:Hive环境搭建和基础用法
02 数据仓库组件:HBase集群环境搭建和应用案例
03 数据采集组件:Flume基础用法和Kafka集成
04 数据搬运组件:基于Sqoop管理数据导入和导出
05 数据调度组件:基于Azkaban协调时序任务执行

分布式存储系列

序号 标题
01 数据源管理:OLAP查询引擎,ClickHouse集群化管理
02 数据源管理:Kafka集群环境搭建,消息存储机制详解
03 数据源管理:搜索引擎框架,ElasticSearch集群模式
04 数据源管理:分布式NoSQL系统,Cassandra集群管理
05 数据源管理:OLAP分析引擎,Druid数据统计分析组件
06 数据源管理:OLAP分析引擎,Presto跨数据源分析

数据搬运组件

序号 标题
01 数据源管理:基于DataX组件,同步数据和源码分析
02 MySQL数据全量或增量方式,向ES搜索引擎同步流程

实时计算框架

序号 标题
01 实时计算框架:Spark集群搭建与入门案例
02 实时计算框架:Flink集群搭建与运行机制

数据洞察业务

序号 标题
01 数据管理流程,基础入门简介
02 业务场景下数据采集机制和策略
03 数据全景洞察业务概念简介
04 数据应用场景之标签管理体系
05 标签管理体系之业务应用
06 用户画像分析与场景应用
07 基于业务和平台理解数字营销概念
08 数据管理:业务数据清洗,落地实现方案

关于作者

公众号 码云 知乎 简书 博客园 CSDN


推荐项目

序号 项目名称 GitHub地址 GitEE地址 推荐指数
01 Java描述设计模式,算法,数据结构 GitHub·点这里 GitEE·点这里 ☆☆☆☆☆
02 Java基础、并发、面向对象、Web开发 GitHub·点这里 GitEE·点这里 ☆☆☆☆
03 SpringCloud微服务基础组件案例详解 GitHub·点这里 GitEE·点这里 ☆☆☆
04 SpringCloud微服务架构实战综合案例 GitHub·点这里 GitEE·点这里 ☆☆☆☆☆
05 SpringBoot框架基础应用入门到进阶 GitHub·点这里 GitEE·点这里 ☆☆☆☆
06 SpringBoot框架整合开发常用中间件 GitHub·点这里 GitEE·点这里 ☆☆☆☆☆
07 数据管理、分布式、架构设计基础案例 GitHub·点这里 GitEE·点这里 ☆☆☆☆☆
08 大数据系列、存储、组件、计算等框架 GitHub·点这里 GitEE·点这里 ☆☆☆☆☆

About

大数据体系,存储,计算,相关组件,分析引擎等

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Java 100.0%