在学习Java之前,我们首先是要安装好开发工具和配置jdk环…
Kafka基本原理详解
一、概念理解 Kafka是最初由Linkedin公司开发,是…
MapReduce基本原理
一、概念理解 MapReduce是面向大数据并行处理的计算模…
Spark工作原理及基础概念(超详细!)
一、Spark概述 (1)概述 Spark,是一种"One …
深入理解HDFS:最强辅助SecondaryNameNode
前言 现在业内使用的大多数分布式框架都是主从结构,HDFS也…
HDFS核心概念——Block
引入Block的概念,可以使单个文件大小超过磁盘大小,使构成…
初识HDFS:Hadoop分布式文件系统
HDFS是什么? HDFS是Hadoop中的一个存储子模块…
为什么会有第一代大数据技术Hadoop和第二代大数据技术Spark?
hadoop开启了人们大规模普及化使用大数据的历史阶段。 但…