Java Software framework
하둡에 다 때려박은거 Data Warehouse 으로 이전하거나 추상화해서 데이터관리함
너치의 분산 처리를 지원하기 위해 개발된 것으로, 아파치 루씬의 하부 프로젝트
- Data Processing layer (Hadoop MapReduce, Hadoop Yarn)
- Data access layer (Apache Hive,
- Data management layer
Hadoop은 데이터 저장소의 역할을 하고, Spark는 분석 엔진의 역할, Zeppelin은 인터페이스의 역할
Hadoop Notion
Hadoop Usages