본문 바로가기

hadoop

(2)
하둡 완벽 가이드 요약 Hadoop 완벽 가이드참고서적 이 문서의 내용은 Hadoop 완벽 가이드 서적을 스터디하면서 정리한 내용 입니다. 1장 하둡과의 만남2장 맵리듀스3장 하둡 분산 파일시스템4장 하둡 IO5장 맵리듀스 프로그래밍6장 맵리듀스 작동 방법7장 맵리듀스 타입과 포맷8장 맵리듀스 기능9장 하둡 클러스터 설정10장 하둡 관리11장 피그12장 하이브[13장 HBase]14장 주키퍼15장 스쿱16장 사례 연구HBase 샘플 프로그래밍문서정보이 문서는 구루비에서 작성하였습니다.이 문서를 다른 블로그나 홈페이지에 게재하실 경우에는 출처를 꼭 밝혀 주시면 고맙겠습니다.~^^출처 : http://wiki.gurubee.net/pages/viewpage.action?pageId=23232525&구루비 지식창고의 모든 문서는 크..
쉽게 배우는 하둡 에코 시스템(Hodoop eco system) 하둡은 비즈니스에 효율적으로 적용할 수 있도록 다양한 서브 프로젝트가 제공됩니다. 이러한 서브 프로젝트들이 상용화되면서, 하둡 에코 시스템(Hadoop ECO system)이 구성됐습니다. 참고로 하둡 에코 시스템은 하둡 생태계라고 표현되기도 합니다. 아래 그림은 하둡 에코 시스템을 나타낸 것입니다. 분산 데이터를 저장하는 HDFS와 분석 데이터를 처리하는 MapReduce가 하둡 코어 프로젝트에 해당하며, 나머지 프로젝트는 모두 하둡의 서브 프로젝트입니다. 아파치 하둡 프로젝트에 속하는 프로젝트도 있지만, 업체에서 자사의 솔루션으로 이용하다가 오픈 소스로 공개한 프로젝트도 있습니다. 각 각의 서브 프로젝트들의 특징은 다음과 같습니다. 1. Zookeeper분산 환경에서 서버들간에 상호 조정이 필요한 다..