Developer/Headoop
-
[Headoop] 하둡 개념Developer/Headoop 2013. 2. 28. 15:42
하둡이란? 대량의 자료를 처리할 수 있는 큰 컴퓨터 클러스트에서 동작하는 분산 응용 프로그램을 지원하는 자유 자바 소프트웨어 프레임 워크이다. 원래 너치의 분산처리를 지원하기 위해 개발되었으며, 아파치 루씬의 하부 프로젝트이다. 분산처리 시스템인 구글 파일 시스템을 대체할 수 있는 하둡 분산 파일 시스템(HDFS : Headoop Distributed File System)과 맵리듀스를 구현한 것이다. 아파치 프로젝트 아파치 하둡에는 다음과 같은 3개의 하위 프로젝트들이 있다. 1) Hadoop Common(하둡 커먼) : 다른 하둡 하위 프로젝트들에서 공통으로 사용되는 유틸리티들을 포함하고 있다. 2) Hadoop Distributed File System (HDFS™)(하둡 분산 파일 시스템) : 애..