빅데이터 하둡프로그래밍 실무과정
Big Data란 기존 데이터베이스 관리도구의 데이터 수집,저장,관리,분석의 역량을 넘어서는 대향의 데이터 셋으로
IT업계의 핵심 크렌드인 클라우드와 빅데이터가 결합하여,클라우드 환경은 다양한 데이터가 폭발적으로 증가하는
빅데이터 시대에서 핵심적인 플랫폼이다.'
또한 하둡은 분산파일시스템(HDFS)과 데이타처리 프레임워크인 맵듀리스를 제공하고 있으며 서브프로젝트로
데이터 수집 시스템인 ChuKwa(척와) 및 플룸,마하웃"등 빅데이터 처리에 필수적인 솔루션을 제공한다.
본강좌는 빅데이터에 대한 이해를 높임으로써, 업무에 적용하기 위한 다양한 방법을 이해하며 하둡의 설치부터
핵심 구성 요소인 HDFS와 맵리듀스(MapReduce)의 동작 원리를 학습하여 프로그래밍을 손쉽게 시작할 수 있다.
또한 하둡 클러스터를 운영하는 데 필수적인 관리 방법과 하둡 스트리밍(Streaming), 스케줄러와 같은 부가
기능의 활용법 등을 습득한다.
◆ 교육개강 - 11월13일 ~ 11월17일
◆ 교육과정 - 빅데이터 하둡프로그래밍 (5일 40시간)
- 노동부환급 (재직자내일배움카드,사업주환급)적용혜택
◆ 교육강의시간 - 평일주간 09:30~18:30
◆대 표 :02-6925-4760
◆사이트:http://oraclejava.co.kr/gspecedu/curri/currimaster.php?command=2835&lecture=6
교육목표
- 빅데이터의 가치와 트렌드 이해- 빅데이터 플랫폼 및 분석 방법
- 하둡 에 대한 이해
- 오픈소스 하둡 설치 및 맵리듀스 프로그래밍 실습- 하둡 프레임워크 활용
교육대상
- 기업 전산시스템 및 데이터 관리자
- 개발자, DBA, SE
- 빅데이터 관련 직무자 및 관심 대상자
선수학습
- DB 및 프로그래밍 개발 관련 업무 종사자
- 관계형 데이터베이스 유경험자
- Java Application, Java Script/Eclipse 사용 유경험자
- 리눅스/유닉스 시스템 유경험자
교육과정(커리큘럼 상세 내용은 해당 홈페이지 참조)
빅데이터의 가치와 도입 전략
- 빅데이터 개요 및 가치
- 빅데이터 활용 도입 전략
- 빅데이터 플랫폼과 오픈소스
빅데이터 저장관리 기술
- 하둡 분산파일시스템
- 하둡의 이해 및 구성요소
- HDFS(Hadoop Distributed File System)의 이해
- HDFS 동작방식
- 파일 시스템 API 활용
- No SQL
- HBase 분석 및 사용방법
- Cassandra 사용방법
빅데이터 병렬 처리 분석 기술
- MapReduce(대용량 분산/병렬 처리 프레임워크)
- Pig(데이터 흐름 기반의 스크립트 프로그래밍 언어)
- Hive & Pig 분석 사용법
- 스트리밍 컴퓨팅
- HBase(컬럼 구조의 저장소)
하둡 설치
- 하둡 Stand Alone 설치
- 가상 서버를 활용한 하둡 설치
- Hadoop Cluster 설치 절차 이해
MapReduce 프레임워크
- Hadoop Cluster 설치
- Hadoop 명령어 이해 및 HDFS 활용
- MapReduce 프로그래밍 이해
- MapReduce를 이용한 데이터 처리 실습
Hive / Pig활용
- Pig 소개 및 구조 이해
- Pig 설치 절차 이해 및 설치
- Hive 소개 및 구조 이해
- Hive 설치 절차 이해 및 설치
데이터 수집/저장
- Zookeeper 이해 및 설치
- HBase 설치 및 활용
- Sqoop 이해 및 설치
- Sqoop을 활용한 데이터 Import/Export
하둡 적용 사례
- 국내외 하둡 적용 사례