빅데이터 R-HADOOP 실무과정
21세기의 가장 HOT한 JOB 데이터 과학자 현재 데이터 사이언티스트의 가장 기본적인 조건은 프로토타입을 개발할 수 있는 프로그램 스킬이다.
그리고 앞으로는 데이터를 이해관계자(stake holders)가 이해할 수 있도록 스토리텔링(데이터 시각화 등)을 할 수 있는 능력이 중요할 것이다.
데이터분석분야의 STAR 기술인 R과 하둡프로그래밍을 학습하고 R과 하둡을 결합한
R-HADOOP을 이용한 분석을 할 수 있도록 내용이 설계되었다.
◆ 교육개강 - 2월11일 ~ 3월12일
◆ 교육과정 - 빅데이터 R-HADOOP 실무과정 (10일 80시간)
- 재직자 직업능력 개발카드 지원 및 사업주(기업환급)적용혜택
◆ 교육강의시간 - 09:30~18:30
◆대 표 :02-6925-4760
◆사이트:http://oraclejava.co.kr/gspecedu/curri/currimaster.php?command=2533&lecture=6
교육목표
- 하둡을 설치하고 기본에서 고급 그리고 응용 프로그램밍까지 단계별로 직접 해보며 익힐 수있다.
- R 프로그래밍을 학습하고, 빅데이터에 R을 이용한 데이터분석 기법을 사용할 수 있다.
- 빅데이터로부터 의미를 찾아서 새로운 가치를 생성하고, 이를 시각화하는 기술을 습득할 수 있다
- 하둡 에코시스템을 이해하고, 하둡과 R을 이용한 분산처리 시스템을 구축할 수있다.
교육대상
- 기업 전산시스템 및 데이터 관리자
- 개발자, DBA, SE
- 빅데이터 관련 직무자 및 관심 대상자
- 빅데이터 통계분석처리 대상자
선수학습
- Java Programming 기초
- SQL기초
- Linux 기본 명령어
- 통계 기초
교육과정(커리큘럼 상세 내용은 해당 홈페이지 참조)
R-HADOOP
- 하둡 개요빅데이터란?
- 하둡 이해하기 하둡이란?
- HDFS 개요, MapReduce 프레임워크
- 하둡 다운로드 및 필요소프트웨어 설치
- 독자모드의사분산모드 설치와 확인
- 의사분산모드 설치와 확인
- WordCount 프로그램의 컴파일과 실행
- 자바MapReduce 프로그래밍맵클래스 다시살펴보기
- 입력 포멧의 역할 컴바이너 셔플링과 소팅
- 리듀스 클래스 자세히 보기출력 포멧 카운터
- WordCount 2프로그램
- TopN 프로그램
- CountTrigram 프로그램
- Join ID & Title 프로그램
- 고급 Map Reduce 프로그래밍 StringSort 프로그램
- 분산 캐시를 이용한 조인
- 역색인 만들기(Inverted Index 버전1)
- 역색인 만들기(Inverted Index 버전2)
- 역색인 만들기(Inverted Index 버전3)
- 검색엔진 색인 만들기 CreateESIndex
- 스트리밍 프로그래밍
- Pig 프로그래밍
- 아마존 elasticmapreduce ec2 s3
- 하둡에코시스템구성 HIVE
- 하둡에코시스템 활용 SQOOP
- 하둡에코시스템 활용 MAHOUT
- R 시작하기
- R basic
- Navigating the Software
- R프로그래밍 입력과 출력
- R 데이터구조
- R 데이터변형
- R그래픽스
- 데이터분석 WITH R
- RHADOOP&RHIPE
- RHADOOP
- RHIPE
- 데이터분석 WITH R&HADOOP