R을 활용한 데이터분석 & 시각화 실습과정
빅데이터의 활용은 데이터추출, 데이터저장, 데이터분석, 분석결과의 시각화, 미래행동의 예측, 결과의 적용으로 이루어진다.
본 과정은 ‘빅데이터분석 도구로서 R을 활용한 실습 및 데이터 분석을 다루고 있으며, R을 활용해 실제 분석을 해본다.
R Programming 기초부터 시각화,통계 데이터마이닝, 텍스트마이닝과 워드클라우드, 시각화 등을 다루고 있으며 통계학 활용 및 실전사례 분석,활용“등 습득할수 있다.
통계 또는 프로그래밍을 처음 접하시는 분들도 참여가 가능하며, 기본적인 이론을 포함하고 있다.
◆ 교육개강 - 7월19일 ~8월14일
◆ 교육과정 - R을 활용한 데이터분석 & 시각화 실습과정 (12일 24시간)
◆ 교육강의시간 - 20:00~22:00
◆대 표 :02-6925-4760
◆사이트:http://oraclejava.co.kr/gspecedu/curri/currimaster.php?command=2684&lecture=12
교육목표
- 빅데이터분석 도구 R을 활용 한 기초부터 실습 및 데이터 분석을 할 수 있다.
- R을 활용해 실제 분석처리를 할 수 있다.
- 시각화,통계 데이터마이닝, 텍스트마이닝 워드클라우드, 시각화 등을 배울수 있다.
- 통계학 활용 및 실전사례 분석,활용“등 습득할수 있다.
교육대상
- R을 이용해 분석 업무자
- 개발자, DBA, SE
- 빅데이터 관련 직무자 및 관심 대상자
- 빅데이터 통계분석처리 대상자
선수학습
- Java Programming 기초
- SQL기초
- Linux 기본 명령어
- 통계 기초
교육과정(커리큘럼 상세 내용은 해당 홈페이지 참조)
R programming 기초
- R 설치 및 실행, RStudio
- 다양한 유형의 데이터처리(벡터, 매트릭스 etc)
- 엑셀에서 데이터 임포트
- Square Braket과 논리문으로 작업하기
- R의 작업디렉토리 설정하기
- Reproducible Research
- 패키지 설치하기
- R Studio 커스터마이징
시각화(Visualization)
- 바/파이 차트 작성
- BoxPlot
- Histogram
- Stack Bar Chart
- Scatterplot
통계
- 평균, 표준편차, 분산 구하기
- 이항분포
- 프아송 분포
- 정규 분포
- t 분포
고급 통계와 데이터마이닝
- 분산분석
- 시계열분석
- 군집분석
R패키지 활용:텍스트 마이닝과 워드클라우드
- 텍스트 마이닝(Text Mining)
- 워드클라우드(Word Cloud)
데이터마이닝 활용 실전 사례분석
- 배송 서비스 고객의 군집 분석
- 패키지 추천 상품의 연관성 분석
- 구인구직 특성 분석
- 고객 이탈 여부 예측 분석
- 텍스트 마이닝 실전 사례