[국기교육][교육비 100% 무료]빅데이터 플랫폼 구축과 분석을 활용한 빅데이터 전문가 양성과정
본 과정은 NCS 국가직무능력표준 4 수준의 양성과정으로 빅데이터 플랫폼 구축 및 프로그래밍 언어를 바탕으로 한 빅데이터 분석, 기계학습까지 학습할 수 있다.
그 외 실습 및 과제, 팀 프로젝트 등을 통해 본인의 성취도를 파악하며 수료 후 다양한 개발환경에서도 수행할 수 있는 개발자로 양성될 수 있다.
1. NCS(국가직무능력표준)의 훈련내용을 반영한 교과편성
2. 성취도가 낮은 학생에 따른 내부 교강사의 보충학습 편성
3. 실무 개발경력이 많은 강사의 운영으로 실제 현장에서 필요로 하는 내용을 학습
4. SW 개발회사 자체 운영을 통한 모의 면접 및 현장전문가 초청 특강 진행
5. 자체 취업 지원 시스템 구축 및 취업지원 활성화
교육과정 목표
* 빅데이터를 수집 저장 처리하고, 플랫폼을 개발 분석하여 의미 있는 결과를 제공할 수 있다.
- 다양한 형식의 대용량 데이터를 수집, 저장, 처리, 분석, 활용하기 위한, 인프라, 인터페이스 및 솔루션을 개발하고 적용할 수 있다.
- 대용량의 데이터 집합으로부터 유용한 정보를 찾고 결과를 예측하기 위해 목적에 따라 분석기술과 방법론을 기반으로 정형/비정형 대용량 데이터를 구축, 탐색, 분석하고 시각화를 수행할 수 있다.
- 응용소프트웨어 개발에 사용되는 프로그래밍 언어의 기초문법을 적용하고 언어의 특징과 라이브러리를 활용하여 기본 응용소프트웨어를 구현할 수 있다.
- 응용소프트웨어개발을 위하여 운영체제, 데이터베이스, 네트워크의 기초 기술을 적용하고 응용개발에 필요한 환경을 구축할 수 있다.
- 딥러닝 알고리즘의 원리를 깊숙이 이해하고 구현할 수 있다.
◆ 교육개강 - 평일반:2월17일~7월15일
◆ 교육과정 - 머신러닝&딥러닝 기반 빅데이터 분석전문가 양성과정
- 실업자카드 전액지원 (훈련수당 매월416,000원 지원)
◆ 교육강의시간 -주중반:09:30~18:30 (105일 총840h)
◆대 표 :02-6925-4760
홈페이지 바로가기 :http://oraclejava.co.kr/edu2_gspec/edutrng/trng_master.php?command=3312&lecture=11&lp_type=Y
머신러닝&딥러닝 기반 빅데이터 분석전문가 양성과정 [커리큘럼 자세한 내용은 홈페이지 참조]
NCS 직업기초능력
- 의사소통능력
- 정보능력
빅데이터 기초
- 빅데이터의 개념 및 기초지식
- 데이터 수집 계획 수립하기
- 빅데이터 수집 시스템 구성하기
- 내부 데이터 수집하기
- 외부 데이터 수집하기
- 데이터 변환하기
- 수집 데이터 검증하기
빅데이터 Hadoop
- 하둡 개요빅데이터란?
- 하둡 이해하기 하둡이란?
- HDFS 개요, MapReduce 프레임워크
- 하둡 다운로드 및 필요소프트웨어 설치
- 독자모드의사분산모드 설치와 확인
- 의사분산모드 설치와 확인
- WordCount 프로그램의 컴파일과 실행
- 자바MapReduce 프로그래밍맵클래스 다시살펴보기
- 입력 포멧의 역할 컴바이너 셔플링과 소팅
- 리듀스 클래스 자세히 보기출력 포멧 카운터
- WordCount 2프로그램
- TopN 프로그램
- CountTrigram 프로그램
- Join ID & Title 프로그램
- 고급 Map Reduce 프로그래밍 StringSort 프로그램
- 분산 캐시를 이용한 조인
- 역색인 만들기(Inverted Index 버전1)
- 역색인 만들기(Inverted Index 버전2)
- 역색인 만들기(Inverted Index 버전3)
- 검색엔진 색인 만들기 CreateESIndex
- 스트리밍 프로그래밍
- Pig 프로그래밍
- 아마존 elasticmapreduce ec2 s3
- 하둡에코시스템구성 HIVE
- 하둡에코시스템 활용 SQOOP
- 하둡에코시스템 활용 MAHOUT
Spark
- 아파치 스파크 개요
- 스파크 소개
- 스파크 설치 및 환경설정
- 개발 환경 구축
- 스파크컨텍스트 생성
- RDD 프로그래밍
- RDD 생성
- RDD 액션
- 클러스터 환경
- 스탠드얼론 클러스터
- Apache Mesos
- 스파크 SQL
- 스파크 SQL을 이용한 데이터 처리
- 스파크 스트리밍 데이터 처리
- 스파크 스트리밍 데이터 읽기
- 데이터의 저장
- MLlib
- MLlib API
- 데이터 타입
- MLlib 데이터 처리
- 알고리즘
파이썬
- Python 인스톨
- 숫자
- 스트링
- 리스트
- If elif else
- For
- 범위와 While
- 주석과 Break
- Continue
- Function
- Return Value
- 매개변수의 기본값
- 변수의 스코프
- 키워드 매개변수
- 플렉서블한 매개변수의 개수
- 언패킹 매개변수
- 딕셔너리
- 모듈
- 웹에서 이미지 다운로드하기
- 파일 읽고 쓰기
- 웹에서 파일 다운로드 하기
- 웹크롤러 작성하기
- 예외 처리 하기
- 클래스와 객체
- 초기화(init)
- 클래스와 인스턴스 변수의 차이점
- 상속
- 다중 상속
- 스레딩
- 단어 빈도 카운터
- Zip
- 람다
- 딕셔너리 Max, Min, Sorting
- 이미지 자르기
- 이미지 합치기
- Struct
- Map
- 비트 연산자
- 딕셔너리 계산
Python 데이터 분석
* Pandas
- Series
- DataFrame
- 기본함수 익히기
* 텍스트 데이터 수집 및 정리
- 데이터 수집(requests, Ixml)
- 데이터 다듬기(포맷 통일, 빈값 채우기)
* 데이터정제
- Index
- Merge
- Join
- Concatenate
- GroupBy
* 위치정보 데이터 분석
- 위치 정보 데이터 다루기
* Pandas 고급
- Time Series
- 원격 데이터 접근(내장 API들)
- 다양한 I/O 처리 옵션
* 파이썬시각화
- 라이브러리를 활용한 파이썬 데이터 시각화
ML(Machine Learning
- 머신러닝(기계학습)
- 기본 알고리즘 개념 및 소개
- 나이브 베이즈 분류
- 의사결정나무
- 랜던포레스트
- 회귀분석
- 은닉마코브모형
- 서포트 백터 머신
- 주성분 분석
- K평균
- 연관성 분석
- 인공신경망(ANN, Articial Neural Network)
딥러닝
- 시작하기 위한 준비 및 간단한 딥러닝 소개
- 로지스틱 회귀분석 및 Tensorflow 에서 구현
- 다중회귀분석 및 Tensorflow 에서 구현
- MINIST 데이터 소개 및 준비
- Tensorflow에서 로지스틱/다중회귀분석을 이용한 MINIST 문자분류 실습
- 인공신경망(Neural Net) - 소개 및 XOR 문제 Tensorflow 에서 구현
- Deep Neural Net 소개 및 Tensorflow에서 구현
- 여러 종류의 활성화 함수 소개 및 Tensorflow에서 구현
- Tensorflow에서 NN/DNN을 이용한 MINIST 문자분류 실습
- Convolutional Neural Network(CNN) 소개 및 Tensorflow 구현
- Tensorflow에서 CNN을 이용한 MINIST 문자분류 실습 및 기존 방법들과 비교
- Recurrent Neural Network(RNN) 소개 및 Tensorflow 구현
- Word2Vec 소개 및 Tensorflow에서 구현
- 구글 Inception 모델을 이용한 이미지 인식Tensorflow 에서 구현
최종 프로젝트
: 프로젝트 주제 선정
: 기술 아키텍처 정의
: 요구 사항 정의
: 기본설계, 논리모델/물리모델 설계
: 화면 정의서 작성, ERD 작성,
: 클래스다이어그램,시퀀스다이어그램작성
: JSP, Java Framework을 이용한 코딩
: CVS 설정(공동개발)
: Ant를 이용한 빌드, 개발기/운영기 Setting
: 개발된 소스 코드 디버깅 오류 수정
: 프로젝트 발표 (구현기술, UML모델링, 발전방향, 구현기능 등)
교육소개
출강교육 과목 제공데이터베이스 구현 | 파이썬 프로그래밍 | 파이썬 데이터 분석 및 시각화 |
ML(Machine Learning) | DL(Deep Learning) | 빅데이터 기반 실무 프로젝트 |
4차 산업혁명 시대는 모든 데이터를 인공지능이 분석, 처리하는 시대로 아날로그의 완전한 디지털화, 인공지능화를 의미합니다.
따라서 개인비서 로봇이 자율 주행 택시를 예약하고 도착시간과 일기예보를 정확히 알려주는 현실을 곧 마주하게 될 것입니다.
이런 4차 혁명시대에서 빅데이터 시장규모는 거대화되었으며 전 산업분야에서 데이터의 관리와 분석, 그리고 변환 활용은
큰 핵심 과제가 되었습니다.나아가 인공지능, 머신러닝, 딥러닝은 바둑, 의료, 자동차 등 이미 다양한 분야에서 혁신적인 성과를
보여주고 있어 더 이상 미룰 수 없는 기업 목표가 되고 있습니다.
이에 데이터간의 상호작용을 분석하고 미분류 데이터 관리 능력 등을 통해 정확한 관련 결과를 도출할 수 있는 데이터 분석 교육 및 수집된 데이터를 기반으로 머신러닝과 딥러닝을 원활하게 사용할 수 있는 실무 교육을 통한 빅데이터 분석 전문가 인력 양성을 목표로 본 교육과정을 편성하였습니다.
본원에서 진행하는 “빅데이터 플랫폼 구축과 분석을 활용한 빅데이터 전문가 양성과정” 은 미래 산업에서 가장 각광받는 빅데이터를 위해 플랫폼 구축 및 분석을 학습하는 과정입니다. Hadoop과 Spark를 활용하여 플랫폼을 구축하고 데이터 전처리를 학습하며 이를 바탕으로 데이터 분석 및 시각화, 기계학습까지 학습할 수 있습니다. 또한 실무에서 사용되는 다양한 실습 데이터를 바탕으로 최종 프로젝트를 진행하여 빅데이터 전문가로 거듭날 수 있습니다.