2024년 9월 11일 수 오후 6시
인원: 박동채 외 19명
장소: 의양관 B07
불참인원: 진하(알바), 정민(병원)
<공지사항>
1. 릴레이 발표 순서
9/25: 재헌, 정훈
10/2: 동채, 정민
10/30: 철민, 태우
11/6: 철민, 도영
11/13: 철민, 시경
2. 2024 빅콘테스트 희망자 조사 ( http://www.bigcontest.or.kr/#Section2 )
- 주제
(1) 생성형 ai 분야: LLM활용 제주도 맛집 추천 대화형 AI 서비스 개발 => 동해 철민 주희 지선 / 연수 동채 시경 / 재헌 서희 민중 / 준엽 태우 정민 (3인 조는 공부에 포커스 잡아서 진행)
(2) 데이터분석 분야: OD 데이터 분석을 통한 활용방안 제시(OD 데이터 뭐 교통량 및 유동량 데이터 인듯) - 다경,채윤
(3) 데이터 활용 분야: 감염병, 공간융합, 부동산, 스마트팜, 연안 플랫폼, 자유 주제 - 동채(개인참여)
- 대회 일정
(1) 대회 시작(9.9)
(2) 결과물 제출 마감(10.25)
(3) 서류 심사(11.5~7)
(4) 발표 심사(11.19~21)
(5) 수상 대상자 발표(12.2)
(6) 시상식(12.10)
3. k-circle 수요조사 (결초보은 학부생 단톡 사진 참조)
철민,동채,서희,정훈,채윤 (미확정_추후 변경 가능)
교수님이 제공하실 주제: 경제 데이터 수집 및 분석
<발표>
민중: 정보처리 및 빅데이터 자격증 취득 과정 및 리뷰
ADsP, 정보처리기사(정처기), 빅데이터 분석기사(빅분기)를 준비했으며, 각 자격증의 준비 과정과 특징을 아래와 같이 정리함.
1. ADsP
ADsP는 빅데이터 기초 이해를 위한 자격증. 3~4주 정도 준비했으며, 기출문제와 유사하게 시험이 출제됨. 약 2주 정도 공부하면 자격증 취득이 가능할 것으로 판단됨.
다만, 데이터 분석에 대한 관심을 표현할 수 있는 정도의 자격증으로 큰 메리트를 가지긴 어려움.
2. 정보처리기사
정보처리기사는 IT의 기본적인 정보 시스템 이해 능력을 확인하는 자격증. 필기시험의 경우 1회차 시험을 목표로 준비하는 것이 유리하며, 문제은행 방식으로 CBT를 반복해서 풀면 쉽게 합격 가능함.
실기시험은 20문제 중 평균 9문제가 반복 출제되며, 파이썬 관련 문제는 1~2문제가 출제됨. 기출문제가 많이 나오는 경향이 있어 반복 학습이나 강의를 통해 대비하면 수월하게 합격할 수 있음.
3. 빅데이터 분석기사
빅분기는 ADsP와 유사한 내용을 다루지만, 난이도가 더 높음. 1년에 2회 실시되며, CBT가 아닌 PBT 방식으로 진행됨. 기출문제에서 겹치는 문제가 있긴 하지만 생소하고 세부적인 문제가 많이 출제되며, 관련 정보가 많지 않아 효율적으로 공부하기 어려움.
통계와 분석 기법에 대해 잘 알고 있다면 합격 가능성이 높음. 특히 데싸노트의 기법들이 시험 출제 범위에 포함되므로 참고하여 공부하는 것이 좋음.
지선: 데이터 통신과 네트워크 개념
정보처리기사 공부 중 생소한 용어들을 정리할 필요성을 느꼈고, 데이터 통신과 네트워크 개념을 정리함.
1. 데이터: 컴퓨터에서 데이터는 개념, 의사, 명령 등을 처리하기 적합한 형태로 숫자, 문자, 기호 등으로 표현된 것.
2. 프로토콜: 정보 송수신 측이나 네트워크 간 정보를 안전하게 주고받기 위한 사전 약속된 규약. TCP/IP는 미국 국방부에서 개발한 프로토콜로, 현재 인터넷에서 사용됨. TCP는 IP가 전달하는 데이터 패킷이 목적지에 정확하고 신뢰성 있게 도착하도록 보장하는 역할을 함.
3. 인터페이스: 같은 호스트 내 상·하위 계층 간 규칙을 의미하며, 사람과 시스템 간 의사소통을 위한 물리적 또는 가상적 매개체를 가리킴. (컴퓨터 화면, 키보드, 마우스 등)
4. IP 주소: IPv4 프로토콜을 사용 중이며, 32비트로 최대 43억 개의 주소를 생성할 수 있음.
5. 호스트 이름: 사용자가 호스트 이름으로 상위 계층 서비스를 요청하면, 해당 이름에 대한 IP 주소를 받아 네트워크 계층으로 전송함. (예: naver)
시경: 금융 예금 상품 가입 고객 예측
정기예금 가입자의 감소 추세와 마케팅 비용의 투자 효율성이 낮다는 문제로 금융 예금 상품 가입 고객 예측 분석을 진행함.
포르투갈 은행 기관의 마케팅 캠페인 데이터를 사용했으며, 결측치는 없지만 unknown 값이 존재함. 분석 결과 블루컬러 노동자의 정기예금 가입 비율이 높았고, 데이터의 대부분이 unknown이어서 신규 고객이 많을 것으로 추측함.
5, 6, 7, 8월에 가입 비율이 높았으며, 결혼 상태에 따른 가입률 차이도 존재함.
EDA 결과, 젊거나 노년층의 가입률이 높고 휴대전화로만 연락을 했으며, 집중적인 마케팅 기간 동안 가입이 많았음. 이전 마케팅 결과도 이번 캠페인에 영향을 미쳤음을 확인
모델링 결과 과적합이 발생했으며, 그 원인을 분석하고 보완할 계획임.