import pandas as pd ## "c:\data\emp.csv" 파일을 읽어와 emp 데이터프레임으로 저장 emp = pd.read_csv("c:\\data\\emp.csv")
emp.info() # 데이터프레임(emp)의 전체 정보(컬럼 타입, 결측값 등) 출력
# hiredate가 object(문자형,str)임
## 'hiredate' 컬럼을 날짜(datetime) 형식으로 변환 emp['hiredate'] = pd.to_datetime(emp['hiredate']) emp.info()
# hiredate가 datetime64(날짜형) 으로 변환된 것 확인
## 'hiredate' 시리즈에서 연도(year)만 추출하여 새로운 'h_year' 시리즈에 저장 emp['h_year'] = emp['hiredate'].dt.year
## 'h_year'를 인덱스(행), 'job'을 컬럼(열)로 설정하여 피벗 테이블 생성 ## 'sal' 값을 기준으로, 각 (h_year, job) 조합에 대해 급여 합계 계산 emp.pivot_table(columns='job', index='h_year', values='sal', aggfunc='sum')
## 문제의 SQL결과와 동일하게 출력하기 result = emp.pivot_table(columns='job', index='h_year', values='sal', aggfunc='sum') result = result.astype('Int64') # NaN을 유지하면서 소수점 이하를 제거하고 정수(Int64) 타입으로 변환
|