# 12.2.2 : 파일 불러오고, 데이터 확인하기
data <- read.csv("d1004.csv", fileEncoding = "EUC-KR")
str(data)
head(data, 2)
data$년월일 <- as.Date(paste(data$년,'-',data$월,'-', data$일, sep=""))
head(data, 2)
######## 슬라이드 99. 데이터 분석
# : 데이터 검색
a_dong = data[data$측정소명=='신암동', c('년월일', 'PM10', 'PM2.5')]
head(a_dong, 2)
# : 그룹별 검색
aggregate(PM10 ~ 측정소명, data, mean)
aggregate(PM10 ~ 월, data, mean)
monthly_avg <- aggregate(PM10~월, data, mean)
######## 슬라이드 102. 시각화
# : plot함수 - 꺽은선 그래프
plot(x = monthly_avg$월, y = monthly_avg$PM10,
type='o', main = '월별 미세먼지 평균',
xlab = '월(2018년)', ylab = '10마이크로이하', family = 'NanumGothic')
# : ggplot함수 - 막대그래프
dong_avg<-aggregate(PM10~측정소명, data, mean)
ggplot(dong_avg, aes(측정소명, PM10))+geom_bar(stat="identity")
# : ggplot함수 - 누적 막대그래프
dong_monthly_avg<-aggregate(PM10~월+측정소명, data, mean)
ggplot(dong_monthly_avg, aes(x=측정소명, y=PM10,
fill=월))+geom_bar(stat="identity")
# : ggplot함수 - 꺾은선 그래프
ggplot(dong_monthly_avg, aes(x=월, y=PM10,
group=factor(측정소명), color=측정소명, linetype=측정소명))+
geom_line(aes(linetype=측정소명))+
geom_point(shape='o', size=3)