파일은 csv 파일 불러왔고 그 안에 income, satisfy, schooling, region 등 변수가 한 열개정도 있는데요,,
1. 이 중에 region 값이 5인 것들만 그 개수를 알고싶은데, data2=data1[data1$region==5,] 이런식으로 따로 따로 지정하지 않고 처음 data1 에서 한번에 갯수 세는 방법이랑
2. 히스토그램 그리면 막대그래프로 나오는데 여기 추세선 넣는 법
3. income 변수 안에서 그 값이 1000~2000인 것들로 따로 데이터셋을 만드는 방법
조별과제 해야하는데 불행히도 10명 팀원중에 R 아는 사람이 하나도 없네요 ㅜㅜ
책 찾아가면서 해보고 있는데 이런 쉬운내용들은 책에도 안나와있고 부탁드릴게요~!
첫댓글 2는 제책 2.4에 있고요. hist(), lines(), density()를 같이 쓰면 됩니다.
1은 table()을 쓰면 되고, 3은 data1[1000<data1$income & data1$income<2000, ] 라고 하면 됩니다.
답변 감사합니다. 혹시 단일표본에서 모분산 검정하는거랑, 두 표본에서 모비율 차이가 있는지 검정하는 거랑 R에서 할 수 있나요? ?쳐서 찾아봐도 안보이네요...
두 표본 모비율 자치검정은 16장에 있습니다. 책이 없으시면 "R을 이용한 누구나 하는 통계분석"에서 16장에서 예제 코드가 있습니다. 단일표본에서 모분산 검정하는건 통계학 교과서에나 나오지 실제로는 테스트하는 경우를 본적이 없습니다. R에서 있는지 없는지도 모르겠습니다. 기초통계학책을 보고 손으로 해도 됩니다.