'빅데이터 분석'에 대해 잘 모르다보니,
그냥 옵션 정도로 생각되거나
경영학 또는 통계학의 일부분에 지나지 않는 것으로 여겨져요.
구체적인 세부 기술들을 공부하기 전에
전체적인 큰 틀을 먼저 잡고 싶어서 질문 올립니다.
- - - - - - - - - - - - - - - - - - - - -
<빅데이터 분석>과 <통계 분석>의 차이점이 뭔가요?
그냥 단순하게
'대용량 데이터로 통계분석을 하는 것이 빅데이터 분석이다'라고
이해하면 안 될 것 같은데...
이 차이점을 정확히 알아야
어떤 단계에서 어떤 프로그램을 집중적으로 사용할지
(파이썬, R, ...) 정할 수 있을거 같습니다.
첫댓글 애매합니다. 빅테이터는 통계분석에 속한다고 볼수있습니다. 그러나 일반적으로 통계분석이라고 하면 모집단에서 random sample을 가정합니다. 그래서 뽑힌 표본이 모집단에서 잘 뽑아서 그 표본에서 발견한 사실로 모집단 전체의 성질을 유추할수 있다고 생각합니다. 즉 대통령후보 여론조사를 했다면 그 표본에서의 여론조사 지지율로 (모집단, 즉 실제 유권자전체에서) 어떤 후보가 앞서고 있다는걸 유출할수 있겠죠.
그런데 빅테이터는 이런 개념이 아닙니다. amazon이나 twitter같은 데이터는 모집단을 대표하는 표본이 아닙니다. 그냥 마구잡이로 존재하는 데이터입니다. 이런 데이터에서 정보를 얻으려는게 빅테이터분석입니다.
답변 감사합니다 ^^
저도 어디에서 들은 이야기이지만 빅데이터를 정의하기를 데이터베이스화 할수 없는 불특정한 모든 데이터라고 정의 하시더라구요? 가장 근접한 용어라고 생각했습니다. 존재하는 모든 데이터라는 표현도 근접해 보입니다.