개요
이 데이터 세트는 원래 국립 당뇨병 및 소화기 및 신장 질환 연구소(National Institute of Diabetes and Digestive and Kidney Diseases)에서 가져온 것이다. 데이터 세트의 목적은 데이터 세트에 포함된 특정 진단 측정값에 기초하여 환자의 당뇨병 유무를 진단적으로 예측하는 것이다. 더 큰 데이터베이스에서 이러한 인스턴스를 선택하는 데 몇 가지 제약이 있었다. 특히, 여기 있는 모든 환자는 적어도 21세의 피마 인도(Pima Indian) 혈통의 여성이다.
속성
데이터 세트는 여러 의학적 예측 변수와 하나의 목표 변수인 결과(Outcome)로 구성되어 있다. 예측 변수에는 환자가 임신한 횟수( pregnancies), BMI, 인슐린 수치(insulin le
vel), 나이(age) 등이 포함된다.
인용
Smith, J.W., Everhart, J.E., Dickson, W.C., Knowler, W.C., & Johannes, R.S. (1988). Using the ADAP learning algorithm to forecast the onset of diabetes mellitus. In Proceedings of the Symposium on Computer Applications and Medical Care (pp. 261--265). IEEE Computer Society Press.
문제
데이터 세트의 환자의 당뇨병 유무를 정확하게 예측하기 위한 기계 학습 모델을 구축할 수 있습니까?