1. 분석 목적
이 데이터 세트는 포르투갈의 한 은행 기관의 직접 마케팅 캠페인과 관련이 있다. 그 마케팅 캠페인은 전화 통화를 기반으로 했다. 종종, 같은 고객에 대한 두 개 이상의 연락처가 필요했다. 상품(은행 정기예금) 가입 여부(또는 가입하지 않음)를 확인하기 위해 수행되었다. 분석의 목적은 고객이 정기예금(변수)에 가입할지 예측하는 분류 예측이다.
2. 데이터 셋 개요
두 가지 데이터 세트가 있다.
1) bank-full.csv는 날짜별로 정렬된 모든 예제를 포함한다(2008년 5월~2010년 11월).
2) bank.csv는 예제의 10%(4521)를 포함하며, bank-full.csv에서 무작위로 선택되었다.
3. 인스턴스 수
bank-full.csv의 경우 45211(bank.csv의 경우 4521)
4. 속성 수
16 + 출력 특성
5. 속성 정보
Input variables:
bank client data:
1 - age (numeric)
2 - job : type of job (categorical: "admin.","unknown","unemployed","management","housemaid","entrepreneur","student",
"blue-collar","self-employed","retired","technician","services")
3 - marital : marital status (categorical: "married","divorced","single"; note: "divorced" means divorced or widowed)
4 - education (categorical: "unknown","secondary","primary","tertiary")
5 - default: has credit in default? (binary: "yes","no")
6 - balance: average yearly balance, in euros (numeric)
7 - housing: has housing loan? (binary: "yes","no")
8 - loan: has personal loan? (binary: "yes","no")
related with the last contact of the current campaign:
9 - contact: contact communication type (categorical: "unknown","telephone","cellular")
10 - day: last contact day of the month (numeric)
11 - month: last contact month of year (categorical: "jan", "feb", "mar", …, "nov", "dec")
12 - duration: last contact duration, in seconds (numeric)
other attributes:
13 - campaign: number of contacts performed during this campaign and for this client (numeric, includes last contact)
14 - pdays: number of days that passed by after the client was last contacted from a previous campaign (numeric, -1 means client was not previously contacted)
15 - previous: number of contacts performed before this campaign and for this client (numeric)
16 - poutcome: outcome of the previous marketing campaign (categorical: "unknown","other","failure","success")
Output variable (desired target):
17 - y - has the client subscribed a term deposit? (binary: "yes","no")
Missing Attribute Values: None
6. 데이터 소스
[1] [Moro et al., 2011] S. Moro, R. Laureano and P. Cortez. Using Data Mining for Bank Direct Marketing: An Application of the CRISP-DM Methodology. In P. Novais et al. (Eds.), Proceedings of the European Simulation and Modelling Conference - ESM'2011, pp. 117-121, Guimarães, Portugal, October, 2011. EUROSIS.