스터디 내용 정리
코드 이해:
- 주어진 코드 중 일부를 이해하는 데 어려움이 있었다.
- `names = [index for index, value in relevant_features.items()]`: 해당 코드 이해가 어려웠다.
- `px.pie(df, 'diagnosis', color='diagnosis',color_discrete_sequence=['#007500','#5CFF5C'],title='Data Distribution')`: 'diagnosis' 앞에 'names='가 생략되어 있는데, 이에 대한 이해도가 필요했다.
코드 해석:
- `names = [index for index, value in relevant_features.items()]`:
relevant_features.items()
바로전에 지정한 상관계수가 0.25보다 높은 속성들만 relevant_features함수에 할당을 한 후 items()를 통해
값들을 genertaor객체로 변환하여 순차적으로 나올 수 있게 한다.
value in relevant_features.items()
in을 사용하여 value 에 순차적으로 relevant_features의 각 값을 튜플 형태로 넣는다.
names = [index for index, value in relevant_features.items()]
names 라는 함수에 value의 첫번째 값인 속성의 이름들을 리스트 형태로 넣는다.
index for index
파이썬의 인덱스의 시작은 0이라서 value의 값의 0번째 즉 첫번째 값을 의미한다.
그래서 0을 의미하는 다른 함수를 만들어 넣어도 문제 없다.
Ex) a=0으로 지정한후 위 코드의 index 자리에 넣어도 문제 없이 작동한다.
- `px.pie(df, 'diagnosis', color='diagnosis',color_discrete_sequence['#007500','#5CFF5C'],title='Data Distribution')`:
원래는 'diagnosis'가 아닌 names= 'diagnosis' 가 정석이지만 'names=' 가 생략되었으며 데이터 프레임을 활용한 입력이고data_frame = pandas 데이터 프레임 (df)
values = 영역 별 갯수 또는 비율 리스트 (없음)
names = 영역 라벨 또는 이름 ('diagnosis')
이렇게 각 인풋이 다르다.
다음 스터디
날짜:2024년 5월 8일 (수요일)
진도:Model Implementation까지 공부 해오기
추가 사항:
- 다음 카페에 글올리는거 코드올리는거 보기 쉽게 pdf파일로 변환해서 올리기
- 앞으로 모든 알고리즘을 적용하는거 보다 몇개의 알고리즘을 선택해서 그 알고리즘을 공부 및 적용할 예정