추천 시스템 용어 정리

ㄹ리프트값(Lift) - 두 항목 A와 B가 서로 독립일 때보다 얼마나 더 자주 함께 발생하는지를 나타내는 지표- A와 B가 우연히 같이 나오는 게 아니라 실제로 연관이 있는지를 판단하는 값 ㅇ유사도 - 두 객체(문서, 이미지, 사용자, 상품 등)가 서로 얼마나 비슷한지를 수치로 나타낸 값 ㅈ 점별 상호 정보량 PMI(Pointwise Mutual Information) - 두 사건(또는 단어 등)이 함께 등장할 확률이, 각각 독립적으로 등장할 확률보다 얼마나 더 큰지를 측정하는 통계적 지표- A와 B가 우연히 같이 나온 게 아니라, 실제로 연관이 있는지를 수치로 보여주는 지표  지지도(Support) - 특정 항목 집합이 전체 거래(Transaction) 중 얼마나 자주 등장하는지 나타내는 비율 또는 횟수 ㅋ콘텐트 기반 필터링 - 사용자가 과거에 선호했던 아이템의 특징을 분석하여 유사한 속성을 가진 다른 아이템을 추천하는 추천 알고리즘- 어떤 내용의 아이템을 좋아하는지 나타내는 사용자 프로필과 아이템의 다양한 성질을 나타내는 특징을 추출한 아이템 특징과 일치도즉, 유사도를 계산함으로써 좋아할 만한 아이템을 사용자에게 추천하는 알고리즘. 클라우드 소싱(crowd sourcing)- ‘군중(Crowd)’과 ‘아웃소싱(Outsourcing)’의 합성어로, 특정 작업이나 문제 해결을 불특정 다수의 사람들에게 공개적으로 의뢰하는 방식 ㅎ 확신도(Confidence) - 어떤 항목 A가 주어졌을 때, 항목 B도 함께 나올 조건부 확률을 의미 협업 필터링 - 사용자들의  과거 행동(예: 평가, 구매, 클릭 등)을 기반으로 비슷한 취향을 가진 사용자끼리 서로 추천을 해주는 알고리즘- 사용자/아이템 간 유사성을 계산하여 추천 - 사용자-사용자 기반 (User-User)- 아이템-아이템 기반 (Item-Item) - 잠재요인 기반(행렬 분해 방식: SVD, ALS 등)  AA/B 테스트 - 웹사이트, 앱, 광고 등의 두 가지 버전(A와 B)을 사용자에게 나눠 보여주고, 어떤 버전이 더 좋은 성과를 내는지 실험적으로 비교하는 방법  ALS (Alternating Least Squares) - 행렬 분해의 또 다른 방법으로, 사용자 행렬과 아이템 행렬을 번갈아가며 고정하고 갱신하는 방식 - 병렬 연산이 쉬워 대규모 추천 시스템에 적합 CCBOW- 주변에 있는 단어를 가지고 중간에 있는 단어들을 예측하는 방법  KKGI(Key Goal Indicator) - 조직이나 개인이 궁극적인 목표를 달성했는지를 판단하는 지표 KNN (K-Nearest Neighbors) - 가장 가까운 K명의 이웃(유사한 사용자 또는 아이템)을 찾아 그들의 정보를 바탕으로 예측 - 보통 코사인 유사도, 피어슨 상관계수 등을 사용하여 유사도를 계산  KPI(Key Performance Indicator) - 조직이나 개인이 목표를 얼마나 효과적으로 달성하고 있는지를 측정하기 위한 핵심 지표 SSkip-Gram- 중간에 있는 단어로 주변단어들을 예측하는 방법  SGD (Stochastic Gradient Descent, 확률적 경사 하강법) - 행렬 분해 기반 협업 필터링에서 자주 사용되는 최적화 기법 - 평점 예측 오차를 줄이기 위해 사용자/아이템의 잠재요인을 학습 - 점진적으로 가중치를 갱신하여 모델을 훈련  WWord2Vec- 추천 시스템에서 아이템 간 관계를 벡터 공간에 임베딩하여 유사한 아이템을 추천하기 위해 활용되는 딥러닝 기반 임베딩 기법- 단어(또는 아이템)를 벡터 공간에 임베딩해서, 비슷한 문맥에서 사용되는 단어(또는 아이템)끼리 가까운 벡터를 갖도록 학습- CBOW, Skip-Gram