ㄹ
리프트값(Lift)
- 두 항목 A와 B가 서로 독립일 때보다 얼마나 더 자주 함께 발생하는지를 나타내는 지표
- A와 B가 우연히 같이 나오는 게 아니라 실제로 연관이 있는지를 판단하는 값
ㅇ
유사도
- 두 객체(문서, 이미지, 사용자, 상품 등)가 서로 얼마나 비슷한지를 수치로 나타낸 값
ㅈ
점별 상호 정보량 PMI(Pointwise Mutual Information)
- 두 사건(또는 단어 등)이 함께 등장할 확률이, 각각 독립적으로 등장할 확률보다 얼마나 더 큰지를 측정하는 통계적 지표
- A와 B가 우연히 같이 나온 게 아니라, 실제로 연관이 있는지를 수치로 보여주는 지표
지지도(Support)
- 특정 항목 집합이 전체 거래(Transaction) 중 얼마나 자주 등장하는지 나타내는 비율 또는 횟수
ㅋ
콘텐트 기반 필터링
- 사용자가 과거에 선호했던 아이템의 특징을 분석하여 유사한 속성을 가진 다른 아이템을 추천하는 추천 알고리즘
- 어떤 내용의 아이템을 좋아하는지 나타내는 사용자 프로필과 아이템의 다양한 성질을 나타내는 특징을 추출한 아이템 특징과 일치도즉, 유사도를 계산함으로써 좋아할 만한 아이템을 사용자에게 추천하는 알고리즘.
클라우드 소싱(crowd sourcing)
- ‘군중(Crowd)’과 ‘아웃소싱(Outsourcing)’의 합성어로, 특정 작업이나 문제 해결을 불특정 다수의 사람들에게 공개적으로 의뢰하는 방식
ㅎ
확신도(Confidence)
- 어떤 항목 A가 주어졌을 때, 항목 B도 함께 나올 조건부 확률을 의미
협업 필터링
- 사용자들의 과거 행동(예: 평가, 구매, 클릭 등)을 기반으로 비슷한 취향을 가진 사용자끼리 서로 추천을 해주는 알고리즘
- 사용자/아이템 간 유사성을 계산하여 추천
- 사용자-사용자 기반 (User-User)
- 아이템-아이템 기반 (Item-Item)
- 잠재요인 기반(행렬 분해 방식: SVD, ALS 등)
A
A/B 테스트
- 웹사이트, 앱, 광고 등의 두 가지 버전(A와 B)을 사용자에게 나눠 보여주고, 어떤 버전이 더 좋은 성과를 내는지 실험적으로 비교하는 방법
ALS (Alternating Least Squares)
- 행렬 분해의 또 다른 방법으로, 사용자 행렬과 아이템 행렬을 번갈아가며 고정하고 갱신하는 방식
- 병렬 연산이 쉬워 대규모 추천 시스템에 적합
C
CBOW
- 주변에 있는 단어를 가지고 중간에 있는 단어들을 예측하는 방법
K
KGI(Key Goal Indicator)
- 조직이나 개인이 궁극적인 목표를 달성했는지를 판단하는 지표
KNN (K-Nearest Neighbors)
- 가장 가까운 K명의 이웃(유사한 사용자 또는 아이템)을 찾아 그들의 정보를 바탕으로 예측
- 보통 코사인 유사도, 피어슨 상관계수 등을 사용하여 유사도를 계산
KPI(Key Performance Indicator)
- 조직이나 개인이 목표를 얼마나 효과적으로 달성하고 있는지를 측정하기 위한 핵심 지표
S
Skip-Gram
- 중간에 있는 단어로 주변단어들을 예측하는 방법
SGD (Stochastic Gradient Descent, 확률적 경사 하강법)
- 행렬 분해 기반 협업 필터링에서 자주 사용되는 최적화 기법
- 평점 예측 오차를 줄이기 위해 사용자/아이템의 잠재요인을 학습
- 점진적으로 가중치를 갱신하여 모델을 훈련
W
Word2Vec
- 추천 시스템에서 아이템 간 관계를 벡터 공간에 임베딩하여 유사한 아이템을 추천하기 위해 활용되는 딥러닝 기반 임베딩 기법
- 단어(또는 아이템)를 벡터 공간에 임베딩해서, 비슷한 문맥에서 사용되는 단어(또는 아이템)끼리 가까운 벡터를 갖도록 학습
- CBOW, Skip-Gram