t-score나 카이제곱 검정 등은 모두 키워드를 추출할 때 사용되는 것으로 알고 있습니다.
동영상에서 보면 collocation에서 look이라는 단어를 기준으로 공기어의 t-score를 보여주고 있는데
특정 단어와 연어 관계에 있는 공기어의 t-score가 아닌
문서 전체에서 각각의 모든 단어의 t-score를 계산하는 방법이 있나요?
첫댓글 음.. 글쎄요. 원하시는 계산방법이 어떤 연구를 위한 것인지 여쭤봐도 될까요? 말씀하신 대로 t-score나 카이제곱 검정은 키워드추출 시 이 단어가 전체 텍스트 대비 또는 비교기준 코퍼스 대비 어떤 빈도나 위치값을 가지는가를 보기 위해 사용하는데요, 말씀하신 방법은 비교대상을 지정하지 않고 전체를 비교하는 방법을 찾으시는 것 같아서요.
첫댓글 음.. 글쎄요. 원하시는 계산방법이 어떤 연구를 위한 것인지 여쭤봐도 될까요? 말씀하신 대로 t-score나 카이제곱 검정은 키워드추출 시 이 단어가 전체 텍스트 대비 또는 비교기준 코퍼스 대비 어떤 빈도나 위치값을 가지는가를 보기 위해 사용하는데요, 말씀하신 방법은 비교대상을 지정하지 않고 전체를 비교하는 방법을 찾으시는 것 같아서요.