첫댓글TTR은 그렇게 구함되는데 문제는 연어다양성이고 빈도수는 보통 normalization 하면됩니다 보통 per million으로 환산해요 데이터 사이즈가 1000단어고 연어 빈도가 20이라면 1000:20=1000000:? 식으로 이십 곱하기 백만을 천으로 나눔 per million이 계산됩니다 나름 그런 분석 프로그램으로는 세계 최대에 최초인데 많이 저평가되어 있어서 아픈 손가락같은 연구물입니다 써줘서 감사하죠
교수님 빠른 답변 정말 감사합니다! 콜로그램 개발하시면서 엄청 많은 시간투자와 수고가 있으셨을 것 같습니다. 조만간 더 알려지게 되면, 널리 사용되는 연어분석 툴이 될 것 같습니다. 교수님 좋은 프로그램 개발해주셔서 진심으로 감사합니다. 교수님 말씀하신 내용 하나씩 살펴보면서 더 공부하겠습니다. 좋은 주말 되세요! :D
첫댓글 TTR은 그렇게 구함되는데 문제는 연어다양성이고 빈도수는 보통 normalization 하면됩니다 보통 per million으로 환산해요 데이터 사이즈가 1000단어고 연어 빈도가 20이라면 1000:20=1000000:? 식으로 이십 곱하기 백만을 천으로 나눔 per million이 계산됩니다 나름 그런 분석 프로그램으로는 세계 최대에 최초인데 많이 저평가되어 있어서 아픈 손가락같은 연구물입니다 써줘서 감사하죠
거기 탑재된 연어목록에서 선별기준 척도를 만들어 idiomatic expression만 골라 목록을 만들어도 좋은 연구가 될겁니다 등급별 %가 idiomatic한지 저도 궁금하네요
교수님 빠른 답변 정말 감사합니다! 콜로그램 개발하시면서 엄청 많은 시간투자와 수고가 있으셨을 것 같습니다. 조만간 더 알려지게 되면, 널리 사용되는 연어분석 툴이 될 것 같습니다. 교수님 좋은 프로그램 개발해주셔서 진심으로 감사합니다. 교수님 말씀하신 내용 하나씩 살펴보면서 더 공부하겠습니다. 좋은 주말 되세요! :D