• Daum
  • |
  • 카페
  • |
  • 테이블
  • |
  • 메일
  • |
  • 카페앱 설치
 
카페정보
LEXIPIA
 
 
 
카페 게시글
Q & A 교수님 Multi word units도 type token ratio 계산해도 될까요?^^
Yenny Kwon 추천 1 조회 129 21.04.01 17:28 댓글 3
게시글 본문내용
 
다음검색
댓글
  • 21.04.01 20:54

    첫댓글 TTR은 그렇게 구함되는데 문제는 연어다양성이고 빈도수는 보통 normalization 하면됩니다 보통 per million으로 환산해요 데이터 사이즈가 1000단어고 연어 빈도가 20이라면 1000:20=1000000:? 식으로 이십 곱하기 백만을 천으로 나눔 per million이 계산됩니다 나름 그런 분석 프로그램으로는 세계 최대에 최초인데 많이 저평가되어 있어서 아픈 손가락같은 연구물입니다 써줘서 감사하죠

  • 21.04.01 21:05

    거기 탑재된 연어목록에서 선별기준 척도를 만들어 idiomatic expression만 골라 목록을 만들어도 좋은 연구가 될겁니다 등급별 %가 idiomatic한지 저도 궁금하네요

  • 작성자 21.04.02 07:42

    교수님 빠른 답변 정말 감사합니다! 콜로그램 개발하시면서 엄청 많은 시간투자와 수고가 있으셨을 것 같습니다. 조만간 더 알려지게 되면, 널리 사용되는 연어분석 툴이 될 것 같습니다. 교수님 좋은 프로그램 개발해주셔서 진심으로 감사합니다. 교수님 말씀하신 내용 하나씩 살펴보면서 더 공부하겠습니다. 좋은 주말 되세요! :D

최신목록