• Daum
  • |
  • 카페
  • |
  • 테이블
  • |
  • 메일
  • |
  • 카페앱 설치
 
카페정보
신세벌식 카페
 
 
 
 
 
카페 게시글
신세벌식 공동 개발 신세벌식 공동 개발안 분석 파일입니다. (16.04.05.)
신세기 추천 0 조회 170 16.03.25 10:28 댓글 8
게시글 본문내용
 
다음검색
첨부된 파일
댓글
  • 16.03.25 14:54

    첫댓글 감사합니다.
    분석 결과가 좋게 나왔네요.
    혹시 천만자모 데이터를 활용해 자모가 아닌 글자별 빈도를 볼 수 있을까요?
    빈도 높은 것으로 100 글자 정도라도
    인터넷에 단어 빈도는 나오는데 글자 빈도는 없네요

  • 작성자 16.03.25 15:46

    자모 빈도 분석은 팥알 님의 분석기를 이용한 것입니다. 그 분석기를 수정해본다면 글자별 빈도도 혹시 알 수 있지 않을지 싶습니다. 하지만 제가 프로그래머가 아니라서 어떻게 만져야 가능할지 막막합니다...

  • 16.03.25 15:48

    @신세기 그렇군요.. 세벌식 카페에 천만자모 글을 보고 신세기님이 만든 것인 줄 알았습니다.
    혹시 어떤 분께 부탁을 드려야 할지 알 수 있을까요?

  • 작성자 16.03.25 16:01

    @블롬달 저는 그 자료에 대해 표본을 모으고 분석기를 돌리는 작업을 했을 뿐이었습니다... 자모 빈도 분석기 자체는 팥알 님께서 만드신 것입니다. 바로 http://pat.im/854 여기에서 구하실 수 있는 분석기입니다.

  • 16.03.25 22:06

    블롬달 님이 바라시는 자료가 아마 이것일 것 같습니다.
    http://nlp.kookmin.ac.kr/data/syldown.html

    낱자 잦기 자료는 자주 보았지만, 낱내(글짜) 잦기 자료는 저도 처음 봅니다.
    낱내 잦기 분석 기능을 분석기에 넣는 것은 지금은 머리가 무거워서 나중으로 미루겠습니다.

  • 작성자 16.03.25 23:02

    @팥알 좋은 자료를 찾아주셔서 정말 감사드립니다, 팥알 님.

  • 16.03.26 01:14

    국립국어원의 현대 국어 사용 빈도 조사에서도 음절(글자)별 통계가 나와 있습니다. 상당히 유용한 자료라고 봅니다. 현대 국어 사용 빈도 조사는 신세기님께서도 예전에 언급하신 바가 있던 걸로 기억합니다.

  • 작성자 16.03.26 08:28

    @명랑소녀 제가 올려 드렸던 자료에서는 음절별 통계가 없었습니다. 하지만 국립국어원에 음절별 통계자료가 있나보군요. 한 번 찾아봐야겠네요. 알려주셔서 감사드립니다.

최신목록