신세벌식 공동개발안 분석표.xlsx
신세벌식 공동 개발안 분석 파일입니다. 분석기는 소인배 님의 것(https://github.com/isty2e/typing-fatigue-analyzer)을 사용하였고, 표본은 한글 부분은 천만 자모 빈도 분석과 똑같은 표본을 사용하였습니다. 분석기 특성상 약어는 분석되지 않았습니다.
첫댓글 감사합니다.분석 결과가 좋게 나왔네요.혹시 천만자모 데이터를 활용해 자모가 아닌 글자별 빈도를 볼 수 있을까요?빈도 높은 것으로 100 글자 정도라도인터넷에 단어 빈도는 나오는데 글자 빈도는 없네요
자모 빈도 분석은 팥알 님의 분석기를 이용한 것입니다. 그 분석기를 수정해본다면 글자별 빈도도 혹시 알 수 있지 않을지 싶습니다. 하지만 제가 프로그래머가 아니라서 어떻게 만져야 가능할지 막막합니다...
@신세기 그렇군요.. 세벌식 카페에 천만자모 글을 보고 신세기님이 만든 것인 줄 알았습니다.혹시 어떤 분께 부탁을 드려야 할지 알 수 있을까요?
@블롬달 저는 그 자료에 대해 표본을 모으고 분석기를 돌리는 작업을 했을 뿐이었습니다... 자모 빈도 분석기 자체는 팥알 님께서 만드신 것입니다. 바로 http://pat.im/854 여기에서 구하실 수 있는 분석기입니다.
블롬달 님이 바라시는 자료가 아마 이것일 것 같습니다.http://nlp.kookmin.ac.kr/data/syldown.html낱자 잦기 자료는 자주 보았지만, 낱내(글짜) 잦기 자료는 저도 처음 봅니다.낱내 잦기 분석 기능을 분석기에 넣는 것은 지금은 머리가 무거워서 나중으로 미루겠습니다.
@팥알 좋은 자료를 찾아주셔서 정말 감사드립니다, 팥알 님.
국립국어원의 현대 국어 사용 빈도 조사에서도 음절(글자)별 통계가 나와 있습니다. 상당히 유용한 자료라고 봅니다. 현대 국어 사용 빈도 조사는 신세기님께서도 예전에 언급하신 바가 있던 걸로 기억합니다.
@명랑소녀 제가 올려 드렸던 자료에서는 음절별 통계가 없었습니다. 하지만 국립국어원에 음절별 통계자료가 있나보군요. 한 번 찾아봐야겠네요. 알려주셔서 감사드립니다.
첫댓글 감사합니다.
분석 결과가 좋게 나왔네요.
혹시 천만자모 데이터를 활용해 자모가 아닌 글자별 빈도를 볼 수 있을까요?
빈도 높은 것으로 100 글자 정도라도
인터넷에 단어 빈도는 나오는데 글자 빈도는 없네요
자모 빈도 분석은 팥알 님의 분석기를 이용한 것입니다. 그 분석기를 수정해본다면 글자별 빈도도 혹시 알 수 있지 않을지 싶습니다. 하지만 제가 프로그래머가 아니라서 어떻게 만져야 가능할지 막막합니다...
@신세기 그렇군요.. 세벌식 카페에 천만자모 글을 보고 신세기님이 만든 것인 줄 알았습니다.
혹시 어떤 분께 부탁을 드려야 할지 알 수 있을까요?
@블롬달 저는 그 자료에 대해 표본을 모으고 분석기를 돌리는 작업을 했을 뿐이었습니다... 자모 빈도 분석기 자체는 팥알 님께서 만드신 것입니다. 바로 http://pat.im/854 여기에서 구하실 수 있는 분석기입니다.
블롬달 님이 바라시는 자료가 아마 이것일 것 같습니다.
http://nlp.kookmin.ac.kr/data/syldown.html
낱자 잦기 자료는 자주 보았지만, 낱내(글짜) 잦기 자료는 저도 처음 봅니다.
낱내 잦기 분석 기능을 분석기에 넣는 것은 지금은 머리가 무거워서 나중으로 미루겠습니다.
@팥알 좋은 자료를 찾아주셔서 정말 감사드립니다, 팥알 님.
국립국어원의 현대 국어 사용 빈도 조사에서도 음절(글자)별 통계가 나와 있습니다. 상당히 유용한 자료라고 봅니다. 현대 국어 사용 빈도 조사는 신세기님께서도 예전에 언급하신 바가 있던 걸로 기억합니다.
@명랑소녀 제가 올려 드렸던 자료에서는 음절별 통계가 없었습니다. 하지만 국립국어원에 음절별 통계자료가 있나보군요. 한 번 찾아봐야겠네요. 알려주셔서 감사드립니다.