명랑소녀 님께서 요청하신 분석 자료를 올려드립니다.
분석 프로그램을 만들어주신 팥알 님께 감사드립니다.
소인배 님의 표본에 각종 인터넷 커뮤니티 글들, 블로그, 뉴스, 법전 일부, 국회 회의록, 세종 말뭉치를 합쳐서 만든 표본을 날개셋 타자연습과 팥알 님의 한글 타자 행동 분석기로 분석해 본 결과입니다.
낱자 결합 통계는 아래에 텍스트로 복잡하게 표시되어 있으므로 표로 정리되어 있는 첨부파일을 참고해주세요.
표준 두벌식으로 쳤을 때
글쇠 누름 횟수: 11050776타 (윗글쇠 합해서 11283423)
윗글쇠 누름 횟수: 232647타
같은 손가락 연타: 1484372타 (그중 정확한 연타 525395)
검지 4778241(42.3%), 중지 2957745(26.2%), 약지 2454208(21.8%), 소지 1093229(9.7%)
4단 0(0.0%), 3단 3150876(27.9%), 2단 6615957(58.6%), 1단 1516590(13.4%)
세벌식 391 로 쳤을 때
글쇠 누름 횟수: 10917312타 (윗글쇠 합해서 11004581)
윗글쇠 누름 횟수: 87269타
같은 손가락 연타: 296921타 (그중 정확한 연타 70817)
검지 5940133(54.0%), 중지 2134368(19.4%), 약지 1894375(17.2%), 소지 1035705(9.4%)
4단 484506(4.4%), 3단 2449977(22.3%), 2단 5911441(53.7%), 1단 2158657(19.6%)
표본 크기 11349917 bytes
한글 낱내 : 4391748
(첫소리: 4391729, 가운뎃소리: 4391713, 끝소리: 1961779)
숫자: 137384
기호: 495558
Enter : 116024
Space : 1547368
첫소리 빈도: 4391729
ㄱ: 565204 (12.87%)
ㄲ: 31506 (0.72%)
ㄴ: 301822 (6.87%)
ㄷ: 390639 (8.89%)
ㄸ: 41575 (0.95%)
ㄹ: 305552 (6.96%)
ㅁ: 215362 (4.90%)
ㅂ: 181683 (4.14%)
ㅃ: 7777 (0.18%)
ㅅ: 363011 (8.27%)
ㅆ: 14452 (0.33%)
ㅇ: 1058109 (24.09%)
ㅈ: 374228 (8.52%)
ㅉ: 9295 (0.21%)
ㅊ: 92052 (2.10%)
ㅋ: 24074 (0.55%)
ㅌ: 51848 (1.18%)
ㅍ: 47532 (1.08%)
ㅎ: 316008 (7.20%)
가운뎃소리: 4391713
ㅏ: 969215 (22.07%)
ㅐ: 187609 (4.27%)
ㅑ: 30549 (0.70%)
ㅒ: 834 (0.02%)
ㅓ: 469556 (10.69%)
ㅔ: 204948 (4.67%)
ㅕ: 204308 (4.65%)
ㅖ: 19007 (0.43%)
ㅗ: 432154 (9.84%)
ㅘ: 69524 (1.58%)
ㅙ: 4126 (0.09%)
ㅚ: 44876 (1.02%)
ㅛ: 39988 (0.91%)
ㅜ: 288236 (6.56%)
ㅝ: 28049 (0.64%)
ㅞ: 1498 (0.03%)
ㅟ: 24018 (0.55%)
ㅠ: 25209 (0.57%)
ㅡ: 580885 (13.23%)
ㅢ: 94299 (2.15%)
ㅣ: 672825 (15.32%)
끝소리: 1961779
ㄱ: 188464 (9.61%)
ㄲ: 3315 (0.17%)
ㄳ: 185 (0.01%)
ㄴ: 649998 (33.13%)
ㄵ: 1754 (0.09%)
ㄶ: 14107 (0.72%)
ㄷ: 10002 (0.51%)
ㄹ: 376302 (19.18%)
ㄺ: 3191 (0.16%)
ㄻ: 1717 (0.09%)
ㄼ: 1025 (0.05%)
ㄽ: 9 (0.00%)
ㄾ: 56 (0.00%)
ㄿ: 25 (0.00%)
ㅀ: 2032 (0.10%)
ㅁ: 123473 (6.29%)
ㅂ: 64722 (3.30%)
ㅄ: 15064 (0.77%)
ㅅ: 62727 (3.20%)
ㅆ: 105141 (5.36%)
ㅇ: 290943 (14.83%)
ㅈ: 7791 (0.40%)
ㅊ: 5137 (0.26%)
ㅋ: 232 (0.01%)
ㅌ: 12968 (0.66%)
ㅍ: 7825 (0.40%)
ㅎ: 13574 (0.69%)
숫자 : 137384
0:19805 1:26618 2:19549 3:15463 4:10762 5:11324 6:7906 7:7871 8:7831 9:10255
기호 : 495558
` : 248
~ : 469
! : 3528
@ : 70
# : 140
$ : 23
% : 734
^ : 25
& : 83
* : 149
( : 16523
) : 17066
- : 5428
_ : 98
= : 1723
+ : 223
[ : 3107
] : 3104
{ : 23
} : 23
\ : 81
| : 281
; : 97
: : 3871
' : 13608
" : 16328
, : 49533
. : 138143
< : 68091
> : 68155
/ : 36476
? : 14196
· : 7399
… : 4608
〃 : 10
― : 957
‘ : 1317
’ : 1301
“ : 4822
” : 6014
※ : 9
〈 : 152
〉 : 154
《 : 42
》 : 42
「 : 1496
」 : 1495
『 : 1427
』 : 1429
【 : 9
】 : 9
± : 0
× : 410
÷ : 0
≠ : 1
° : 0
′ : 1
″ : 0
℃ : 27
℉ : 0
™ : 0
○ : 494
□ : 3
△ : 6
▽ : 0
◁ : 0
▷ : 0
→ : 229
← : 3
↑ : 4
↓ : 0
↔ : 0
☆ : 22
♡ : 2
☎ : 6
☜ : 0
☞ : 9
¥ : 0
€ : 0
?(r+○) : 0
? : 2
ⓒ : 0
낱자 결합 통계 (첨부 파일 참고)
낱자 결합 통계.xlsx
첫댓글 자료 감사합니다. 신세기 님이 쓰신 말뭉치에는 돐이 9번 나오나 보군요 ㅎㅎ
지금 세어 보니 정말 돐이 9개로군요 ^^; 그 외에는 ㄽ을 쓰는 글자가 없었습니다. 돐도 요즘은 돌로 많이 쓰이고 있으니 점점 ㄽ도 옛한글처럼 되는 것 같습니다...;
@신세기 ㄽ의 쓰임은 돐에선 돌로 바뀌었고
곬(한쪽으로 트여 나가는 방향이나 길.)
옰(일을 잘못한 것에 대한 갚음.)
등에서 쓰입니다.
https://namu.wiki/w/%E3%84%BD
위 말뭉치에 곬이나 옰은 존재하지 않나 보네요.
'옰'은 그렇다 치더라도 '외곬'이란 단어는 현대한글에서도 간혹 쓰일텐데 말이죠.
@메탈리쟈 네... 아무래도 표본의 크기상 곬과 옰은 포함되지 않은 것 같습니다. 천만 자모 내에서는 포함되지 않았고, 일억 자모로 표본을 늘리면 포함되지 않을까 싶습니다...
올려 주셔서 고맙습니다.
저는 새로 들어간 첫소리-끝소리 이음새 잦기가 필요했는데, 이 자료를 앞으로 많이 인용할지도 모르겠습니다.^^
아마 초성 입력 후 시프트를 치는 문제와 관련 있겠지요? 저도, 시프트는 아니지만 오른손에서 종성 시프트를 처리하게 하고 있기 때문에 첫-끝 조합이 궁금했던 것이었습니다. 아마 초성ㄹ이 종성 시프트와 같이 쓰이는 경우는 무릎, 오지랖의 경우밖에는 없는 것 같습니다. ㄹ의 높은 빈도에 비하면 신기한 일이죠. 저 스스로는, ㄹ과 ㅁ의 현재 위치는, 예전에는 ㄹ 자리에 ㅅ이 있었다는 점 등으로 보면 다소 우연에 가깝다고 생각하긴 합니다. 어쨌든 ㄹ-ㅁ의 차이는 ㅐ-ㅓ 차이에 비하면 그리 심각하지 않고요. 꼭 공세벌식을 건드려야만 한다면 저 같으면 차라리 ㅊ와 ㄹ를 맞바꿀 것 같습니다.
감사합니다. 제 글을 인용해 주시는 건 언제나 환영입니다. 오늘 하루도 좋은 하루 되세요 ^^