2012. 1. 18. 수요일
멀더요원
[주의!]
이 글에는 총수가 언급하지 않았으면…하는 인물에 관한 내용이 포함되어 있음. 물론 나도 언급하기 싫음
딴지일보 개편과 동시에 나의 300블로그가 없어져버린 것을 하루하루 바삐 살아가는 본 요원에 대한 딴지편집부의 배려라고 생각하며
분노의 나날을 보내고 있던 중…우연히 거래처에 갔다가 본 ‘중앙쥐라시’에는 별 웃기는 기사가 하나 있었다.
<중앙일보 : 수학시험 아닙니다 … 한나라 공천 트위터 지수>
내용을 요약하자면 어떤 웃기는 정당의 비대위원이 SNS활동지수를 만들었고 그걸로 뭔가를 해보겠다는 얘기다.
기사의 내용은 역시나 우리나라 교육이 얼마나 심각하게 망가져왔는지, 그리고 기자…아니 재벌찌라시 종업원들도 기초 산수에 해당하는 상식을 모르고 작업해서는 안된다는 걸 새삼 깨닫게 되었다.
이게 도대체 뭔 소리인지 좀 뒤져보자.
우선 어떤 웃기는 정당에서 ‘SNS활동지수’랍시고 수식을 만들고 그걸로 공천에 반영하겠다고 해서 좀 시끄러웠나 보다. 어차피 별 관심도 없는 이상한 집단들이라 그다지 신경도 안 쓰고 있었는데, 그 공식은
X = (팔로어 수 – 팔로잉 수) + 팔로워 수 x 0.1 + 트윗량 x 0.1 + 리스트 수
상당히 직관적인 공식이다. 중학교 1학년 교과 과정에 나올 법한 ‘다원 1차 방정식’ 변수가 하나 이상이고 거듭제곱의 차수가 1차식이라는 얘기다. 그럼 중학교 실력으로 저 식을 한번 읽어보자.
‘팔로어 수’는 ‘내가 얘기를 듣는 사람이 얼마나 많은가’ 를 나타내는 항목이고 ‘팔로잉 수’는 ‘나의 얘기를 듣는 사람이 얼마나 많은가’를 나타내는 항목이다.
‘(팔로어 수 – 팔로잉 수)’는 나를 따르는 사람에서 내가 따르는 사람을 빼는 것인데, 이것은 나의 얘기를 듣는 사람이 많을 수록 점수를 더 주겠다는 의미로, 아주 상식적으로 당연히 그렇게 해야할 것 같은 얘기이다.
‘팔로어 수 x 0.1′ 는 왜 들어갔는지 모르겠지만 일단 팔로워가 많으면 10% 가중치를 주겠다는 의미 정도로 볼 수 있겠다. 바로 앞의 항에서 팔로어수에 1.1을 곱해 미리 가산점을 주어도 같은 의미인데 괜히 식만 길게 써놓았다. (그렇게 하면 좀 있어 보이나?)
‘트윗량 x 0.1′ 이건 다들 졸라 많이 떠들 테니까 떠든 것의 10%만 반영하겠다는 의미로, 10번 떠드는 것보다 팔로워 한명 늘리는게 더 낫다는 의미도 갖게 되고, ‘팔로워 한명 늘리지 못할거면 10번 이상 떠들어라’라는 의미도 되겠다.
‘리스트 수’ : 리스트는 남이 나를 어떤 분류에 넣고 구분해서 보겠다는 의미인데 반드시 좋은 의미로만 분류된다는 보장이 없지만 일단 정치인은 좋든 싫든 남에게 거론되면 유리하다고 하므로 여기도 점수를 줬다. 뭐 그렇다고 치자.
그런데, 그 집단의 조직원들이 이러한 공식을 갖고 말이 많았던 것 같다. 아마도 그들 습성상 그런 얘기는 그 지수의 대표성,
합리성, 효용성 등과 무관하게 자신이 낮은 점수를 받아 불리하다고 판단되는 쪽에서 나왔을 것으로 추정된다.
바로 이 시점에서 정말 거론하기도 짜증나는 어떤 인간이 조금 더 색다른 공식을 들고 나왔다.
포털에서 검색하면 “서울과학고를 나와 하버드대에서 컴퓨터공학을 전공한…”이라는 수식어가 따라 붙는데, 그 직장인들이 기사랍시고 만들어낸 ‘산문집’을 정기적으로 구독하는 사람들에게는 몹시나 감동스러운 모양이다.
그래서 ‘서울과학고와 하버드를 나온 수학천재’께서 창제하신 공식을 유치원 문턱에도 못 가본 열등감에 찌든 내가 감히 살펴보았다.
로그와 시그마가 나왔다. 오호…시바…역시 인간은 하버드를 나와야…하지만 쫄지말고 살펴보자.
로그는 지수함수의 계산을 편리하게 하기 위해 개발된 뭐 대충 그런 건데…
로그함수의 곡선은 대충 이렇게 생겼다.. x가 졸라 커져도 y는 찔끔 늘어난다
로그곡선의 특성은 변수의 값이 증가함에 따라 함수의 값도 증가하지만 증가율은 점차 감소하는 특성이 있다. 즉, 숫자가 낮을수록
증가폭이 크지만 숫자가 커질수록 증가폭이 적어진다는 의미..(log1=0, log10=1, log100=2, log1000=3)
첫 번째 항(첫 번째 큰 괄호안의 내용)은 나를 따르는 사람과 내가 따르는 사람의 숫자가 합계로 계산이 된다. 즉, 남이 나를 따르는 것과 상관없이 내가 남을 많이 따르면 숫자가 올라간다.
하지만, 이것은 로그안에 들어 있어 값이 많이 커지더라도 크게 증가하지 않으므로 뒤에 나올 멘션과 리트윗에 대한 일종의 가중치의 역할을 하는 듯 하다. 예컨대, 팔로어+팔로잉 수가 백만 명쯤 돼야 30%정도의 가중치를 받을 수 있다.(정봉주처럼 팔로어가 20만명이면 한 23%쯤 가중치를 받는다고 보면 된다.)
이것은 sns를 활용하는 그룹들에서는 어느 정도 비슷한 숫자를 만들어낼 수 있고 (어떤 수단과 방법을 동원해서라도) 크기의 차이가
매우 작다고 가정하면 이 부분을 상수로 취급할 수 있는데.. (아마도 거의 1.1~1.3 사이의 값이 되겠지)
이 경우 이 식도 역시 다원 1차 방정식에 불과하고, 결국 팔로어와 팔로잉의 수를 같은 무게로 처리한 것을 제외하면 앞서 나왔던 식과 유사한 식이 된다. 촤쉭…씨바…쥐바드 출신이라고 졸라 어렵게 쓰고 싶었나 보다.
결론적으로 첫 번째 항의 의미는 ‘남이 내 말을 얼마나 듣는지와 내가 남의 말을 얼마나 듣는지가 특별한 구분 없이 같은 무게를 갖는다…’로 생각되는데 그냥 가중치 정도의 역할이고 특별한 변별력을 나타낼 의미는 거의 없다.
두 번째 항(두 번째 큰 괄호안의 내용)은 시그마가 들어있어서 잠시 쫄았겠지만 별 거 없다. 정확한 수학공식으로 쓰자면 보통 아랫쪽에 k=1, 윗쪽에 n, 10 등의 숫자를 적어 범위를 명확히 해야 하나,
보통 어떤 설명을 할 때 그냥 ‘합계’라는 의미로 쓰기도 한다.(검색해보니 본인도 그런 의미로 썼다고 한다.) 서울 과학고와
쥐바드 출신이 아닌 나도 주제 넘게 가끔 저렇게 쓰기도 한다. 하지만 어떤 상황을 말로 설명할 때는 그럴 수도 있겠지만
공식이랍시고 내놓을때는 저렇게 하면 곤란하지.
뭐, 어쨌건.
두 번째 항은 우선 한 마디 떠든 것에 점수를 주고 그걸 남들이 같이 떠들어준 것에 대해 100분의 1 점을 주어서 계산을 하고 그걸 특정기간 동안 합산하겠다는 것이다.
식이 좀 복잡하게 보여서 그렇지, 이것도 그냥 특정기간의 멘션과 리트윗을 따로 합해서 계산하면 될 일이고 만약 느닷없이 1을 더해준 이유가 전체 값이 ’0′이 되는 것을 방지하기 위해서였다면 다음과 같이 쓰는 게 맞을 것이다.
뭐 별로 중요한 건 아니니까 그냥 그렇다고 치고.
그러나, 이 별 거 아닌 것처럼 보이는 두 번째 항에서 보다 더 중요한 내용이 나타나는데, 바로 저 이상하고 웃기는 정당은 왜 계속 그 짓을 하는가에 대한 실마리가 보인다. 즉, 내가 한 말에 대해 남이 뭐라고 하는가 보다는 남에게 말을 많이 하는 것이 100배 더 점수가 높다는 것.
다시 말해 남의 말을 듣는 것보다, 내가 말을 많이 하는 것이 좋은 것으로 평가받는 것…이것이 그들의 소통방식이다.
약간 과장하자면, 누군가가 무지몽매한 국민을 계몽하기 위해 한미FTA의 당위성을 주구장창 떠들때, 남들이 그 인간한테 ‘야 이 병신새끼야’라고 해봐야 그건 별로 중요하지 않다는 것..
쯧… 니들이 그렇지 뭐…
나는 ‘과학고와 하바드를 나온’ 이뭐시기가 저 공식을 내놓음으로써 드디어 듣보르잡의 ‘국민병신’ 지위를 넘보는 게 아닐까 싶기도 한데 말이지…
지금 저 이벤트를 향해 쏟아지는 온갖 찬사를 포함한 인터넷 기사들은 대체 뭘까? 아무래도 기자를 참칭하는 어떤 직장인들이 어렸을때부터 쌓아온 ‘수학공포증’과 ‘명문대 앞에선 깨갱증’이 발병한 듯 하다.
영화 ’넘버3′에서 괜찮은 검사역할인 최민식이 조폭 넘버3 한석규에게 한 명대사가 있다.
“니가 뭘 하려고 하든 하지 마라. 빌린 돈 있으면 갚아주고 때린 사람 있으면 치료해주고.”
우린 어디서든 쫄지 말자.
병신력에는 잉여력으로
멀더요원
수학 공포증.ㅠㅠ
“‘팔로어 수’는 ‘내가 얘기를 듣는 사람이 얼마나 많은가’ 를 나타내는 항목이고 ‘팔로잉 수’는 ‘나의 얘기를 듣는 사람이 얼마나 많은가’를 나타내는 항목이다.”
위 문장이 잘 이해가 되지 않습니다.
제가 트위터를 쓰지 않기 때문에 잘못 이해하는 건진 몰라도, 그 아래 문장하고 상충하는 것 아닌가요?
팔로어 = 내 얘기를 듣는 사람,
팔로잉 = 내가 얘기를 듣는 사람
이렇게 되어야 맞는 것처럼 보이는데…
혹 잘못 이해했다면 지도 편달 바랍니다.
님 얘기가 맞음..분노의 글쓰기로 인해 잠시 왔다갔다 했으나 의미는 대충 이해하시면 됨..
쏘리..^^
아..그리고…꼼꼼히 읽어주셔서 고맙소…흑!
앗저두그렇게생각했어요 읽으면서 ㅎㅎ
어머 저 시그마 어디선가 본 것 같아.
ㅋㅋㅋ 살다살다 저런 무의미한 시그마는 또 첨본다.. 국민병신자리 넘보고 있다는데 나도 한표
보통 시그마는 수열의 합을 더할때 쓰지..
저건 그냥 just 간지용인듯 ㅋㅋㅋㅋ
이런 식은 무슨 프로그램 있어서 자동으로 만들어지지 않나?
공대쪽 공부하는 사람들 무슨 논문 쓸 때, 그 프로그램으로 식 만들어서 이것저것 대입해보던데…
통계 기법으로 ‘회귀분석(regression analysis)’이라고 합니다.
졸라 많은 데이터를 분석해서 그들간의 간단한 상관관계를 나타내는 식을 만드는 것이고…
보간법(interpolation) 등 좀 까다로운 과정을 통해서 만들지만…
실무적으로는 엑셀에서도 아주 간단하게 만들어집니다.
하지만 어떤 경우에도 저런 족보없는 공식이 만들어져서..쳐다보는 것만으로도 몸이 오글거리며 나의 귀중한 시간을 낭비하고 있다는 생각이 드는 경우는 없습니다.
병신력을 넘는 잉여력에 박수..
마지막 문장 저두 감동 받았어염
f+F가 1000보다 작으면 어떻게 되나요? log값이 음수로 나올텐데?
저게 무슨 지롤이여 병신력개쩌는 분이시네
사실…이렇게 구구절절 분석하지 않아도…정치인의 트위터에 점수를 먹인다는 자체로…이미 병실 역시 지롤………이라고 무시했음..-_-;;
참나… 놀고 있다. ㅎㅎ
좆나게 웃겨..
먼가 좆나게 한거같은대 까보면 좆같아..
맞다.
중요한 건 얼마나 떠드느냐의 차이.
그 방식이면 딴날당은 강용석과 전여옥이 다시 공천받겠지.
아님 성추행 함 해서 트위터로 변명이라도 함 하면,
공천은 따논 당상.
ㅋㅋㅋㅋ
애들 쓴다..
시그마 뒤의 1은 시그마 앞으로 나갈 수 없습니다. 1을 n번 더하란 뜻이기 때문이죠.
네..이론적으로 앞으로 나가기 위해서는 n으로 나가야 합니다…만
1을 더하는 것이 어떤 의미인지를 봐야 합니다.
예컨대 특정기간 동안에 m과 r이 없었지만 f+F가 무지하게 많은 경우 전체의 값이 ’0′이 된다면 f+F가 전혀 없는 사람과의 차별성이 없으므로 아마도 전체의 값이 ’0′이 되는 것을 막기 위해 1을 더한 것 같습니다.
멘션도 리트윗도 없는데 기본점수 1점을 주는 경우라면 n으로 나가는게 맞지만..
기사에서 언급한 바와 같이 ‘만약 느닷없이 1을 더해준 이유가 전체 값이 ’0′이 되는 것을 방지하기 위해서였다면…’
m, r 자체가 합계이므로 굳이 1을 n으로 할 이유도 별로 없고…
뭐 하여간 ‘서울과학고와 하버드를 나오지 않은’ 일반인의 정신세계에서는 이해하기 어려운 일입니다.
이해하려는 노력 자체가 시간낭비일테니 그냥 무시하는 게 상책이고, 아마도 그래서인지 ‘쥐라시 파크’의 종업원들은 검증자체를 포기하고 ‘서울 과학고와 하버드 출신’ 만을 강조하며 온갖 간지러운 칭송을 쏟아내고 있는 듯..
하바드 나온거 이렇게 써먹고 인는거야..?
짱..
시그마는 엑셀에서 자동 합계를 의미합니다. 엑셀에서 A1 셀에 1, A2 셀에 2, A3 셀에 3을 입력하고 A4셀에서 상단 메뉴의 시그마를 누르면 자동으로 A1~A3 값을 합산해서 A4 셀에 6을 입력해 줍니다. 바로 그런 자동합계를 의미하지요. 그러니 사실 위 공식에서는 글쓴이가 설명한대로 더하기의 의미이니 있으나 없으나 차이가 없네요…그냥 폼생폼사 정도…
우왕! 짱이당!
많이 배운사람은 뭐가 달라도 다르다는
더하기 빼기 곱하기 나누기
이것만 쓰자고!
뭔 수학이 숫자보다 영어가 더 많아…