Digital libraries
Great minds think (too much) alike
Jul 17th 2008
From The Economist print edition
Is the web narrowing scientists’ expertise?
과학자들의 협소해지는 지식은 웹에 있는가?
ONLINE databases of scientific journals have made life easier for scientists as well as publishers. No more ambling down to the library, searching through the musty stacks and queuing up for the photocopier. Instead, a few clicks of a mouse can bring forth the desired papers and maybe others that the reader did not know of—the “long tail” of information that the web makes available.
과학저널의 온라인 데이터 베이스는 발행인 뿐만 아니라 과학자들의 삶도 보다 쉽게 만들었다. 더 이상, 도서관으로 걸어 내려갈 필요도, 케케묵은 선반을 뒤지고, 복사기 앞에서 줄을 설 필요도 없다. 그 대신, 몇 번의 마우스 클릭으로 필요로 했던 논문과 아마도 독자는 몰랐지만, 웹이 가능하게 만든 정보의 “롱 테일”인 다른 논문들을 함께 앞으로 가지고 나올 수 있다.
Well, that is how it is supposed to work, but does it? James Evans, a sociologist at the University of Chicago, decided to investigate. His conclusion, published in this week’s Science, is that the opposite is happening. He has found that as more journals become available online, fewer articles are being cited in the reference lists of the research papers published within them. Moreover, those articles that do get a mention tend to have been recently published themselves. Far from growing longer, the long tail is being docked.
글쎄, 이것이 작동하기로 되어 있는 방법이지만, 작동 할까? 시카고 대학교의 사회학자인 제임스 에반스 교수는 연구해보기로 결정했다. 이번 주 사이언스지에 발간된 그의 결론은 정반대의 것이 일어난 다는 것이다. 그는, 보다 많은 저널이 온라인에서 이용 가능하게 되어도 적은수의 기사들이 연구논문의 참고도서 목록에 인용된다는 것을 발견했다. 게다가, 기재된 논문들은 최근에 발간된 경향을 보인다. 길어지는 것에서 멀어 질수록, 롱 테일은 독에 갇히게 된다.
Dr Evans based his analysis on data from citation indexes compiled by Thomson Scientific (part of Thomson Reuters). In a world in which researchers must publish or perish, such indexes are the firing squads. They record how often one article is cited as a source by others, and thus measure a paper’s influence. Those used by Dr Evans cover 6,000 of the most prominent academic journals, some going back to 1945. By cross-referring these to a database called Fulltext Sources Online, he was able to work out when each of these journals became available on the web—and whether a journal had posted back-issues electronically as well. The result was a set of 34m research papers, which he was able to mine in search of his answers.
에반스 박사의 분석은 톰슨 로이터의 일부인 톰슨 사이언티픽이 집계한 인용 목록 데이터를 기초로 한다. 연구자들이 발행하거나 사라져야 하는 세상에서, 이러한 목록들은 사형대이다. 그들은 한 논문이 다른 이들의 자료로 얼마나 자주 인용되는지를 기록하고, 그럼으로써 그 논문의 영향력을 측정한다. 에반스 박사에 의해 사용된 그것은 6000여종의 가장 뛰어난 학술 저널을, 어떠한 것은 1945년으로 거슬러올라가는, 다루고 있다. 이것들은 풀텍스트 소스 온라인이라 불리는 데이터베이스와 상호참조함으로써, 그는 이러한 저널들의 각각이 언제 웹에서 사용 할 수 있었는지, 저널이 지난 호들 역시 전자적으로 게시하였는지 여부를 알 수 있었다. 그 결과는 그가 원하는 답을 찾는 것을 알 수 있는 34미터 분량의 연구종이였다.
For each research paper he looked at, he calculated the average age of the articles cited as references. He then calculated, for each of those cited articles, the number of back-issues of the journal it had been published in which were available on the web at the time when it was cited, and averaged that too. Finally, he looked for correlations between the two averages.
그가 본 각각의 논문에 대하여, 그는 참고문헌으로 인용된 논문의 평균 나이를 산출하였다. 그리고 그는, 각각의 인용된 논문에 대하여, 인용된 시점에서 웹에서 사용 가능하게 출판된 저널의 지난 호의 숫자를 계산하고 그것 역시 평균했다. 결국, 그는 이 두 가지의 평균 사이의 관계를 찾아냈다.
What he discovered was that, for every additional year of back-issues of a journal available online, the average age of the articles cited from that journal fell by a month. He also found a fall, once a journal was online, in the number of papers in it that got any citations at all. Indeed, he predicts that for the average journal today, five extra years’ worth of online availability will cause a precipitous drop in the number of articles receiving one or more citations—from 600 to 200 a year. Rather than measuring the length of the tail, then, it seems that modern science is actually focusing on a tiny bit of it.
그가 발견한 것은, 온라인으로 활용 가능한 저널의 지난 호의 각각의 부가적인 연도에 대하여, 그 저널에서 인용된 논문의 평균 나이가 한 달 정도 작다는 것이다. 그는 한번 저널이 온라인에 게시되면, 그 저널 안에서 조금이라도 인용을 받는 논문의 수가 떨어진다는 것 역시 발견했다. 게다가, 요즘의 일반적인 저널에 대하여, 온라인으로 추가적을 5년치 정도의 활용이 가능하다는 것이 한 해 600편에서 200편 정도로, 하나 또는 그 이상의 인용을 받는 논문의 수가 현저하게 떨어질 것이라고 예측한다. 오히려 꼬리의 길이가 측정된다 치더라도, 그래도, 그것은 현대의 과학이 실질적으로 매우 작은 부분의 것에 집중한다는 것을 보여준다.
Why this should be so remains unclear. It does not seem to have anything to do with economics. The same effect applied whether or not a journal had to be paid for. One explanation could be that indexing works by titles and authors alone, as happened with printed journals, forced readers to cast at least a cursory glance at work not immediately related to their own—or even that the mere act of flicking through a paper volume may have thrown up unexpected gems. This may have led people to make broader comparisons and to integrate more past results into their research.
왜 이런 것이 미해결로 남아야 하는가. 그것은 경제학과 관련이 있다고 보여지지 않는다. 같은 효과가 저널에 대한 대가가 지불되었는지의 여부에 적용된다. 한 가지 설명은, 출판된 저널에서 일어나는 제목과 필자만을 가지고 색인을 다는 작업이 독자로 하여금 그들의 연구와 지금 즉시 연관되지는 않지만 피상적인 시선을 던지게 하거나, 종이로 된 잡지를 던지는 단순한 행동 조차 마치 기대하지 않았던 보석을 던지는 것처럼 강요케 한다. 이런 것은, 사람들을 보다 넓은 비교를 하게 하고, 더욱 과거의 결과를 그들의 연구에 통합하게끔 이끌어 왔을 것이다.
It is not yet clear whether this change is for good or ill. Electronic searching means that no relevant paper is likely to go unread, but narrowing the definition of “relevance” risks reducing the cross-fertilisation of ideas that sometimes leads to big, unexpected advances. As a wag once put it, an expert is someone who knows more and more about less and less until, eventually, he knows everything about nothing. It would be ironic if that is the sort of expertise that the world wide web is creating.
이러한 변화가 좋은 것인지 나쁜 것인지는 아직 분명치 않다. 전자적인 검색은 연관이 없는 논문이 읽혀지지 않게 한다는 것을 의미하나, 하지만 “관련”이라는 것에 대한 협소해지는 정의는 때때로 크고 예상치 못한 발전을 이끄는 아이디어에 대한 교류를 줄일 위험이 있다. 꼬리가 한번 흔들어 지게 되는 것 처럼, 전문가는 지금까지 점점 작아 지는 것에 대해 많은 것을 알고 있는 사람이고, 결국 그는 아무것도 아닌 것에 대한 모든 것을 알게 된다. 그것이 월드 와이드 웹이 창조한 전문적인 지식의 일부라면 그것은 참 아이러닉한 것이다.
어려워요..ㅠ.ㅠ