|
Free exchange
In poor countries, statistics are both undersupplied and underused
가난한 나라에서 통계는 부족하고 잘 활용되지 않는다.
Governments often lack incentives to collect, share and use data
정부는 통상 데이터를 수집, 공유하고 사용하는 것에 대한 인센티브가 부족하다.
Finance & economics
Apr 10th 2021 edition
Apr 8th 2021
Give this article
In the rich world, people worry that prying governments know too much about them. Popular culture valorises characters who go off the grid, like Jack Reacher (the hero of 25 novels by Lee Child and two films starring Tom Cruise). He drifts around America on Greyhound buses, eschewing a driving licence, credit cards and email. Why does he make himself so hard to find? “It started out as an exercise and became an addiction,” he says.
부유한 세계에서 사람들은 정부가 그들에 대해 너무 많은 것을 캐내어 알고 있는 것을 우려한다. 대중 문화는 Jack Reacher (Lee Child의 25편 소설과 Tom Cruise가 주연한 영화 2편의 영웅) 처럼 고정된 틀에서 벗어난 캐릭터를 더 가치 있다고 생각한다. 그는 운전면허증, 신용카드, 이메일을 사용하지 않고 Greyhound 버스를 타고 미국을 떠돌아 다닙니다. 그는 왜 남들이 그를 찾기 어렵게 하는 걸까? “처음에 연습 삼아 시작했는데 중독 되어 버렸다.”고 그는 말한다.
Listen to this story
Enjoy more audio and podcasts on iOS or Android.
The developing world, however, is full of unwitting Jack Reachers who leave little trace in official records. Their anonymity is not an addiction but an affliction. According to the World Bank’s latest World Development Report, entitled “Data for Better Lives”, about 1bn people have no official proof of their identity. More than a quarter of the world’s children under five are not registered at birth. Half of the 29 poorest countries have not completed a census in the past ten years—Congo has not done one since 1984—and only 40% have three or more estimates of poverty that can be compared across time. Christopher Yeh of Stanford University and his colleagues have calculated that an African household will appear in a representative survey of living standards less than once every 1,000 years.
하지만, 개발도상국은 공식적인 기록의 흔적을 거의 남기지 않는 아무 생각 없는 Jach Reacher 들로 가득하다. 그들의 익명성은 중독이 아니라 고민거리이다. 세계은행의 “더 나은 삶을 위한 데이터”라는 제목의 세계 개발 보고서에 따르면, 약 10억명이 자신의 신원을 공식적으로 증명하지 못한다고 한다. 5세 이하 세계 어린이의 ¼이 출생 신고가 되지 않았다. 가장 가난한 29개 나라중 절반이 지난 10년간 인구 조사를 완료하지 못하였고-Congo는 1984년 이래 한번도 하지 못하였다- 단지 40%만이 3개 이상의 장기간에 걸쳐 비교 할 수 있는 빈곤에 대한 추정치를 가지고 있다. 스탠포드 대학의 Christopher Yeh와 그의 동료들은 아프리카 가계는 대표적인 생활 수준 설문 조사에 1,000년에 한번도 잘 나타나지 않을 것이다.
Given the shortage of conventional statistics, many people are enthusiastic about more novel forms of data, gleaned from mobile phones, social media and satellite imagery. In the early months of the covid-19 pandemic, patterns of mobile-phone use showed who could and could not afford to stay at home in a city like Jakarta, outlining the uneven impact of lockdown measures in many developing countries. That kind of data can help donors better target their aid efforts. Emily Aiken of the University of California, Berkeley, and her colleagues have tested whether a machine-learning algorithm can identify the poorest households in 80 Afghan villages based on mobile-phone data, such as the duration of their calls, their network of contacts, and how often they paid for more minutes of call-time. For the 80% of households that owned a mobile phone, the algorithm worked about as well as more traditional targeting methods, such as counting fridges, clothes irons, and other physical assets.
기존 통계의 부족을 감안할 때 많은 사람들은 모바일 폰, 소셜 미디어와 위성 이미지로부터 수집된 새로운 형태의 데이터에 더 열광한다. Covid-19 팬데믹 초기 몇 달 동안 많은 개발도상국에서 봉쇄 조치의 불균등한 영향이 나타나면서 자카르타와 같은 도시의 휴대전화 사용 패턴은 집에 머물수 있는 여유 있는 사람과 그렇지 않은 사람이 있다는 것을 보여 주었다. 그러한 종류의 데이터는 기부하는 사람이 그들의 원조가 필요한 대상을 더 잘 정할 수 있도록 도와 줄 수 있다. 버클리 캘리포니아 대학의 Emily Aiken과 그녀의 동료들은 머신러닝 알고리즘이 통화 기간, 연락 네트워크, 얼마나 자주 그들이 통화 하는지와 같은 모바일 폰 데이터를 기반으로 80개의 아프간 마을에서 가장 가난한 가정들을 식별할 수 있는지 테스트하였다. 모바일 폰을 소유한 80%의 가정에 대하여 냉장고, 다리미, 물리적 자산을 계산하는 것과 같은 전통적인 타겟 방식에도 마찬가지로 그 알고리즘은 작동하였다.
But, as the study’s authors are careful to note, not everyone owns a mobile phone. And algorithms that work in one place and time may not necessarily travel well or endure for long. Joshua Blumenstock of Berkeley has pointed out that international calls may be a less reliable indicator of prosperity during the Haj pilgrimage season, when many more people travel.
하지만, 연구의 저자가 신중하게 주석을 단 것 처럼, 모든 사람이 휴대폰을 소유하고 있지 않다. 특정 장소와 특정 시간에 작동한 알고리즘이 다른 곳으로 옮겨가서 혹은 오랫동안 지속적으로 반드시 작동하지 않을 수 있다. 버클리의 Joshua Blumenstock은 더 많은 사람이 여행하는 하지 순례 기간 동안의 국제 통화는 신뢰도를 떨어 뜨리는 번영의 지표가 될 수 있다고 지적하였다.
Satellite imagery avoids some of these problems—cameras in orbit can see how the other half lives. Countries can sharpen poverty maps by combining household surveys with clues visible from space, including building sizes, forest cover, and the intensity of night-time lights. Tanzania was able to turn a poverty map divided into 20 mainland regions (containing populations of over 2m on average) into a higher-resolution poverty map of 169 districts (containing average populations of 300,000 or so). The extra precision provided by satellite data was equivalent to increasing the sample size of a household survey by five times, according to Takaaki Masaki of the World Bank and his co-authors.
위성 이미지는 이러한 문제점들의 일부를 방지한다. 위성 궤도의 카메라는 나머지 절반의 삶이 어떠한지 볼 수 있다. 국가들은 빌딩 사이즈, 숲의 범위, 야간 조명의 강도를 포함하여 우주에서 볼수 있는 단서와 가계 설문조사를 결합하여 빈곤 지도를 정교하게 만들 수 있다. 탄자니아는 20개 빈곤지도로 나누어진 본토지역(평균 2백만명 이상의 인구 포함)을 169개 지구(평균 인구 30만명 정도 포함)의 고배율의 빈곤 지도로 변경할 수 있었다. 세계은행의 Takaaki Masaki와 그의 공저자들에 따르면, 위성 데이터에 의해 제공 되어 지는 추가적인 정밀도는 가계 조사의 표본 크기를 5배 늘리는 것과 같다.
These techniques can all improve the supply of data. But supply is not the only problem. If it were, you would expect any figures a government did collect to be highly prized, widely disseminated and heavily used. But the opposite is too often the case. Data are rarely shared with outsiders. And they are poorly digested even within official circles. Daniel Rogger and Ravi Somani of the World Bank once asked over 1,800 officials in Ethiopia how many people lived in their districts. About half of them thought their districts were at least 50% bigger or smaller than they actually were, according to figures in their own databases. Education officials over- or underestimated primary-school enrolment numbers by 76%. When asked, less than 13% said that these administrative databases were their main source of information.
이러한 기술들은 모든 데이터의 공급을 향상 시킬 수 있다. 하지만, 데이터 공급이 단지 문제가 되지 않는다. 그렇다면, 정부가 수집한 모든 수치는 매우 가치 있고, 널리 배포 되고 많이 사용 되어 질 것으로 예상 될 것이다. 그러나 그 반대의 경우도 자주 발생한다. 데이터는 외부와 거의 공유 되지 않는다. 그리고 그 데이터들은 공공기관 내에서 조차도 제대로 이해 되어지지 않는다. 세계 은행의 Daniel Rogger와 Ravi Somani는 에티오피아의 1,800명 이상의 공무원들에게 얼마나 많은 사람이 그들의 관할 지역에 살았는지 물었다. 그들 중 약 절반은 그들의 지역이 실제 그들이 가지고 있는 데이터베이스의 숫자보다 50% 더 크거나 작다고 생각했다. 교육 공무원은 초등학교 등록자 수를 76% 많거나 적게 추산하였다. 이러한 질문을 하였을 때, 이러한 행정적 데이터베이스가 정보의 중요한 원천이라고 말한 사람은 13%가 되지 않았다.
Big Brother is watching out for himself
Governments often lack a strong incentive to collect data, use them well, or allow others to use them better. Bureaucrats with little discretion to make decisions have scant reason to inform themselves about what the right decision would be. And in countries that lack strong safeguards to prevent data misuse, civil servants understandably hold numbers close to their chests. Moreover, statistics can be most valuable when holding governments to account. Why should governments conspire in their own embarrassment by providing the data by which they will be judged?
데이터를 수집하고 그것을 잘 활용하거나 다른 사람들이 더 잘 이용하도록 하는 정부의 강력한 인센티브가 종종 부족하다. 결정을 내릴 재량이 거의 없는 관료들은 무엇이 올바른 결정인지에 대하여 그들이 알아야 할 이유가 별로 없다. 데이터의 오용을 방지하기 위한 강력한 안전장치가 부족한 나라에서 공무원들은 당연히 숫자를 가만히 가지고만 있다. 게다가, 통계는 정부가 책임을 질 때 가장 가치가 있을 수 있다. 왜 정부는 데이터를 제공함으로서 그들이 심판을 받을 것이라는 그들 자신의 곤란한 상황을 만들어야 하는가?
For this reason, the authors of the World Development Report call for something akin to a cultural shift in the handling of data. They advocate for “political champions” who recognise data’s value in improving policies and a data-literate press and public who demand better numbers to draw on. This political commitment to data would, in turn, generate incentives for civil servants to make better use of the figures at their disposal. The mindset of ministries can be as important as a government’s financial wherewithal. According to new indicators from the World Bank, a country’s statistical performance is only loosely correlated with its prosperity. Some countries, like Kyrgyzstan or Mexico, do much better than you would expect given their level of gdp per person.
이러한 이유로 세계 개발 보고서의 저자들은 데이터 처리에 있어서 문화적 변화와 유사한 어떤 것을 요구한다. 그들은 정책개선에 있어서 데이터의 가치를 인식하는 “정치적 챔피언”과 데이터 사용에 능통한 언론과 이목을 끄는 더 나은 숫자를 요구하는 대중을 옹호한다. 데이터에 대한 이러한 정치적 약속은 공무원이 그들의 업무 처리에 수치를 더 잘 활용하도록 하는 인센티브를 만들어 낸다. 정부 부처의 태도는 정부의 재정적 현금만큼이나 중요할 수 있다. 세계은행의 새로운 지표에 따르면, 국가의 통계적 성과는 다소 약하게 번영과 상관 관계가 있다. 키르기스탄과 멕시코와 같은 일부 국가들은 그들의 1인당 GDP 수준을 고려할 때 예상 되어지는 것보다 훨씬 더 잘 하는 것이다.
In this vision, private data and official statistics are complements, not substitutes, that can be of use for either corporate or public purposes. One current example is the Gallup World Poll, carried out by the private polling firm in over 140 economies. Every three years, it adds questions on financial inclusion instigated by the World Bank. This polling showed that 1.7bn people lacked a formal bank account in 2017. That gap is both a potential business opportunity for financial firms and a problem for governments. After all, even Jack Reacher has a bank account.
이러한 시각에서, 사적인 데이터와 공적인 통계는 기업 또는 공적인 목적으로 사용 되어 질 수 있는 대체재가 아니라 보완재이다. 현재 한가지 예로 140개 이상의 경제국가에서 민간 여론 조사 회사가 실시하는 Gallup World Poll이 있다. 3년마다 세계은행의 요청에 따라 금융의 포용성에 대한 질문을 추가한다. 이 여론 조사는 2007년에 17억명이 정식 은행 계좌를 가지고 있지 않다는 것을 보여 주었다. 그 격차는 금융 기업의 잠재적인 영업 기회와 정부들의 문제이다. 어쨌든, 심지어 Jack Reacher 도 은행 계좌를 가지고 있다.
|