** 이 기사는 1987년 1월 Stereo Review 지에 실렸던 것을 운영자가 번역한 것입니다. 이 잡지는 1999년 1월 폐간되었습니다.
David L. Clark는 가장 뜨거운 논쟁거리 중의 하나에 대한 답을 찾으려고 합니다.
이 기사는 Ian G. Masters가 썼습니다.
아마 앰프의 소리에 대한 토론보다 더 잽싸게 오디오 애호가들을 논쟁에 끌어들이는 것은 거의 없을 것입니다. 1960년대 초기에 있었던 진공관대 트랜지스터 논쟁을 시작으로 파워앰프들 사이의 음질차이에 대한 본질-또는 그 차이의 존재 여부-등은 정말로 뜨거운 화제 거리였습니다. 그리고 이 문제는 아직 해결 근처에도 못간 것처럼 보입니다.
언뜻 보기에는, 어떤 앰프보다 열배 비싼 앰프의 소리가 더 좋아야 한다는 것이 논리적으로 당연해 보입니다. 아마 열배로 좋다고 할 수는 없더라도 귀로 들어서 음질의 향상을 감지할 수 있을 정도는 되어야 할 것입니다. 그렇지 않다면 희한한 방식의 회로를 가진 엄청나게 비싼 앰프들을 어찌 정당화할 수 있겠습니까?
앰프들이 내는 소리에는 큰 차이가 존재하며 그런 이치는 그냥 듣기만 해도 쉽게 알 수 있다고 목청높게 주장하는 한 무리의 애호가들이 있습니다. 이 그룹의 구성원들이 소리의 성격을 묘사할 때 사용하는 단어들은 대개....음... 뭐랄까....시(詩)적인 경향이 있습니다. 이런 말들은 기술적 용어에 더 익숙한 사람들-대개 음질 차이를 부정하는 사람들을 진절머리나게 합니다.
회의론자(차이를 부정하는)들은, 앰프를 골라야 하는 몇가지 이유가 있기는 하지만 앰프의 소리 성향은 그 이유들 중 하나가 될 수 없다고 믿습니다. 그보다는 내구성, 외관, 브랜드의 명성, 사용의 편의성, 또는 기술적 성능과는 관계없는 요소들을 고려하여 앰프를 구입해야 한다고 생각합니다. 그 사람들의 관점으로는, 어떠한 음질 차이가 있다면 그러한 차이는 측정에 의하여 밝혀져야 합니다:주파수 응답 특성, 찌그러짐, 잡음지수,등등의 차이가 측정되어야 한다는 말입니다. 그러한 기술적 검사를 해보면 기기들 사이의 차이들이 너무나 미소하지 않은 경우가 거의 없습니다. 그래서 회의론자들은 음질 차이가 생길 가능성은 너무나 희박하다고 믿습니다. 신봉자(차이를 믿는)들조차도 그 차이는 매우 미묘한 것이라고 시인합니다. 그러나 그들은 차이가 엄연히 존재하며, 들어서 가려낼 수 있다고 합니다. 특히, 오랜 시간동안 들어보면 알아낼 수 있다고 합니다.
앰프들 사이의 소리 성향 차이를 가려낸 다음 그 차이들의 기술적 원인을 찾아보려는 시도는 긴 세월에 걸쳐 대단히 여러번 시행되었습니다. 대부분의 경우 청취자들은 그 시험 과정의 두번째 부분을 시행할 수 있을만큼 충분히 지속적으로 음질 차이를 구분하지 못하였습니다. 앰프들의 차이를 구분하지 못하니 차이를 정량화한다든지 설명한다는 것이 대단히 어려웠습니다. 몇몇 사람들은 이러한 결과를 앰프들의 소리는 똑같다는 주장의 근거로 삼았으며;다른 사람들은 그러한 결과가 테스트 과정의 오류때문에 일어났다고 지적하였습니다. 그래서 논쟁은 계속됩니다.
스테레오리뷰의 편집자들도 이 문제에 대해서 어떤 방식으로든지 테스트가 이루어져야 한다고 느끼고 있었습니다. 그래서 그들은 많은 표본 청취자들과 최대한으로 다양한 기술적 특성 차이를 갖는 표본 앰프들을 시험 대상으로 삼고, 이를 대상으로 세심하게 운영되는 일련의 시험이 시행된다면 비교적 믿을만한 정보를 얻게될 것이라고 결론을 내렸습니다. 그러한 시험을 구성하기 위하여 잡지사는 DLC Designs사의 David Clark를 찾아 갔습니다. 그는 과거 수년동안 CD 플레이어와 hifi VCR에 대한 비슷한 청취 시험들을 설계하고 감독해왔습니다.
Clark 씨에게 맡겨진 임무는 그 자신의 기술적 기준도 만족하고 잡지사의 기준도 만족시킬 수 있는 일련의 시험을 구성하는 것이었는데, 그 시험은 신봉자 중에서도 가장 까다로운 사람도 만족 시킬 수 있는 방법으로 이루어지도록 하였습니다. 시험 과정이 앰프들의 음질 차이를 제대로 나타내기에 부족하다는 지적을 받지 않도록 가능한 모든 노력을 하였습니다.
처음 고려해야할 것은 이러한 시험을 시행하기에 적합하다고 인정될만한 오디오 시스템을 구성하는 것이었습니다. 이러한 시스템은 모든 기기들은 하이엔드 애호가들이 보아도 도저히 트집 잡을 수 없는 기기들로 구성되어야 했습니다. 물론 이러한 것은 불가능하지만 그런대로 비슷한 것은 만들 수 있었습니다.
소스로는 CD와 엘피 레코드를 같이 사용하도록 하였는데, CD 플레이어는 Meridian MCD Pro player를 사용하기로 하고 엘피는 Eminent Technology의 직선형 암과 Van den Hul MC-10 Moving Coil 카트리지가 달린 Sota Star 턴테이블로 듣도록 결정하였습니다. 이 두가지 소스들은 하이엔드 인터코넥트 케이블을 이용하여 Audio Research SP-11 진공관 앰프에 연결되었습니다.
사용된 스피커는 Magnepan MG-IIIa 였는데 이 스피커는 매우 두꺼운 스피커 케이블을 사용하여 테스트 앰프에 연결되었습니다. 이 시험은 특별히 마련된 청취실에서 시행되었는데 이 청취실은 잡지사를 위하여 Clark 씨가 이전에 수행한 시험에도 사용되었습니다.
테스트 대상이 될 앰프의 선정도 중요한 일이었습니다. 표본들 중에는 싸구려 대중용품에서 최고로 멋진 것까지, 그리고 그 중간쯤되는 것들도 포함되어야 했습니다. 테스트용 앰프의 숫자가 제한되어 있기 때문에 비교적 서로간의 차이가 클 것같은 앰프들을 골랐습니다. 이러한 이유로, 가장 밑바닥 대표로는 225달러 짜리 Pioneer SX-1500 리시버를 선택하였고 맨 위쪽 대표로는 New York Audio Lab의 Julius Futterman OTL-1 진공관 앰프를 선택하였는데 이것의 가격은 채널당 6,000 달러였습니다.(한쌍의 Futterman은 한쌍의 전원부가 따로 필요한데 이 덩치는 작은 난로만 하며 열도 작은 난로만큼 냅니다.) 두개의 극단적 대표들 사이에는 애호가들에게 호평 받는 Mark Levinson ML-11($2,000), 그리고 좋은 평가를 받고 있는 중간 가격 기기들인 Hafler DH-1 120($320), 그리고 NAD 220($548) 등이 선정되었습니다. Counterpoint의 SA12($995)는 진공관-트랜지스터 복합(hybrid) 앰프의 대표로 선정하였는데 제대로 시험을 해보기도 전에 고장이 나서 충분히 시험할 수 없었습니다. 각 앰프의 이득(증폭률)은 Audio Research 프리앰프의 테이프모니터 루프에 설치된 감쇄기를 이용하여 똑같이 맞추었습니다.
표본 청취자를 선정하는 것도 중요한 요소였습니다. 표본의 수는 시험 결과의 통계적 처리가 가능할만큼 커야 했지만 적당한 시간 이내에 마쳐야 했으므로 그 수를 제한해야 했습니다. 도착한 청취자의 수는 25명이었는데 이 사람들은 각각 서로 다른 횟수의 청취 시험에 참가하였습니다. 시험 청취자의 수가 이 정도였기 때문에 Clark 씨는 테스트를 일주일 내에 마칠 수 있었습니다.
청취자들의 성향도 중요한 것이었므로, 앰프들 사이의 음질 차이를 구분할 수 있다고 주장하는 소위 "신봉자"들과 이러한 차이를 의심하는 "회의론자"들을 모두 포함하였습니다. 두 종류의 청취자를 함께 참가시킨 이유는 실험 방법에 대한 그들 모두의 인정을 받기 위해서 였습니다. 그렇게 하지 않는다면 시험 결과가 그들의 믿음과 일치하지 않는 경우 반칙이 있었다고 항의할 가능성이 있기 때문이었습니다.
테스트로는 두가지 선택 사양이 제공되었습니다. 이렇게 하는 것이 테스트 성적을 올리는 데 도움이 된다고 느끼는 청취자들은 비교 청취하고 있는 두 앰프에 연결된 케이블을 수동으로 바꿔치기 해주도록 조작자에게 요청하는 방법을 선택할 수도 있었습니다. 이러한 방법이 허용된 이유는 많은 하이엔드 애호가들 중에는 순간적인 A/B 테스트를 의심하는 사람도 많기 때문에 몇몇 신봉자들은 이러한 방법을 선호할 것이라고 생각했기 때문입니다.
다른 한가지는 ABX 비교기(comparator)를 사용하는 ABX 이중맹검(二重盲檢, double blind test) 방식이었습니다. ABX 시스템에서는 A,B로 표시된 두개의 피시험 앰프가 비교기에 연결되어 있고, 청취자는 리모트 콘트롤로 앰프를 전환할 수 있습니다. 이 시스템에는 X라고 표시된 세번째 선택이 있는데 이 세번째 선택은 A,B 둘 중의 하나입니다. 청취자는 X의 소리를 들은 다음 스위치를 조작하여 A,B를 들어보고 X가 A인지 B인지 선택합니다. 각 테스트마다 16회 시도하는데, 각 회마다 비교기는 무작위로 X를 A나 B에 연결합니다. 그리고 청취자는 답안지에 자기가 옳다고 생각하는 답을 적어 넣습니다. 테스트가 끝나면 비교기는 정답을 읽어내고 각 회의 답이 틀렸는지 맞았는지 채점이 됩니다.
이 테스트 시스템은 차이를 밝혀내기 위한 시험이지 선호도를 밝혀내도록 고안된 것은 아닙니다. 어떤 청취자가 X 앰프가 무엇인지 꽤 신뢰성 있게 맞추어낸다면 그 사람은 실제로 음질 차이를 들은 것이라고 간주되었습니다-차이가 엄청나다면 모든 회수마다 알아 맞추어야 할 것입니다. 만일 전혀 차이가 없다면 그 점수는 요행수로 맞추는 점수 50점 부근일 것입니다-시행 샘플의 수가 충분히 많다면 말입니다.
확실과 완전 요행수 사이에 있다면 그 점수는 통계처리를 받도록 되어 있습니다. 만일 맞춘 수가 통계적으로 유의하다면 진짜 차이를 들은 것으로 간주하고, 그렇지 않다면 그 점수는 무작위 답변으로 얻은 것으로 간주하였습니다. 테스트는 한번에 한명에서 여덟 명에 이르는 청취자를 대상으로 시행되었습니다. 그리고 ABX 전환과 CD,LP 선택은 청취자가 하도록 하였습니다. 테스트가 진행되는 전 과정동안 기기들은 청취실 앞쪽에 전시되어 있었지만 어떤 앰프를 듣고 있는지 알 수 없도록 하였습니다.
각 회를 시작할 때, 각 청취자는 테스트 조건이 앰프의 음질 차이를 검사하는 데 적합한지 여부를 묻는 양식을 받았습니다. 한시간에 걸친 예비 청취를 마친 뒤에 세명을 제외한 모든 청취자들이 이 양식에 서명을 하였습니다. 한 사람은 테스트 조건이 부적합한 것은 아니라고 하였고, 한 사람은 보류했으며 또 한사람은 무답이었습니다.
답안지를 나누어주고 블라인드 테스트가 시행되었습니다. 비교는 청취자들이 선택한 한쌍의 앰프들에 대하여 이루어졌습니다. 테스트 시간은 45분에서 2시간 30분 까지 걸렸고, 몇 청취자는 서로 다른 세가지 비교 테스트에 참여하였습니다. 같은 테스트에 회의론자와 신봉자를 섞지는 않았습니다. 그리고 신봉자의 테스트는 신봉자가 감독하도록 하였습니다.
공식적인 테스트가 끝난 후, 각 청취자들에게 그 테스트가 앰프의 음질 차이를 가려내는 데 적합하다고 생각하느냐, 그리고 이러한 테스트가 소비자에게 의미있는 것인가-를 물어 보았습니다. 이 설문은 단지 정보를 얻으려는 목적도 있었지만, 테스트 후 그 결과를 본 뒤에 테스트에 대한 태도 변화가 있는지 알아 보려는 것이었습니다. 테스트의 적합성에 대하여 신봉자들이 가진 느낌이 변화되거나 뒤 바뀐 경우가 여럿 있었습니다.
그러한 태도 변화가 일어난 것은 테스트의 첫번째 부분때문이라 할 수 있습니다. 블라인드 테스트를 실시하기 전에 청취자들은 각각의 앰프들을 스스로 골라 적당한 시간동안 들어볼 기회가 있었습니다. 같은 음악들이 각각의 앰프에 반복하여 사용되었습니다. 그렇지만 이 과정에서는 블라인드 테스트가 아니었고 A/B 비교도 이루어지지 않았습니다. 회의론자까지 포함하여 거의 모든 청취자들은 이 과정에서 어떤 음질차가 존재한다는 느낌을 받았습니다. 일부의 사람들은 흡족하게 생각하였고 어떤 사람들은 상당히 낙심하였습니다. 그렇기는 했지만, 그 차이가 존재한다해도 그 차이는 매우 작은 것이라는 것처럼 보였습니다. 회의론자들 중 다수는 신봉자들이 평소에 이야기하던 것들이 과연 무엇인지 알 것같다는 생각이 들기 시작했지만 말입니다.
이 행사의 이러한 도입 부분이 끝나고 나서 청취자들은 일이 점점 어려워진다는 것을 발견하기 시작하였습니다. 가장 명백하게 차이가 나야한다고 믿던 경우에서도 그랬습니다: 파이오니어 리시버와 괴물 푸터만 사이의 비교에서 말입니다. 테스트가 이루어지는 동안 청취자가 확신을 가지고 정답을 택했다고 한 경우는 매우 드물었습니다. 정답을 찾는 데 도움이 될만한 아주 사소한 단서라도 잡으려고 노력해야 하는 과정은 너무나 긴장된 것이었습니다.(그런데 한번은 청취자가 매우 신속하게 정답들을 내놓는 경우가 생겼습니다. 어느 청취자가 앰프와 스피커 연결의 위상관계가 잘못되었다고 지적할 때까지는 그랬습니다. 이것을 바로잡고 나니 알아 맞추기의 어려움은 다시 시작되었습니다.)
결국, 45회의 테스트가 이루어졌고 대부분의 테스트에서 청취자마다 16개의 선택을 하도록 하였습니다.(시간을 절약하기 위하여 케이블 교환 테스트는 각 5회씩만 하도록 하였습니다.) 그리하여 종합적으로 772개의 답안이 만들어졌습니다.
이러한 답안의 경우, 답을 완전히 무작위로 작성했다면 정답의 갯수는 386개일 것입니다. 채점 결과는 388개입니다. 그러므로 청취자 그룹 전체와 시험 대상 앰프 그룹 전체에 대하여 평가한다면, 음질 차이를 가려냈다고 인정할만큼 통계적으로 유의한 점수를 내지 못하였습니다.
그러나 이러한 결과만 가지고, 특정한 청취자가 앰프들의 차이를 신뢰도 높게 가려낼 수 있을 가능성을 제거할 수 없으며 모든 조합의 앰프 비교가 모두 가려내기 어렵다는 증거로? 삼을 수도 없습니다. 이러한 실험 결과를 가지고 어떤 청취자는 잘 가려냈는데 점수가 나쁜 청취자들 때문에 종합 점수가 나빠졌다고 해석할 수도 있습니다-물론 그 가능성이 높아 보이지는 않지만 말입니다. 같은 식으로 해석하면 이 점수들은 특정 조합의 두 앰프들은 음질적으로 동등하지만 다른 조합의 두 앰프는 서로 다를 가능성이 있다고 할 수 있습니다.
통계적으로 유의하기 위해서는, 점수가 50점 이상 나온 테스트가 생길 확률이 0.05, 즉 스무번에 한번 이하라야 합니다. 이 말은 완전히 요행수로 답안을 써 내도 50점 이상을 받는 경우가 스무번에 한번쯤은 생길 것이라고 예측 된다는 뜻입니다. 이런 것을 감안한다면 무작위적인 결과가 나온 80개의 테스트에 대하여 이러한 무작위 효과를 상쇄시키기 전에는 4개 정도의 결과가 소리의 차이를 감지해낸 것처럼 나올 것이라고 예상할 수 있습니다. 현재의 프로젝트에서는 92개의 테스트 또는 테스트 조합이 분석되었습니다. 그 중에서 통계적으로 유의해보이는 결과는 세개 밖에 없었습니다.
종합 점수의 유의도가 0.05를 넘어서는 청취자는 한 사람도 없었습니다. 다만 한 사람은 0.056에 가까이 간 적이 있었고 반 이상은 50점 이하를 맞았습니다. 두 사람의 청취자는 그들의 답안지 속에 20개의 문항 중 12개를 연속 맞추었습니다. 이러한 일이 일어날 확률은 0.038 입니다. 당신이 여기에 어떤 의미있는 답이 포함되었다고 생각한다면 기껏해야 두개에서 네개 정도일 것입니다.
여덟 명의 청취자가 참가한 한 테스트에서 총점은 확률이 0.046인 것으로 나왔는데 이러한 점수는 0.05보다 좋은 것처럼 보이는 세번째의 유의한 결과로 간주할 수 있습니다. 그러나 같은 조합의 앰프를 가지고 이후에 시행한 테스터에서는 매번 50 점 이하가 나왔고 종합 점수는 유의도가 0.05 보다 훨씬 나빠졌습니다. 어떤 조합의 앰프에 대한 실험에서도 이보다 좋은 점수가 나온 적은 없었습니다. 개별 테스트에서나 테스트 조합에서나 마찬가지였습니다.
분석을 더 진행해보니, ABX 시스템을 사용하여 얻은 결과는 케이블 교환으로 얻은 결과보다 좋지도 않았고 나쁘지도 않았습니다. 그리고 장시간 청취 테스트 결과와 단시간 청취 테스트의 결과도 달라 보이지 않았습니다. 이러한 결과들에 대한 모든 해석은 답안지에 씌어진 정답들이 요행수로 맞춘 것이다-즉 들어서 가려낼 수 있는 음질 차는 없다는 결론을 가리켰습니다.
그러나 이것은 앰프의 음질차 논쟁에 대한 명백한 정답이 되기에는 아직 멀었다고 할 수 있습니다. 예를 들면 테스트 방법의 정당성에 대한 의문은 아직도 남아있습니다. 모든 사람을 완벽히 만족시킬 수 있는 시스템을 구성한다는 것은 불가능하며, 테스트가 끝난 후의 설문지에서 여러명의 청취자는 자신의 마음을 바꾸었다고 썼고 그 시스템 구성에 대한 판단을 보류한다고 하였습니다. 이 사람들은 모두 신봉자였는데 이들은 나름대로의 경험에 의하여?그러한 믿음을 가진 것이며,? 곧 이 일련의 실험의 유효성을 부정하기 시작할 그룹을 대표할 것으로 생각되었습니다.
그럼에도 불구하고, 몇몇의 신봉자들을 포함한 대부분의 청취자들은 시작할 때나 나올 때나 테스트 방법에 대하여 인정을 하였으며 시험 대상으로 선정된 앰프들아 다양한 설계, 가격대에서 선택되었다고 인정하였습니다. 청취자의 표본도 충분히 다양하게 선정되었다고 인정하였습니다. 그리고 그 결과들은 음질 차이가 없다는 것을 가리켰습니다.
여기서 선정된 기기들과 실험 조건에 대해서는 우리의 질문에 대한 해답을 얻었습니다. 그러나 다른 그룹의 앰프들에 대하여 다른 조건에서 시험하면 극적으로 다른 결과가 나올지는 아직 알 수 없는 것입니다.
이것은 그저 시작일 뿐입니다-비교적 광범위했지만 특별히 먼저 시행된 것도 아닌 단 한번의 실험 결과에 대하여 크게 비중을 둘 과학자는 거의 없을 것입니다. 테스트 기술은 개선되어야 하며 개선할 것입니다. 그리고 앞으로 수년간 보다 많은 테스트가 시행되어 보다 많은 데이터가 수집될 것입니다. 독자들이나 오디오 산업 종사자들은 이 시험 방법과 결과들에 대하여 자유롭게 이야기 하고 충고할 수 있습니다. 스테레오리뷰는 언제나 환영합니다.
그러나 지금은, 앰프의 음질 성향이란 것이 존재한다 하더라도 그것을 기준으로 우리가 앰프를 고르기에는 너무나 미약한 것처럼 보입니다. 분명히 앰프들 사이의 차이는 있습니다. 그러나 우리는 아무래도 그런 것을 들을 수 없는 것 같습니다.
--- 본문 끝 ---