본문 바로가기

새빨간 거짓말, 통계

대럴 허프 저 / 박영훈 역 / 더불어책 출판


같은 질문에 전혀 다른 결과를 보여주는 두 개의 통계가 존재하기도 하고,

상식적으로 납득하기 어려운 통계 결과도 드물지 않게 볼 수 있다.

과연 통계가 보여주는 것은 모두 진실일까?

통계의 속임수와 이를 피하는 다섯 가지 열쇠를 이야기한다.


숫자는 거짓말을 하지 않는다고 하지만

알리고 싶은 것은 강조하고 숨기고 싶은 것은 감춰서

결과를 호도하는 그래프나 통계는 적지 않다.

이런 일은 수상쩍은 광고지에서만 벌어지는 일이 아니다.

유력 언론의 기사나 뉴스는 물론, 가끔은 과학 논문에서도 볼 수 있다.

자세히 들여다보고, 생각해보면 감춰진 부분이 보이지만

얼핏 보이는 그대로 받아들이면 진실과는 큰 오차가 생긴다.

이 책은 2004년에 초판이 나왔는데, 지금도 현실은 그리 달라지지 않았다.

통계에 속지 않고 스스로 생각하는 첫걸음을 떼고 싶다면 읽어볼 만한 책.


그렇다면 확실치도 않은 결론에 속지 않는 방법은 무엇일까? 사람들 각자 모두가 통계학자가 되어 통계 숫자의 기초가 된 원래의 데이터를 일일이 조사해야만 한단 말인가? 물론 그렇게까지 할 필요는 없다. 누구나 쉽게 이해할 수 있는 유의판정법이란 것이 있으니까. 어떤 통계 숫자가 우연에 의해 나온 것이 아니라 실제로 그 무엇 때문에 발생하였을 확률이 어느 정도인지를 보여주는 간단한 방법이다. 이 조그마한 숫자만으로는 당신이 이해하지 못할 것이라는 지레짐작으로 이것을 생략하기 일쑤이다.

이것이야말로 내가 보여주고 싶었던 그림이다. 이제 미국 목수의 주급은 로툰디아 목수의 주급에 비해서 어마어마하게 크게 보이니 말이다.
물론 이것이 바로 그 속임수의 술책이다. 미국 목수의 돈자루의 높이는 로툰디아 목수의 돈 자루 높이의 2배인 것은 사실이지만 동시에 그 폭도 2배이다. 따라서 그 넓이는 실제 2배가 아니라 4배이다. 숫자는 2대 1로 되어 있지만 시각적으로는 - 항상 시각적 인상이 모든 판단을 지배한다 - 4대 1이라는 느낌을 준다. 더욱 기가 막힌 것은 실제 그림이 3차원으로 나타나 있기 때문에 높이, 폭뿐만 아니라 두께도 2대 1로 되어 있다. 기하학 책에도 나와 있듯이 서로 닮은 입체의 부피의 비는 대응하는 변의 길이의 비의 세제곱에 비례한다. 2의 세제곱은 8이므로 만약 작은 쪽 돈 자루에 30달러가 들어간다면 큰 쪽 돈 자루는 부피가 8배이므로 60달러가 아닌 240달러가 들어가 있어야만 한다.
기발한 독창성을 발휘한 도표는 바로 이를 노린 것이다. 말로는 그저 2배라고 얼버무리면서도 실제로는 8배라는 엄청난 인상을 심어놓는 것이다.
그렇다 하더라도 당신은 내가 사기꾼 노릇을 했다고 비난할 수 없을 것이다. 나는 단지 수없이 많은 사람들이 해 왔던 것을 흉내냈을 따름이다. <뉴스위크>지도 돈 자루를 이용해서 이 기법을 써먹었으니 말이다.
당신이 심혈을 기울여 개발한 약이 감기 치료약으로 효용 있음을 증명할 수는 없다 하더라도, 단 10g의 약만 있으면 시험관 내에 들어 있는 세균을 11초 만에 31,108개나 죽일 수 있다는 확실한 실험실의 연구보고를 대문짝만 한 활자로 발표할 수는 있다.
어떤 숫자이건 간에 그것을 표현하는 방법은 여러 가지가 있다. 똑같은 사업실적이라도 이를 매출실적의 1%의 이익이라든가, 투자액의 15% 이익, 또는 1천만 달러의 이윤이라든가, 40%의 이익신장률, 또는 전년도 대비 이익의 60% 감소라든지 여러 가지 방식으로 얼마든지 표현할 수가 있다. 이 많은 표현 방법 중에서 원하는 목적에 가장 알맞은 것을 골라 쓰면 되는 것이다. 게다가 이 숫자가 실상을 옳게 반영하는 것이 아니라는 사실을 간파하는 사람은 거의 없다고 믿어도 좋다.
셋째 열쇠: 빠진 데이터는 없는지 숨겨진 자료를 찾아 보아야 한다.
비교할 다른 숫자가 빠져 있기 때문에 아무런 의미가 없는 숫자들이 많다. (중략)
때때로 백분율만 발표하고 실제 숫자는 빠져 있는 경우도 있는데, 이것도 일종의 속임수이다.
다섯째 열쇠: 상식적으로 말이 되는 이야기인가 살펴 봐야한다. 석연치 않은 부분은 조사해라.