작성일 : 17-08-24 13:50
통계적으로 생각하기
 글쓴이 : happy
조회 : 21  

저자 유리 브람|역자 김수환|현암사 |2016.11.30
원제 Thinking Statistically

통계적으로 생각하기


『통계적으로 생각하기』는 통계적 사고방식에 대한 안내서이다. 개념적인 접근 방식으로 수학적·과학적·분석적 사고에 대한 저술과 강연 활동을 활발히 전개해온 저자는, 이 책을 통해 정식으로 통계학을 공부하지 않고도 통계학자처럼 생각하는 법을 알려준다. 책에 소개되는 예시는 매우 일상적이다. 다른 사람들이 무능하다고 생각하는 상사의 근거 없는 자신감을 ‘선택 편향’으로 해석하고, 마크 저커버그를 일반적인 사례로 사용할 수 없는 이유를 ‘내생성’ 문제로 설명하며, 애인이 바람피우고 있는지를 판단하기 위해 ‘베이즈의 정리’를 활용한다.


저자 : 유리 브람
저자 유리 브람은 개념적인 접근 방식으로 수학적·과학적·분석적 사고에 대한 글을 쓴다. 『통계적으로 생각하기』로 베스트셀러 작가가 되었고, 지금은 국제기구 및 기업에서 데이터 사용법과 통계적으로 생각하는 방법에 대해 강연한다.

『통계적으로 생각하기』는 통계 공포증이 있는 독자들을 위해 통계의 핵심 개념들을 재미있고 이해하기 쉽게 설명한다. 《뉴욕 타임스》 베스트셀러 작가인 조시 카우프만은 이 책을 ‘최고의 경제경영서 99권(
THE 99 BEST BUSINESS BOOKS)’ 중 한 권으로 선정했으며, 전 세계 유수의 대학들도 권장 도서 목록에 포함하고 있다.

저자의 다른 저서로는 『게임이론(
THE GAME THEORY)』, 『더 열심히 써라 - 설득력 있고 명확하고 매력적으로 쓰는 법(WRITE HARDER: HOW TO WRITE PERSUASIVE, CLEAR AND CHARMING NON-FICTION)』, 『음악적으로 생각하기(THINKING MUSICALLY)』 등이 있다.

역자 : 김수환
역자 김수환은 미국 미네소타 대학교에서 수학 학사와 응용수학 석사를 마치고, 캐나다 앨버타 대학교에서 통계학 박사 과정을 밟고 있다. 기업체와 잡지 등에서 다년간 번역 관련 일을 했으며, 현재 번역 에이전시 엔터스코리아에서 전문 번역가로 활동하고 있다.

주요 역서로는 『미적분으로 바라본 하루 - 일상 속 어디에나 있는 수학 찾기』, 『달콤새콤, 수학 한 입 - 놀이처럼 접근하는 친근한 수학』 등이 있다.

    

목차

머리말
그건 당신이 아닙니다
희망 사항

제1장 선택 편향 - 왜 사장님만 모를까?
맛있는 복숭아를 골라봅시다
자기 편향적 데이터
도표를 그려 생각해봅시다
추상적인 개념을 그래프로 나타내봅시다
트루먼 대통령과 인구조사
피드백 효과
친구의 이름을 잊었다고요?
성공적인 공연을 축하합니다

제2장 내생성 - 마크 저커버그처럼 대학을 그만두겠다고?
다른 일의 원인이 되는 일들을 살펴봅시다
아주 단순한 내포 공식
오차항을 조심하렴!
누락 변수 편향
평균 학점의 함정
인과관계의 고리
계약 기간 후 보험회사를 바꾼 고객들
빌 게이츠와 마크 저커버그
컨설턴트
사회과학과 자연과학
모든 상관관계가 인과관계를 나타내지는 않는다
상관관계, 인과관계, 내생성

제3장 베이즈의 정리 - 당신의 애인이 바람피우고 있을 확률은?
베이즈의 중요성
베이즈의 공식
동화되는 증거
베이즈의 공식을 그래프로 살펴봅시다
기저율과 예방접종
샐리 클라크의 재판
직장 선택
성 정체성
천재는 흔치 않다
연애 속의 기저율

맺는말
책을 마치며

권장 도서

옮긴이의 말







<출판사 서평>

출판사 서평

정보를 읽어내는 능력이 필요한 시대,
일상에서 더 나은 결정과 판단을
이끌어주는 통계적 사고법!

복잡한 수학 공식 없이
명쾌하게 설명하는 통계의 핵심



이 책은 통계적 사고방식에 대한 안내서이다. 개념적인 접근 방식으로 수학적·과학적·분석적 사고에 대한 저술과 강연 활동을 활발히 전개해온 저자는, 이 책을 통해 정식으로 통계학을 공부하지 않고도 통계학자처럼 생각하는 법을 알려준다. 책에 소개되는 예시는 매우 일상적이다. 다른 사람들이 무능하다고 생각하는 상사의 근거 없는 자신감을 ‘선택 편향’으로 해석하고, 마크 저커버그를 일반적인 사례로 사용할 수 없는 이유를 ‘내생성’ 문제로 설명하며, 애인이 바람피우고 있는지를 판단하기 위해 ‘베이즈의 정리’를 활용한다.
수학을 포기한 인문계 학생, 평범한 직장인 등 누구나 쉽게 이해할 수 있도록 복잡한 수학 공식이나 전문 용어를 사용하지 않고 예시를 통해 이야기하듯 설명한다. 이 책으로 통계학 전반을 이해했다고 할 수는 없어도 일상생활에서 더 좋은 결정과 판단을 내릴 수 있는, 정말 통계적으로 사고할 수 있는 방법을 배울 수 있을 것이다.


통계, 이 정도는 알아야 세상을 제대로 읽는다!
통계와 빅데이터 시대의 필수 입문서


규모를 가늠할 수 없을 정도로 엄청난 양의 정보가 넘쳐나는 빅데이터 시대이다. 그러다 보니 데이터를 저장, 처리, 분석하는 업무를 전문적으로 하는 ‘데이터 과학자’가 유망 직종으로 떠오르고 있다. 데이터 과학자는 《하버드 비즈니스 리뷰》에서 21세기 가장 유망한 직업으로, 세계 최대 직장 평가 사이트인 글래스도어에서 인기 직업 1위로 선정되기도 했다. 구글의 수석 경제학자인 할 배리언이 “향후 10년간 가장 섹시한 직업은 통계학자일 것이다”라고 말한 것도 같은 맥락에서 해석할 수 있다. 데이터 과학은 통계학을 기반으로 하기 때문이다.
우리나라에서도 통계와 빅데이터 시대에 발맞춰 여러 변화들이 일어나고 있다. 서울대에서 자유전공학부의 학생들이 가장 선호하는 전공으로 통계학과가 급부상했고, 여러 기관이나 기업체들도 통계와 빅데이터를 주제로 사내 교육 프로그램을 실시하고 있다.
그런데 다양하고 방대한 규모의 데이터를 해석하여 의미 있는 자원으로 활용하는 능력은 전문가에게만 필요할까? 물론 아니다. 빅데이터 시대에 살아남기 위해서, 더 나아가 남보다 한발 앞서기 위해서는 누구라도 세상을 제대로 보는 눈, 즉 통계적 사고 능력이 필요하다.

여론조사는 제대로 실시되었는가?
결과는 현실을 올바르게 투영하고 있는가?


얼마 전 치러진 제45대 미국 대통령 선거의 결과는 한마디로 대반전이었다. 선거 하루 전까지만 해도 CNN, 《뉴욕 타임스》, 《워싱턴 포스트》 등 대다수의 미국 언론들은 민주당 힐러리 클린턴 후보의 당선 확률을 84~90%로 발표하며 힐러리의 승리를 확신했다. 하지만 일방적인 예상과 달리 대선에서 승리한 후보는 공화당 도널드 트럼프였다. 트럼프의 당선을 예측할 수 없었던 원인 중 하나로 ‘샤이 트럼프’ 현상을 지적한다. 언론사와 여론조사 기관이 트럼프의 부정적 이미지 때문에 공개적으로 자신을 드러내지 못한 트럼프 지지자들이 많다는 것을 읽지 못한 것이다.
1948년 미국 대선에서도 모든 여론조사 기관들이 당선자 예측에 실패했다. 당시로서는 가장 대규모의 과학적 유선 조사를 실시한 후 확신을 가지고 공화당의 승리를 예측했지만 민주당 해리 트루먼이 ‘뜻밖의 승리’를 거둔 것이다. 예측에 실패한 주요 원인은 여론조사 표본의 선택 편향이었다. 당시 유선전화는 공화당을 지지하는 부유한 계층이 주로 소유했기 때문에 여론조사 결과 또한 편향될 수밖에 없었던 것이다.

이 복숭아가 전체 복숭아의 상태를 잘 드러내는가?
일상생활에서 활용할 수 있는 통계적 방법


통계는 대통령 선거 여론조사나 국가의 정책 결정, 기업의 전략 수립에 중요한 영향을 미칠 뿐만 아니라, 일상생활에서 개인의 의사결정을 도와주는 훌륭한 근거로 작용하기도 한다. 일요일 아침 시장에 복숭아를 사러 갈 때, 우리는 자신도 모르는 사이 통계적 사고를 한다. 복숭아를 들어 살짝 찔러도 보고 흔들어도 보고 어디 상한 부분이 없는지 꼼꼼히 확인한 후 복숭아가 좋아 보이면 20개들이 한 박스를 구입한다. 처음 몇 개의 복숭아라는 작은 표본을 이용해 전체 복숭아 모집단의 상태를 추론한 것이다.
통계적으로 생각할 때 좀 더 주의해야 할 점은 처음 몇 개의 복숭아가 무작위로 선택된 것인지를 고려해야 한다는 것이다. 가게 주인이 당신을 다시 찾지 않을 손님으로 생각하고 가장 상태가 좋은 복숭아 몇 개를 보여주어 나머지 복숭아 상태가 안 좋은 것을 속일 수도 있는 것이다. 이와 같은 문제가 바로 비무작위 표본을 무작위 표본인 것처럼 생각하고 사용할 때 발생하는 오류, 즉 선택 편향이다.

수포자(수학포기자)도 평범한 직장인도
누구나 쉽게 이해할 수 있는 개념원리 통계


이처럼 이 책은 일상생활에서 누구라도 한 번쯤은 생각해보았거나 경험해보았을 법한 사건들을 예시로 들어 통계학의 핵심 개념인 선택 편향, 내생성, 베이즈의 정리 등을 설명한다. 평균 학점이 학생의 노력과 학업 능력을 제대로 측정하지 못하는 이유, 아이스크림 판매량과 익사자 수의 상관관계, 친구가 추천한 식당이 맛집일 확률, 전혀 인기가 없을 것 같은 사람이 데이트를 많이 하는 이유 등과 같이 말이다.
하지만 ‘통계’라는 말만 들어도 손사래를 치는 사람이 많다. 복잡한 수학 공식은 말할 것도 없고 표준 편차, 회귀분석, 카이제곱 분석, t 검정 등 듣기만 해도 어렵게 느껴지는 전문 용어들이 통계를 가까이하지 못하게 가로막고 있는 것이다. 저자는 우리가 살아가는 세상을 조사하고 해석하는 데 매우 큰 도움을 주는 통계 개념을 이해하기 위해서 꼭 통계 기술을 배울 필요는 없다고 말한다. 그리고 이 책에서 복잡한 수학 공식이나 전문 용어를 사용하지 않고 이야기를 통해 쉽고 재미있게 통계 개념을 설명한다.

과장, 왜곡, 편향된 정보 바로보기
개인의 미래를 바꿔주는 통계적 사고


통계학도 빅데이터 시대에 맞춰 변화하고 있다. 과거에는 제한된 정보를 가지고 어떻게 하면 좋은 통계적 추론을 이끌어낼 수 있을 것인가를 고민했다면, 현재에는 너무도 많은 정보를 어떻게 정리해야 더 편리하게 사용할 수 있을 것인가로 바뀌었다. 하지만 정보가 많다고 꼭 좋은 것은 아니다. 많은 정보들이 그 목적에 맞게 올바르게 사용되기도 하지만 과장, 왜곡, 편향되어 사용되고 있는 것 또한 현실이다. 정보를 바르게 읽어내는 능력, 즉 통계적 사고가 무엇보다도 중요한 시대인 것이다.
이 책을 읽고 나면 일상생활에서 어떤 정보를 접했을 때 ‘이 정보가 편향되어 있지 않을까?’ 혹은 ‘이 정보의 상관관계와 인과관계를 혼동하여 잘못 생각하고 있지는 않을까?’, ‘혹시 어떤 정보가 누락된 것은 아닐까’라고 생각해볼 수 있을 것이다. 이러한 간단한 사고의 차이가 좀 더 나은 결정과 판단을 내리는 데 결정적인 역할을 하며, 그렇게 조금이라도 더 나은 판단을 내리다 보면 나중에는 개인의 미래에 큰 차이가 발생할 것이다.



<책 속으로>

정식 통계학은 정확하고 세부적인 정보를 가지고 여기서 얻을 수 있는 것을 증명하는 데 목적을 둡니다. 하지만 비공식적 통계학은 우리 삶에서 볼 수 있는 애매하고 일반적인 정보를 가지고 기본적인 통계 개념을 활용해 보편적으로 더 나은 결정과 판단을 내리는 데 목적을 둡니다. 물론 판단이 완벽하지 않아도 좋습니다. 그리고 그 판단을 어떤 수치로 평가할 수도 없죠. 하지만 조금이라도 나은 판단을 계속 내리다 보면 큰 차이가 일어날 겁니다. --- pp.10-11

종종 사장이나 기부자, 학과장이 자신들의 단체에 대해 갖는 인상은 불만이 있는 부하 직원이 볼 때 아주 터무니없기도 합니다. 하지만 사장이 자신에게 자발적으로 전해진 피드백에 기초해 회사에 대한 인상을 갖게 될 때, 표본의 편향을 보정하지 않아 잘못된 추론을 하는 경우가 매우 많습니다. --- p.33

학생들이 스스로 원하는 수업을 고르면, 평균 학점은 노력이나 학습 능력을 평가하기에 매우 부적합한 측정값이 됩니다. 물론 여전히 어떤 한 학생이 수업을 듣고 그 수업에서 좋은 성적을 받는 것은 그 학생의 노력이나 학습 능력과 상당한 연관성을 가집니다. 하지만 그 학생이 자신이 원하는 수업을 고를 수 있다는 점은 그에 반대되는 영향을 미칩니다. 만약 그 학생이 더 쉬운 수업을 고른다면 더 적은 노력으로도 좋은 성적을 받을 수 있겠죠. 그러므로 평균 학점이 노력과 반비례적인 상관관계를 가지게 됩니다. --- p.59

당신의 어머니가 전화로 잘 찾아오지 않는다고 서운해하시면서도 당신이 찾아뵐 때마다 결혼은 언제 하느냐 등의 잔소리를 하신다면, 당신은 어머니가 찾아뵐 때마다 그런 부담을 주셔서 찾아뵙기 부담스럽다고 생각할지도 모르겠군요. 그렇다면 어머님께 “제가 어머니를 찾아뵙지 못하는 이유는 찾아뵐 때마다 부담을 주시는 내생성 문제 때문입니다”라고 말씀드리면 어떨까요? --- p.62

‘상관관계는 인과관계를 나타내지 않는다’의 대표적인 사례로는 익사자의 수가 아이스크림 판매량과 상관관계를 가진다는 유명한 이야기가 있습니다. 아이스크림을 먹은 아이들이 당분을 과다 복용하고 몸을 못 가누어 호수에 빠졌다는 말인가요? 혹은 더 이상하지만 사람들이 물에 빠지면 갑자기 아이스크림을 많이 먹고 싶어지게 되나요? 당연히 둘 다 아니죠. 아이스크림 판매는 여름에 증가하는데, 이 기간 동안 사람들이 물놀이를 더 많이 합니다. 익사자의 수와 아이스크림 판매량 모두 여름의 더운 날씨 때문에 증가하는 거죠. 하지만 직접적으로 상관관계인 것은 아닙니다. --- p.74

어느 날 당신은 집에 일찍 왔다가 몸이 안 좋아 먼저 집에 들어가겠다던 여자 친구가 사실은 전 남자 친구와 저녁을 먹으려고 거짓말한 것을 알게 되었군요. (이런 말 하긴 싫지만 그래도 당신이 알아야 할 것 같네요.) 그녀가 바람피우고 있을 확률은 어떻게 될까요? 더 중요하게, 그녀가 바람피우고 있을 확률을 어떻게 계산할 수 있을까요? 어떤 변수들을 감안해야 할까요? 
--- p.81