29 분 소요

제3장

휴리스틱과 바이어스

‘직감’의 기능


“세계가 확률의 법칙에 따르는 것은 분명하다. 하지만 우리들의 마음은 확률의 법칙을 기초로 작동하도록 만들어져 있지 않다.”

스티븐 제이 굴드(Stephen Jay Gould) 《힘내라 천둥용》

“더 위대한 사람이란 자기 자신의 판단을 최대한 믿을 수 있는 사람이다. 더 바보 같은 사람도 마찬가지지만.”

폴 발레리(Paul Valéry) 《발레리 선집(選集)》


휴리스틱이란 무엇인가

휴리스틱(heuristic)은, 문제를 해결하거나 불확실한 사항에 대해 판단을 내릴 필요가 있지만 명확한 실마리가 없을 경우에 사용하는 편의적·발견적인 방법이다. 우리말로는 쉬운 방법, 간편법, 발견법, 어림셈, 또는 지름길 등으로 표현할 수 있다.

1905년 알베르트 아인슈타인은 노벨 물리학상 수상 논문에서 휴리스틱을 ‘불완전하지만 도움이 되는 방법’이라는 의미로 사용했다. 저명한 수학자인 폴리아(G. Polya)는 휴리스틱을 ‘발견에 도움이 된다’는 의미로 사용했고, 수학적인 문제 해결에도 휴리스틱 방법이 매우 유효하다고 했다.

휴리스틱에 대비되는 것이 알고리즘(algorithm)이다. 알고리즘은 일정한 순서대로 풀어나가면 정확한 해답을 얻을 수 있는 방법이다. 삼각형의 면적을 구하는 공식이 알고리즘의 좋은 예다. ‘(밑변×높이)÷2’라는 공식에 대입하면 삼각형의 면적은 반드시 구할 수 있다. ‘급할수록 돌아가라’(급히 먹는 밥에 목이 멘다)라는 속담이 휴리스틱이며, 일상생활에서 도움이 되는 진리를 담고 있다.

휴리스틱을 이용하는 방법은 거의 모든 경우에 어느 정도 만족스럽고, 경우에 따라서는 완전한 답을 재빨리, 그것도 큰 노력 없이 얻을 수 있다는 점에서 사이먼의 ‘만족화’ 원리와 일치하는 사고방식이다. 그러나 휴리스틱은 완전한 해답이 아니므로 때로는 터무니없는 실수를 자아내는 원인이 되기도 한다.

불확실한 의사 결정을 이론화하기 위해서는 확률이 필요하기 때문에 사람들이 확률을 어떻게 다루는지가 중요하다.

확률은, 이를테면 어떤 사람이 선거에 당선될지, 경기가 좋아질지, 시합에서 어느 편이 우승할지 따위를 ‘전망’할 때 이용된다. 대개 그러한 확률은 어떤 근거를 기초로 객관적인 판단을 내리기도 하지만, 대부분은 직감적으로 판단을 내리게 된다. 직감적인 판단에서 나오는 주관적인 확률은 과연 정확한 것일까?

카너먼과 트버스키는 일련의 연구를 통해 인간이 확률이나 빈도를 판단할 때 몇 가지 휴리스틱을 이용하지만, 그에 따라 얻어지는 판단은 객관적이며 올바른 평가와 상당한 차이가 있다는 의미로 종종 ‘바이어스’가 동반되는 것을 확인했다.

이용 가능성 휴리스틱(Availability Heuristic)

휴리스틱의 가장 큰 특징은 ‘이용 가능성(availability heuristic)’이다. 이용 가능성이란 어떤 사상(事象, event)이 출현하는 빈도나 확률을 판단할 때, 그 사상(事象)이 발생했다고 쉽게 알 수 있는 사례(최근의 사례, 현저한 예 등)를 생각해내고 그것을 기초로 판단하는 것을 뜻한다.

이때 중요한 역할을 담당하는 것이 기억, 특히 장기 기억이다. 저장된 기억으로부터 바로 사용할 수 있는 사례가 떠오르고, 그 사례에 따라 판단하는 것이 이용 가능성 휴리스틱이다.

기억한 내용이 다양한 원인의 영향을 받아 변하거나, 일부밖에 기억하지 못하는 일을 일상에서 자주 경험한다. 이때 머리에 쉽게 떠오르는 기억이 반드시 그 대상의 빈도나 확률을 올바르게 나타내지 못할 경우 바이어스가 생기게 된다.

트버스키와 카너먼은 실험 대상자에게 다음과 같은 질문을 했다.

소설의 4쪽 분량(약 2,000어)에서 7문자로 된 단어 중 어미가 ing로 끝나는 것은 몇 개인가?

소설 4쪽 분량(약 2,000어)에서 7문자로 된 단어 중 여섯째 자리 문자가 n인 것은 몇 개인가?

①번에서는 평균 13.4개, ②번에서는 4.7개라는 반응이 나타났다.

답변자가, ‘ing’로 끝나는 단어가 여섯째 문자가 n인 단어보다 많다고 추측한 것은, 전자 쪽의 단어(예를 들면 running, evening)를 생각해내기 쉽기 때문이다(즉 기억 인출이 용이하다). 그러나 ①번에 적합한 단어는 당연히 ②번 조건을 채우고 있고, 반대로 ②번을 만족하고 있지만 ①번을 만족하지 않는 예(day long, payment)가 많기 때문에 반드시 ②번 단어 수가 많다. 그러나 답변자의 대답은 그 반대였다.

이 실험 결과는 확률이 만족해야 할 성질 중에서 결합법칙(複合法則, compound event)에 반하는 것이다. 즉 A, B를 2개의 사상(事象)으로 하면 A인 동시에 B가 생길 확률은 A가 생길 확률과 B가 생길 확률의 어느 쪽보다도 클 수 없다. 예를 들어 집을 나올 때 맨 처음 만난 사람이 안경 낀 여성일 확률은, 맨 처음에 만난 사람이 각각 여성일 확률과 안경 낀 사람일 확률보다 높을 수는 없기 때문이다. 이 때문에 이런 바이어스는 종종 결합 오류(conjunction fallacy)로 불리며, 확률에 관한 바이어스 중에서 가장 많이 발생한다고 한다.

세일러 역시 이용 가능성에서 발생하는 바이어스의 사례에 대해 보고하고 있다. 미국에 사는 사람들에게 자살과 타살, 어느 쪽이 많을 것 같으냐고 물으면 대부분은 타살이라고 대답한다고 한다. 이 바이어스도 이용 가능성이 원인이다.

타살 사건 기사는 매스컴을 통해 매일 보고 듣기 때문에 곧바로 머리에 떠오르지만, 자살은 짐작하기가 쉽지 않고 매스컴에 보도되는 기사도 타살에 비해 훨씬 적다. 세일러가 조사한 바로는 1983년 미국에서 발생한 자살 건수는 연간 27,300명, 타살 건수는 20,400명이라고 한다. 최근 일본에서는 자살 증가가 사회문제로 떠올라 매스컴 보도가 많아졌기 때문에 이 같은 착오는 발생하지 않을 것이다.

미디어나 새로운 친구, 가족, 권력자 등에게서 초래된 정보와, 자신의 감정에 호소하는 일 등은 깊은 인상을 주어 기억에 남기 쉽고, 정보의 신뢰성으로 사건이 발생할 확률이 높다고 판단한다.

최근 큰 지진이 빈발하고 있는데 대지진 직후에는 화재예방 도구를 구입하는 사람이나, 지진 보험 가입자가 증가하는 것으로 잘 알려져 있다. 일본에서는 광우병에 감염된 소가 발견된 직후에 소고기 기피 소동이 발생했다. 이는 이용 가능성 휴리스틱이 확률의 추측을 증가시켜 행동을 변화시킨 예다.

이미지화 용이성

이용 가능성을 발생시키는 요인 중 하나로서 어떤 사태나 사건이 실제로 쉽게 이미지화되어 떠오를 때가 있다.

셔먼은 이와 관련해 흥미로운 실험을 했다. 여대생 120명에게 가상으로 학교 내에서 어떤 병이 만연할 조짐이 있으니 이 병의 증상에 대해 적어놓은 종이를 읽고 자신이 이 병에 걸릴 가능성 정도를 판단하도록 하였다.

실험 대상 학생들은 4개 그룹으로 편성되었다. 1그룹에 속한 학생들에게는 이 병에 걸리면 활력 저하, 근육통, 점차 심한 두통이 일어나는 등의 증상에 대해 구체적이고, 이전에 경험했을 법한 내용이 적힌 종이가 건네졌다. 2그룹에 속한 학생들에게는 훨씬 더 추상적인 내용이 적힌 종이를 읽게 했다. 메시지 내용은 약간의 방향감각 상실, 신경계 기능 불완전, 간장의 염증 등이었다. 그리고 실험 참가자는 증상을 읽고 난 후 자신이 3주 후에 이 병에 걸릴 수 있는 정도를 10단계로 평가하게 했다.

3그룹과 4그룹에 속한 학생들에게는, 증상은 1·2그룹과 각각 같지만, 만약 이 병에 걸린다면 3주 뒤에 자신에게 어떤 증상이 나타날지 구체적으로 머릿속에 그리고 난 후 이 병에 걸릴 정도를 판정하도록 요구했다.

그 결과, 이 병에 걸릴 가능성이 가장 높을 것이라고 판단한 그룹은 3그룹에 속한 학생들이었고, 다음은 2그룹, 1그룹이었다. 4그룹이 병에 걸릴 수 있는 정도를 가장 낮게 판정했다. 증상에 대한 기술 내용이 구체적이어서 스스로 병에 걸릴 수 있다는 이미지를 떠올린 그룹이 가장 병에 걸리기 쉽다고 생각한 것이다. 반면에 증상이 애매해서 자신이 병에 걸릴 수 있다는 이미지를 떠올리기 어려운 그룹은 가장 병에 걸리지 않는다고 판단한 것이다.

흡연이나 음주 등의 습관을 끊기 어려운 것은 행위 시점과 그에 따른 결과가 나타나는 시점이 시간적으로 큰 격차를 보이기 때문이다. 즉 행위를 하는 시점에서는 오랜 시간이 지난 후 어떤 결과를 가져올지 상상하기 어렵다는 것이 그 원인 가운데 하나인 셈이다. 따라서 정책적으로 금연 캠페인을 추진한다면, 흡연이 암에 걸릴 확률을 높인다고 주장하기보다는 암에 걸려서 비참해진 사례를 어필하는 캠페인이 더 효과적일 것이다. 운전면허증을 재발급 받을 때 교통사고 현장에 대한 모의 비디오를 보여주는 경우가 많은데 이 방법은 사고 확률을 수치로 나타내는 것보다 유효하다.

또한 이용 가능성 휴리스틱은 사람들이 사회적인 정보를 전달하는 방식이나, 학습하는 방식에 영향을 줄 가능성이 있다. 입수하기 쉬운 정보는 사람들에게 전달되기 쉽고, 이에 따라 어떤 생각이나 판단이 사회에 넓게 확산될 수 있다. 특히 인터넷의 보급에 따라 그 속도가 빨라지고 있다.

사후 판단 바이어스(Hindsight Bias)

이용 가능성 휴리스틱이 일으키는 바이어스 가운데 하나가 ‘사후 판단 바이어스(hindsight bias)’다(뒤에서 설명하는 기준점(anchoring) 효과로 생각할 수도 있다). 우리는 일이 벌어진 뒤에 “그렇게 될 줄 알았어”, “그렇게 될 거라고 처음부터 알고 있었어”와 같은 말을 자주 한다. 이렇게 결과를 알고 나서 마치 사전에 그것을 예견하고 있었던 것처럼 생각하는 바이어스를 사후 판단 편향이라고 한다.

폴의 실험에서는 실험 참가자 46명에게 애거사 크리스티(Agatha Christie)가 책을 몇 권이나 썼는지 추정해보게 했다. 그들이 추정한 평균치는 51권이었다. 나중에 실험 참가자에게 정답(67권)을 알려주고 자신이 원래 예상한 권수를 말해보라고 했더니 평균치는 63권으로 상승했다. 즉 결과를 안 뒤에는 자신이 정답에 더 가까운 예측을 했다고 생각하는 사람이 많았다. 사후 판단 편향은 이용 가능성 휴리스틱에 의해 발생한다. 어떤 사건이 발생한 후에는 그 일이 사실처럼 인상에 남게 되고, 거기서 사전에 예측한 가치를 과대평가하는 것이다.

어떤 주식 종목이 하락한 후에 “이렇게 될 줄 알았는데 다른 주식에 투자했으면 좋았을 텐데”, “주식에 문외한인 나조차도 그럴 거라 예상했는데 주식을 추천한 증권회사 전문가는 당연히 알고 있었겠지”라는 식으로 생각하게 되면 소송으로까지 발전할지도 모른다. 또는 좋아 보이는 물건을 싸게 살 수 있어서 기분이 좋았는데 실제로는 조잡한 상품이었을 때, “싼 게 비지떡이지”라고 생각하는 것도 사후 판단 편향의 한 예다.

대표성 휴리스틱(Representative Heuristic)

사람들이 자주 사용하는 또 다른 휴리스틱으로는 ‘대표성 휴리스틱(representative heuristic)’을 들 수 있다. 이것은 어떤 집합에 속하는 사상(事象)이 그 집합의 특성을 그대로 나타낸다는 뜻에서 ‘대표한다’고 간주해 빈도와 확률을 판단하는 방법이다. 이것은 어떤 사상(事象)이 그것이 속한 집합과 ‘유사하다’고 생각하는 것으로 바꿔 말할 수 있다. 그 집합이 지닌 특성과 실제 사상(事象)이 지닌 특성의 관련성이 많지 않을 때에는 다양한 바이어스가 발생하게 된다.

트버스키와 카너먼이 실험한 예를 살펴보자.

4면이 초록색, 2면이 붉은색인 주사위가 있다. 이 주사위를 몇 번 던질 경우, 다음 예 3개 가운데 어느 것이 가장 발생하기 쉬운가? G는 초록색 면, R은 붉은색 면을 나타낸다.

RGRRR

GRGRRR

GRRRRR

많은 사람들이 ②번을 선택했다. 그다음은 ①번이며, ③번을 선택한 사람은 극소수에 불과했다. 달리 말하면, ②번이 가장 일어나기 쉬운, 즉 주사위 면의 출현 빈도로서 ‘대표적’이라고 판단했기 때문이다. 그런데 ②번은 ①번 앞에 G를 첨가한 것이기 때문에 ①번이 ②번보다 출현 빈도가 높다고 보아야 한다. 이 예에서도 결합 오류(71쪽 참조)가 발생하고 있다.

어느 마을에 크고 작은 병원이 2개 있다. 큰 병원에서는 하루에 평균 45명, 작은 병원에서는 15명이 태어난다. 당연히 50%가 남자 아기다. 그러나 정확한 비율은 매일 다르며, 남아가 50%보다 많은 날도 있고 적은 날도 있다. 남아가 60% 이상 태어난 일수는 1년 동안 큰 병원과 작은 병원 중 어느 쪽이 많을까?

카너먼의 실험에서는 큰 병원이라는 답이 21%, 작은 병원이 21%, 거의 같다고 대답한 사람이 53%였다. 확률 이론을 기초로 정답을 계산하면 큰 병원에서는 약 27일, 작은 병원에서는 약 55일이 된다. 표본이 크다면 모집단의 평균치(50%)에 가까운 수치를 얻을 수 있는 것이 일반적이다.

이처럼 표본이 큰 쪽이 모집단의 성격을 더 잘 나타내고 있다는 법칙이 ‘대수의 법칙(the law of large numbers)’이며, 확률 이론의 기본 정리 중 하나다. 예를 들면 정육면체인 주사위를 던질 때 나오는 면은 던지는 횟수가 적을 때에는 특정 면으로 치우치지만, 많이 던지면 던질수록 어느 한 면이 나오는 비율은 모두 $1/6$에 가까워진다.

이 사례의 잘못은, 남자 아기의 출생률이 50%인 것이 ‘대표성(representativeness)’을 지닌 수치이므로 그것을 병원의 크기(표본의 크기)와 무관한 것으로 적용했기 때문에 발생했다. 즉 크기가 작은 표본일지라도 모집단의 성격을 대표한다고 여기는 바이어스로서, 이것을 ‘소수의 법칙(the law of small numbers)’이라 부른다.

도박사의 오류(Gambler’s Fallacy)

트버스키와 카너먼이 ‘휴리스틱과 바이어스’ 연구 프로그램을 실시한 계기는 수리심리학자나 통계학자와 같은 전문가들조차 때로는 소수의 법칙이 불러온 착각에 빠져버린다는 사실을 알고부터였다고 한다.

교사들은 대체로 한 반에 성적이 좋은 학생에서 나쁜 학생까지 일정하게 분포돼 있다고 생각하는 경향이 있다. 매주 주가를 예측하는 애널리스트가 3주 연속 예측을 적중시키면 뛰어난 애널리스트라고 판단하거나, 반대로 3주 연속 예측이 빗나가면 무능하다고 판단하기 십상이다. 하지만 그 사실만으로 애널리스트의 우열을 판단하는 것은 경솔한 생각이다. 이것은 소수의 법칙에 따라 바이어스가 생긴 예다.

마찬가지로 동전을 20번 던지는 동안 5번 연속 앞면이 나오면, 다음은 뒷면이 나올 확률이 높다고 판단해버리는 것도 똑같은 오류다. 이 사례를 ‘도박사의 오류(gambler’s fallacy)’라고 한다. 시즌 2할 5푼을 친 타자가 어떤 시합에서 3타수 무안타를 기록했다고 해서 해설자가 “확률로 보더라도 다음 타석에서는 안타가 나올 것”이라고 말하는 것도 도박사의 오류를 보여주는 한 예다.

평균으로의 회귀(Regression to the Mean)

프로야구에서 선발 타자로 막 승격한 신인 선수가 3안타를 치고, 명타자 이치로가 같은 날 무안타를 기록하는 일도 있을 수 있다. 이것만으로 이 신인 선수가 우수하고 이치로는 무능하다고 판단한다면 이내 잘못된 판단이라는 것을 알 수 있다. 장기적으로 보면 신인 선수는 타율 2할 3푼을, 이치로는 3할 이상을 기록할 수 있다. 어느 특정 일에 이 신인 선수가 이치로보다 높은 성적을 기록했다고 하더라도, 다른 날 벌인 경기에서는 이날처럼 실력이 뛰어나지 않다는 사실을 점차 알 수 있게 될 것이다.

비록 단기적으로는 타율이 오르락내리락해도 대수의 법칙에 따라 장기적으로는 평균치(타율)로 수렴한다. 이런 현상을 ‘평균으로의 회귀(regression to the mean, regression effect)’라고 한다.

평균으로의 회귀를 무시하는 것도 소수의 법칙에 따른 착오다. 단 한 경기라는 작은 샘플로 실력을 평가해버리는 착오다. 2005년 시즌에서 99패로 최하위를 기록했던 라쿠텐(樂天) 골든이글스조차 주니치 드래곤스에 3연승을 한 적이 있다. 단기 데이터만으로 실력을 추측하는 일은 잘못된 생각이다.

프로야구계에는 ‘2년 차 징크스’란 게 있다. 데뷔 첫해에 활약이 두드러졌던 선수는 2년 차에 성적이 떨어진다는 징크스다. 그 원인으로, 1년 차 시절에는 열심히 노력해 성적이 좋았으나 2년 차에는 자만심 때문에 게으름을 피운 탓이라든지, 2년 차에는 상대 투수가 경계해 까다로운 공을 많이 던져서 전년도에 비해 타율을 높이기 어려워졌다든지 따위를 들 수 있다. 이런 요인을 완전히 부정하는 것은 아니지만, 평균으로의 회귀로 생각하는 것이 타당하다.

1년 차에 성적이 좋은 선수는 2년 차에 떨어지고, 그 반대인 경우에는 2년 차에서 성적이 향상되는 것이 일반적이다. 2년 차에서 전년도만큼 좋은 성적을 유지하거나, 더 끌어올리는 선수는 그만큼 실력을 갖추고 있다는 뜻이다. 단, 이 경우에는 2년 차 징크스와는 무관하다고 할 수 있다.

교사들은 학생의 실력을 단 한 번 치른 시험 성적으로 판단하는 경향이 가끔 있다. 중간고사에서 성적이 우수한 학생이 기말고사에서 성적이 떨어지면 태만했기 때문이라고 추측하고, 반대로 중간고사 성적이 나빴더라도 기말고사에서 성적이 좋아지면 열심히 노력했기 때문이라고 결론을 내리고 싶겠지만, 사실은 이것도 평균으로의 회귀로 설명할 수 있다.

카너먼은 한때 군대에서 근무한 경험이 있는데 여기서 그는 비행 훈련과 관련된 실험을 했다. 전투기 조종 훈련에서 훌륭한 곡예비행을 한 훈련생을 칭찬하면 다음 비행에서는 별로 잘하지 못하고, 반대로 비행을 잘하지 못한 훈련생을 야단치면 다음에는 실력이 나아지는 경우가 많았다. 이 사실로 미루어 ‘칭찬하면 성적은 악화되고 꾸중하면 성적은 올라간다’는 법칙을 도출해낸 교관이 있었다.

하지만 교육학이나 심리학 연구에서는 이 법칙을 부정하고 있다. 그 교관이 도출한 법칙은 평균으로의 회귀를 착각한 좋은 사례라 할 수 있다. 바로 이런 점에서 ‘평균으로의 회귀’는 학교와 기업에서 성적이나 업무를 평가할 때, 또는 학생이나 종업원에게 동기를 부여할 때 어떻게 해야 하는지 시사하는 바가 매우 크다.

기저율을 무시한 믿음

대표성 휴리스틱에서 파생된 둘째 바이어스가 제1·2장에서 검토한 확률 판단에서 기저율(base rate)을 무시 또는 과소평가하는 현상이다. 심각한 병에 감염되었는지 여부를 조사할 때 양성반응이 나오더라도 그 병이 매우 희귀한 병이고 조사의 신뢰성이 100%가 아닌 한 감염되지 않을 가능성은 직감적인 예상보다 훨씬 높다. 병에 걸릴 확률은 그 병의 발생률에 의존하기 때문에 기저율은 무시할 수 없다.

그런데도 사람들은 감염 조사에서 양성반응이 나오면 바로 그 병에 걸렸음을 ‘대표하고’ 있다고 생각해버린다. 설령 기저율을 고려했다손 치더라도 양성이라는 사실만을 근거로 기저율이 무시되기 일쑤다. 그 결과 자신이 그 병에 감염됐을 거라고 과민하게 믿어버린다. 마찬가지로 한밤중에 길거리에서 눈이 나쁜 사람 앞에 위아래로 검은색 양복을 입고 갑자기 나타나면, 눈이 나쁜 사람은 상대방이 도둑이나 범죄자가 아닐까 생각하게 된다. 검은색 계열의 옷이 도둑을 ‘대표’하는 듯한 옷차림이기 때문이다. 그러나 그 직감이 옳다고 할 수는 없다. 범죄자의 일반적인 존재 비율(기저율)을 고려하면 그 사람이 범죄자일 확률은 직감적 판단보다 낮게 평가해야만 한다.

경찰청 발표를 보면 교통사고로 죽은 보행자 가운데 약 50%는 피해자의 집 주변에서 사고를 당했다고 한다. 따라서 ‘가능한 한 멀리 외출하는 게 안전하다’고 한다면, 그 주장은 뭔가 이상하게 느껴지지 않겠는가? 해답은 독자의 생각에 맡긴다.

어느 잡지에서 읽은 기사 중에 이런 구절이 있었다. “일기를 쓰는 게 성공의 비결!”, “회사 사장들을 인터뷰했는데 그들 중 70%가 매일 일기를 쓰고 있었다. 일기를 쓰고 그날 있었던 일을 돌아보고 반성하거나 결의를 새롭게 하는 것이 성공으로 가는 지름길이다.” 이 기사를 읽고 “나도 오늘부터 일기를 써야지!”라고 생각한 사람이 있을지도 모른다.

다음은 필자가 생각해낸 것이다. 여러분은 어떻게 생각하는가?

“회사 사장들을 인터뷰했더니 그들 중 90%가 매일 이를 닦고 있었다. 이를 튼튼히 보존하면 운명이 걸린 결정적 승부에서 이길 수 있다. 또한 그들은 한창 일할 때 이를 악물고 열심히 노력했기 때문에 성공을 거머쥐었다. 이를 닦는 것이 성공의 기초!”

이런 경우도 있을 수 있다. 기업체 대표들은 장남이 가장 많다고 해보자. “난 차남이니까 사장이 될 가능성이 낮아”라고 결론을 내린 사람에게 뭐라고 위로하면 좋을까?

기준점과 조정(Anchoring and Adjustment)

트버스키와 카너먼이 셋째 휴리스틱으로 제시한 것이 ‘기준점과 조정(anchoring and adjustment)’이다.

불확실한 사상(事象)에 대해 예측할 때 처음에 어떤 가치(기준점, 닻)를 설정하고, 그 다음 단계로 조정을 통해 최종적인 예측치를 확정하는 것이 ‘기준점과 조정’이라는 휴리스틱이다. 그러나 조정 단계에서 최종적인 예측치가 맨 처음 설정한 가치에 휘말려 충분한 조정을 할 수 없게 됨으로써 바이어스가 발생할 수 있다.

이러한 바이어스를 기준점 효과라 부른다. 닻(anchor)을 내리면 닻과 배를 연결하는 밧줄 길이 한도에서만 움직일 수 있듯이, 움직이는 범위가 닻의 위치에 따라 한정되는 것을 비유한 용어다. 기준점이 되는 최초의 가치는 스스로 생각하고 선택하는 경우도 있고, 문제와는 무관하게 외부에서 부여되는 경우도 있다.

카너먼과 트버스키는 ‘$8 \times 7 \times 6 \times 5 \times 4 \times 3 \times 2 \times 1$’이 얼마인가라는 질문에 즉답하도록 하는 실험을 했다. 답변 평균치는 2,250이었다. 또 다른 실험 참가자에게는 거꾸로 ‘$1 \times 2 \times 3 \times 4 \times 5 \times 6 \times 7 \times 8$’이 얼마인지 질문했다. 놀랍게도 이번에는 512가 답변 평균치였다. 정답은 물론 양쪽 모두 40,320이다.

이것은 암산할 때 처음 몇 개 항목만 계산해서 기준점으로 정하고 나머지 부분을 적당히 어림짐작으로 최종적인 예측치를 내기 위한 ‘조정’을 하게 되는데, 이 과정에서 조정이 불충분하기 때문에 부정확한 결과가 나온 것이다. 이때 예측치는 전자처럼 큰 숫자부터 시작될 경우에는 더 크게, 후자처럼 작은 숫자부터 시작하는 순서일 때에는 더 작아지게 된다. 이 예에서 기준점은 맨 처음 숫자 몇 개를 곱한 형태로 저절로 정해진다.

또 카너먼과 트버스키는 UN 가맹국 중 아프리카 나라들이 차지하는 비율을 묻는 실험을 실시하기도 했다. 우선 이 질문을 하기 전에 실험 참가자들 앞에서 룰렛처럼 1부터 100까지 숫자가 적힌 원반을 돌려 해당된 숫자 하나를 지정했다. 실험 참가자에게는 정답이 룰렛에서 나온 숫자보다 큰지 작은지를 먼저 답변한 후에 나라 수를 말하도록 했다. 재미있는 것은 맨 처음 룰렛 숫자가 10일 때 답변 평균치는 25, 맨 처음 룰렛 숫자가 65일 때에는 답변 평균치가 45였다. 이 실험을 통해 완전히 무작위로 추출돼 문제와 전혀 무관한 숫자일지라도 답변에 큰 영향을 끼친다는 사실이 밝혀졌다.

필자 역시 이 현상을 확인하기 위해 학생들에게 우선 비슷한 문제를 보여준 다음에 각자의 학생 번호 끝자리 두 숫자를 쓰게 하고 나서 문제의 답변을 요구한 적이 있다. 학생 번호 뒤쪽의 두 자리 숫자는 분명히 이 문제와는 관련이 없었다. 학생 번호와 답변하는 숫자의 크기는 전혀 관련성이 보이지 않는다. 제시 순서를 바꿨을 뿐인데도, 학생 번호의 기준점 기능이 소멸된 것이다. 이와는 반대로 문제를 생각하기 전에 룰렛처럼 외부에서 무의미하고 무작위로 부여된 숫자를 보여주면, 그 후에 실험 참가자가 생각하는 최종적인 예측치는 최초의 기준점에 영향을 받는다.

기준점 효과는 판단이나 결정을 할 때 매우 광범위하게 나타나며, 기준점의 영향이 강하기 때문에 그것을 제거하기가 쉽지 않다는 지적이 있다.

물건을 구매할 때 상품 가치를 기초로 한 적정한 가격을 알 수는 없다. 대부분은 정가나 정찰가격 표시를 보고 타당한 가격을 판단한다. 상점에서 희망 소매가격 25,000원, 판매 가격 23,000원이라는 표시를 자주 볼 수 있다.

이때 희망 소매가격이 기준점이기 때문에 판매 가격은 싸게 느껴진다. 또한 물건을 팔고자 할 때는 타협할 수 있는 가격보다 높은 금액을 제시하고, 사고 싶을 때는 낮은 금액을 제시하는 것은 교섭 기술에서 초보적인 기술에 불과하다. 이런 기술은 기준점 효과를 모르더라도 자연스럽게 사용되고 있다.

재무관리 전문가 로버트 실러(Robert Shiller)는 기준점 효과가 주식시장에 초래하는 영향에 대해 서술한 바 있다. 주가는 경제나 기업의 근원적인 펀더멘털(Fundamentals)을 토대로 결정된다는 것이 일반적인 재무관리 이론의 주장이다. 그러나 투자자는 적정 주가 수준을 알지 못할 뿐만 아니라, 제한된 합리성 때문에 더더욱 알 수가 없다. 투자자들은 주식 매매에 관해 얼마간의 기준점을 단서로 삼아 판단한다고 한다. 일본 경제에서 대표적인 기준점은 투자자가 판단 기준으로 삼은 수치인데, 그것은 그들 기억 속에 남아 있는 가장 새로운 주가나 도쿄증권의 평균(TOPIX), 또는 닛케이(NIKKEI) 평균으로 잘 알려진 주가지수 등이다. 그밖에 종목별 최근 주가, 주가수익률도 기준점이 될 수 있다.

전문가도 유혹당한다

일반인뿐만 아니라 전문가도 기준점에 좌우된다는 실험 결과를 노스크래프트(G. B. Northcraft)와 닐(M. A. Neale)이 밝혀냈다. 그들은 전문가와 비전문가로 구성된 실험 참가자에게 주택 판매 가격을 어림잡는 작업을 하도록 하였다.

우선 실험 참가자들에게 판매 대상 주택을 점검하게 하고, 주택의 상세 정보와 근린 주택의 가격을 포함한 기타 정보가 기재된 10쪽짜리 팸플릿을 주었다. 또한 실험 참가자를 4개 그룹으로 나누어, 각 그룹마다에 각기 다른 희망 판매 가격을 제시했다. 가장 적은 희망 판매 가격은 119,900달러, 가장 높은 희망 판매 가격은 149,900달러였다. 실험 참가자에게 추천 판매 가격과 구입할 경우의 구입 가격에 대한 견적을 제출토록 했다.

그 결과 부동산 매매 전문가들인 실험 참가자 중 낮은 희망 판매 가격이 제시된 사람들의 가격 평균치는 114,204달러, 판매 가격은 117,745달러, 구입 가격은 111,454달러였다. 한편 높은 희망 판매 가격이 제시된 실험 참가자들의 가격 평균치는 128,754달러, 판매 가격은 130,981달러, 구입 가격은 127,318달러였다. 일반인들의 견적도 비슷한 경향을 보였다.

이 차이는 기준점 효과로밖에는 설명할 수 없다. 실험 후 실험 참가자에게 견적을 낼 때 어떤 정보를 중시했는지 3가지를 적도록 했더니, 제시된 희망 판매 가격이라는 대답은 전문가 중에서 겨우 8%, 비전문가 중에서는 단 9%에 불과했다.

그뿐인가. 가장 신중해야 할 재판정의 판사조차 기준점 효과의 영향을 한다는 사실도 실험으로 확인했다. 잉그리치(B. Englich)가 실험한 결과를 보면, 경험이 풍부한 판사라도 판결이 구형(求刑: 검사가 어떤 형벌을 피고인에게 내리라고 판사에게 요구하는 것)의 영향을 받아, 동일 사건임에도 구형량이 34개월일 때와 12개월일 때 판결에서는 8개월이나 차이가 났다고 한다. 게다가 구형은 법률 문외한인 컴퓨터를 전공하는 학생이 했다는 것이다. 기준점 효과란 이처럼 무시무시하다!

기준점 효과에서 확증 바이어스가 발생한다. 확증 바이어스란 일단 자신의 의사나 태도를 결정하면 그것을 뒷받침할 정보만을 모아 반대 정보를 무시하거나, 이 정보를 자신의 의견이나 태도를 보강하는 정보로 해석하는 바이어스를 말한다.

확증 바이어스에서는 자신을 과대평가하거나 과소평가하는 경향이 발생하는 사실도 알 수 있다. 카너먼과 트버스키가 주장한 것은 세 가지 휴리스틱과 그 결과로 발생하는 바이어스였다.

이외에도 사람들이 판단이나 결정을 내릴 때 휴리스틱을 사용하거나, 다양한 원인들로 많은 바이어스가 발생한다는 사실이 확실히 밝혀졌다. 좀 더 자세히 알고 싶은 독자에게는 길로비치(Thomas Gilovich)의 《인간, 이렇게 쉽게 믿는 자》라는 책을 권한다.

최근 들어서 특히 중시되는 휴리스틱은 폴 슬로빅이 발견한 ‘감정 휴리스틱(affect heuristic)’이다. 감정은 때때로 이용 가능성이나 대표성 휴리스틱과 같은 역할을 한다. 즉 여러 가지 상황에서 일어나는 일에 대한 사람들의 감정적 반응은 그 일에 대해 신중하게 생각할 틈을 주지 않는다. 감정 휴리스틱에 대해서는 제9장에서 소개한다.

신속하고 간결한 휴리스틱

카너먼과 트버스키가 창시한 이래 휴리스틱과 바이어스 분야에서 많은 연구들이 축적되어왔다. 그렇지만 이런 연구들은 휴리스틱의 유용성보다는 휴리스틱이 일으키는 바이어스에 역점을 둔 것처럼 보인다. ‘휴리스틱과 바이어스’처럼 두 단어가 거의 언제나 함께 사용된다는 점에서 알 수 있듯이 휴리스틱에 따라 판단을 내리면 착오를 일으키는 것처럼 여겨진다.

이에 대해 휴리스틱에 토대를 둔 판단이나 결정의 장점을 강조하는 사람들이 있다. 이들은 독일 막스플랑크연구소의 게르트 기거렌저(Gerd Gigerenzer)를 중심으로 한 연구 그룹이다. 이들은 휴리스틱을 기초로 한 판단이나 결정이, 많은 인지 자원을 동원해서 오랜 시간 어려운 계산을 한 후에 얻게 되는 최적 해(解)에 버금가는 훌륭한 답을 끌어낸다고 주장한다.

그들은 훌륭한 답을 이끌어내는 휴리스틱을 ‘신속·간결한 휴리스틱’이라 부른다. 그 대표적인 예가 ‘재인(再認) 휴리스틱(recognition heuristic)’이다.

기거렌저는 미국인 학생과 독일인 학생들을 대상으로 “샌디에이고와 샌안토니오 중 어느 쪽 인구가 많다고 생각하는가?”라는 질문을 했다. 이 두 도시는 모두 미국에 있다.

미국인 학생은 두 도시에 대해 어느 정도 지식이 있을 거라 생각되는데도 그들의 정답률은 62%였다. 독일인 학생 중 샌디에이고를 들어본 적이 있는 사람은 78%였지만 샌안토니오에 대해서는 4%뿐이었다. 그러나 샌디에이고라는 도시를 들어본 적이 있는 학생들의 정답률은 100%였다. 정보가 적은 독일인 학생 쪽이 정보가 많은 미국인 학생보다 정답률이 높았다. 아마 일본인 학생에게 같은 질문을 해도 정답률은 높지 않을까?

이 지론에서 독일인 학생이 사용한 것이 ‘재인 휴리스틱’이다. 한쪽 도시의 이름은 들은 적이 있지만 다른 쪽 도시에 대해서는 전혀 모를 때, 알고 있는 도시의 인구가 많을 거라고 판단한 것이다. 미국인 학생은 이 휴리스틱을 사용할 수 없다. 두 도시를 모두 알고 있기 때문이다. 이 예처럼 재인 휴리스틱에 따라 대상 2개 중 1개는 들은 적이 있지만(재인할 수 있다) 다른 쪽은 들은 적이 없을 때, 재인한 대상이 기준으로 비춰져 수치가 높다(예를 들면 인구가 많다)고 판단할 수 있다.

또한 우수 대학을 판정할 때, 상품 평가를 할 때, 스포츠 팀 성적을 판정할 때 등에서도 이름의 재인과 판정의 정확성 간에는 정비례 관계가 발생한다. 우수한 대학일수록 그 대학의 교수진의 연구 성과가 더 널리 전해지거나, 그 대학의 학생이나 졸업생이 사회에서 왕성하게 활약하고 있기 때문에 그 대학의 이름을 들을 기회가 많아지게 됨으로써 대학의 우수성과 이름을 들은 적이 있음(재인)이 결부된다. 스포츠 팀의 성적도 마찬가지다.

주식 투자에서조차 재인 휴리스틱이 활발히 작용하고, 재인할 수 있는 회사의 주식에 투자함으로써 상당히 높은 수익을 올렸다는 사례가 보고되고 있다. 즉 무지(정보가 없음)가 무작위로 일어나는 것이 아니라 체계적으로 발생하는 상황일 때는 이 휴리스틱의 기능이 유효해진다.

공중볼을 위한 휴리스틱

외야수는 높이 뜬 공을 어떻게 잡을까? 날아오는 공의 낙하점을 예측하기 위해서는 공의 속도, 각도, 풍향과 세기, 거기에 공의 회전에 대한 종합적인 정보가 필요하다. 그러나 외야수가 그런 복잡한 정보를 입수할 리 없고, 입수했더라도 계산할 시간적 여유가 없다.

외야수는 실제로 단 한 가지 휴리스틱을 사용하고 있다고 한다. 기거렌저는 그것을 ‘앙각(仰角) 휴리스틱’이라 부른다.

이는 타구가 떠서 날아갈 때 공을 잘 보고, 올려다보는 각도가 항상 일정해지도록 유지하며 달린다는 휴리스틱이다. 그러면 날아가는 공의 낙하지점 가까이 도달하게 되고, 마지막 순간 약간 조정만 하면 공을 잡을 수 있게 된다.

외야수가 복잡한 계산을 순식간에 해치우거나 또는 직감적으로 예측하여 날아가는 공의 낙하점으로 달리는 것은 아니다. 그 증거로 외야수는 가끔 공중볼을 향해 일직선으로 뛰지 않고 커브를 돌며 달리기도 하고, 항상 전속력으로 낙하지점을 향하지 않고, 빠른 걸음으로 가는 경우도 있다. 이런 행동 모두가 날아가는 공에 대해 일정한 앙각을 유지하기 위해 필요한 동작이다. 낙하점을 알고 그곳으로 달린다면 그런 동작은 필요 없다.

신속·간결한 휴리스틱이 항상 활발히 작동되지는 않는다. 미국인 학생이 도시 인구의 대소를 정확하게 말할 수 없었던 예가 그러하다. 앙각 휴리스틱은 날아오는 공을 받을 때 이외에는 전혀 도움이 되지 않을 것이다.

기거렌저는 주체 측의 제한 합리성과 문제 상황(환경, 생태)의 상호 작용에 따라 휴리스틱이 활발한 경우와 그렇지 않은 경우가 있다고 한다. 의사 결정을 지탱하는 것은 주체의 인지능력뿐만 아니라 문제가 놓인 상황 역시 중요하다는 말이다.

그런 의미에서 그들은 환경(생태)에 적응한 합리성이라는 사고방식을 중시하고, 재인 휴리스틱이나 앙각 휴리스틱과 같은 매우 심플(간결)하고 재빠르게(신속하게) 실행할 수 있는 휴리스틱을 이용함에 따라 적절한 판단을 할 수 있다고 주장한다. 기거렌저는 이 같은 합리성을 ‘적응적 합리성’이라 부른다. 환경에 적합한 휴리스틱의 기능이 잘 이루어진다는 의미다.

그 밖에도 신속하고 간결한 휴리스틱을 수없이 제시하고 있지만 그것들은 특정 영역(적절한 상황, 생태, 환경)에서 사용하기 위해 타고나거나 배워서 인간이 준비하게 된 인지적 기능이기도 하다. 그런 도구를 모아놓은 것을 ‘적응적 도구 상자’라 부른다.

적응적 도구 상자에 들어 있는 도구(예를 들면 재인 휴리스틱)를 어떤 환경에서 사용하면 적절한지 인간은 타고나거나 경험으로 배워서 터득하고 있다고 한다.

두 가지 정보처리 프로세스

이미 고대 철학자들은 인간의 정보처리 프로세스가 직감적 부분과 분석적 부분이라는 두 가지 형태로 형성되어 있다는 사실을 인식했다. 그 후 수많은 철학자와 사상가가 이를 주제로 토론해왔다. 이 논쟁은 최근 ‘이중 프로세스 이론(dual process theories)’으로 불리는 이론이 등장함에 따라 심리학자의 주목을 받고 있다.

이중 프로세스란 인간이 지닌 두 가지 정보처리 시스템을 가리킨다. 하나는 직감적, 연상적, 자동적, 감정적이며, 신속, 병렬처리 등을 특징으로 하는 시스템이다. 이를 시스템 I이라 부른다. 다른 하나는 분석적, 통제적, 규칙 지배적이며, 직렬 처리 등을 특징으로 하는 시스템으로서 시스템 II라 한다.

시스템 I은 일반적으로 포괄적인 대상에 적용되는 시스템이며, 인간과 동물 양쪽이 모두 지니고 있다. 시스템 II는 시스템 I보다 훨씬 늦게 진화한 인간의 고유한 시스템이라 할 수 있다. 주류 경제학이 전제로 하는 경제적 인간이란 시스템 II만을 갖춘 인간이라 할 수 있다. 그것도 초고성능 시스템 II를 갖춘 인간 말이다.

시스템 I과 시스템 II는 명확히 구분되지 않고, 양자는 연속적으로 존재한다. 또한 시스템 I은 시스템 II보다 능력이 열등하다는 의미가 아니다. 예를 들면 장기나 바둑의 프로 선수는 다음에 놓을 자리를 직감적으로 판단하고 그 중에서 최선인 수를 심사숙고하여 선택한다. 이른바 시스템 I과 시스템 II가 연계해 문제를 처리하는 것이다.

처리 방법 역시 어느 한쪽 시스템에 고정되어 있는 것은 아니다. 예를 들면, 운전할 때 초보자는 동작을 하나하나 확인하면서 운전하는 것처럼 시스템 II가 항상 발동한다. 그러나 운전이 익숙해지면 많은 동작이 무의식적이고 자동적으로 추진된다. 즉 시스템 II에서 시스템 I로 처리가 넘어가게 된다.

초보자가 차를 운전할 때 쉽게 피로감을 느끼는 것은 인지 자원이 더 많이 필요한 시스템 II에 의존하는 부분이 크기 때문이다. 최근에야 운전 중 휴대전화 사용이 금지되었지만 운전 중에 한 손에 휴대전화를 들고 대화를 하거나 문자를 보내는 것이 금지됐을 뿐 핸즈프리 같은 기계를 사용하여 대화하는 것은 금지되지 않았다. 이는 참으로 이상한 일이 아닌가?

운전 중 휴대전화 사용이 위험한 것은 통화나 문자 메시지에 신경이 집중되어, 즉 인지 자원을 그쪽으로 사용함으로써 운전에 필요한 자원이 적어져 운전에 부주의하게 되기 때문이다. 달리 표현하면 ‘마음이 콩밭에 가 있는’ 상태가 됨으로써 위험을 초래하게 되는 것이다. 그렇다고 한 손으로 운전하는 그 자체가 위험한 것은 아니다. 만일 한 손 운전이 위험하다면 운전 중에 담배를 피워도 한 손 운전이 되며, 기어를 바꿀 때도 순간적으로는 한 손 운전이 되기 때문에 그런 행위도 금지하지 않는 건 이상한 일이다. 운전 중 휴대전화 사용은 핸즈프리 사용까지 포함해서 금지해야 할 일이다.

스포츠나 장인의 기술은 몸소 익히지 않으면 안 된다는 말은 시스템 II에서 자동으로 시스템 I로 넘어갈 수 있을 만큼 연습이 필요하다는 의미다. 테니스 선수가 시합 중에 자신의 몸을 하나하나 체크하다가는 상대방의 의도나 볼의 코스를 예측하는 중요한 일에 소홀해진다. 어린이가 여러 가지 동작을 배울 때 처음에는 어색해하지만 나중에는 거의 자연스럽게 할 수 있게 되는 것과 마찬가지다.

시스템 II의 중요한 구실은 시스템 I을 모니터하는 것이다. 시스템 I이 신속하게 결정한 것을 감시하고, 그것을 승인하거나 때에 따라서는 수정하거나 변경하기도 한다. 직감적으로 뭔가를 선택했지만 잘 생각한 후 변경하는 일은 우리가 일상에서 종종 경험하는 일이다.

직감이 힘이 된다

시스템 I이 담당하는 판단이나 결정의 자동성은 최근 들어 심리학이나 인지과학자의 주목을 받고 있다. 자동성(automaticity) 연구의 제일인자인 존 바지(John Bargh)는 체코 문학가 밀란 쿤데라의 명작 《참을 수 없는 존재의 가벼움》에서 착안하여 〈참을 수 없는 존재의 자동성(the unbearable automaticity of being)〉이라는 논문을 저술했는데, 그는 인간이 다양한 정보처리를 자동적으로 하는 것을 광범위한 범위에서 다루고 있다. 존 바지는 소비자가 상품을 선택하는 행동에서조차 대부분이 자동화되어 있다고 주장한다.

카너먼과 프레더릭(S. Frederick)은, 대표성 휴리스틱이나 이용 가능성 휴리스틱에 의한 판단은 시스템 I에 의해 직감적으로 이뤄진다고 말한다. 이런 휴리스틱을 이용하여 판단을 내릴 때의 특징은 대상이 되는 특성(목표 속성이라 한다)을 곧바로 마음에 떠오른 다른 성질(휴리스틱 속성이라 한다)로 바꿔서 판단한다. 즉 휴리스틱에 따른 판단은 이러한 ‘속성 바꿔치기(attribute substitution)’라는 프로세스로 진행된다.

그렇다면 속성 바꿔치기는 어느 경우에 일어날까? 그것은 목표 속성과 휴리스틱 속성의 성질에 의존한다. 목표가 되는 속성을 바로 이해하기 어렵고, 반대로 휴리스틱 속성이 직감적으로 마음에 곧바로 떠오를 때에는 속성 바꿔치기가 발생된다.

이처럼 마음에 곧바로 떠오르는 것을 접근성(accessibility)이 크다고 한다(이 개념은 이용 가능성이라는 개념과 헷갈리지만 이에 대해서는 자신의 책임이라고 카너먼은 서술한다). 기억 인출 용이성이 속성 바꿔치기가 발생하는 열쇠며, 기억 인출 용이성에 대해서는 다음 세 가지 조건이 충족되어야만 한다. 첫째, 목표로 삼은 속성은 입수하기가 용이하지 않다. 둘째, 그것과 연상적이며 개념적으로 관련이 있는 속성이 더욱 기억을 인출하기 용이하다. 셋째, 휴리스틱 속성으로 이루어진 속성 바꿔치기가 시스템 II의 모니터에 거부되지 않는다.

입수하기 용이한 것은 크기나 거리 같은 물리적인 성질, 닮은 성질, 지각이나 기억에 남아 있는 성질, 좋고 싫음에 대한 감정 평가, 기분 등인데, 시스템 I의 활동에 의해 곧바로 마음에 떠오르기 쉬운 자연스러운 성질이다.

이러한 점들은 행복에 관한 질문에 단적으로 나타난다고 카너먼은 말한다. 카너먼은 학생들에게 “대체로 당신의 생활은 행복합니까?”, “당신은 최근 1개월간 데이트를 몇 번 했습니까?”라는 질문을 던졌다. 이 질문을 위에 적힌 순서대로 묻자 두 질문 간의 특별한 관련성에 대한 판단을 내릴 수 없었다. 하지만 질문을 바꿔서 데이트에 대한 질문을 먼저 하면, 데이트 횟수가 많을수록 행복도가 높아지는 상관관계가 뚜렷해졌다. 데이트를 몇 번 했느냐는 질문을 먼저 하게 되면 행복감과 결부되기 때문에, 그다음 질문인 행복도를 평가할 때에 추상적이며 쉽게 표현할 수 없는 행복에 대한 평가를 속성의 기억 인출이 용이한 데이트 횟수가 대치하여 행복도를 판단하는 기준이 된다.

린다 문제

대표성 휴리스틱이 사용될 때 속성 바꿔치기라는 프로세스가 발생하는 전형적인 예로서 ‘린다 문제(Linda Problem)’를 들 수 있다.

가공의 인물(린다)에 관한 기술을 읽고 질문에 답하도록 했다. “린다는 솔직하고 총명한 독신 여성으로 서른한 살이다. 대학에서 철학을 전공했다. 학창 시절에 차별이나 사회정의 문제에 열심히 참여했고 반핵 운동에도 참가했다.”

다음은 8가지 직업에 대해 살펴본 후(예를 들면 초등학교 교사, 보험 판매 여성, 은행 창구 직원 등) 실험 참가자들에게 린다가 어느 분야에 가장 잘 맞을지 순위를 매기도록 했다. 실험 참가자 집단은 두 그룹으로 나뉘어 있다. 한 그룹은 예시한 직업을 가진 사람들의 전형적인 모습과 어느 정도 닮았는지를 토대로 순위를 매기도록 하고, 또 한 그룹은 린다가 각각의 직업을 가질 경우를 예상하여(확률에 기초하여) 순위대로 적도록 했다.

그 결과 두 그룹이 적은 순위의 평균치는 거의 일치했다. 그리고 유사성을 토대로 한 순위를 가로축, 확률을 토대로 한 순위를 세로축으로 삼아 그래프를 그려보았더니 거의 45도 직선이 되었다. 즉 두 그룹에서 사용한 기준을 기초로 한 순위 매김(의 평균치)이 거의 동일했다. 이는 확률의 판단이 유사성에 따라 이루어지면서 속성 바꿔치기가 발생했다는 것을 의미한다.

또한 이 판정에서 유사성에 대해 판정한 그룹 중 85%는 린다가 단순한 ‘은행 창구 직원’이기보다는 ‘창구 직원이며 페미니스트’라는 인물과 유사성이 높다고 판단했으며, 확률에 기초를 두고 판정한 그룹 중 89%도 똑같은 판단을 했다. ‘창구 직원이며 페미니스트’일 확률이 ‘창구 직원’일 확률보다 높을 수 없으므로 결합 오류가 발생한 것이라 할 수 있다. 이 바이어스는 속성 바꿔치기라는 프로세스에 의해 나타났다고 생각된다.

이처럼 목표 속성과 휴리스틱 속성은 서로 다르기 때문에 전자를 후자로 바꿔치기 함으로써 종종 바이어스가 발생하게 된다. 그러면 시스템 II는 이 같은 바이어스가 발생하는 것을 방지할 수 있을까?

“노트와 연필을 샀는데 합계 1,100원으로, 노트가 연필보다 1,000원 비쌌다. 연필이 얼마인지 5초 이내에 답하라.” 이렇게 질문하면 대부분 연필이 100원이라고 착각한다. 시스템 II가 시스템 I의 착각을 검증하지 않았든지, 혹은 검증했더라도 답을 바꿀 시간이 없기 때문이다.

이외에도 아침형 인간은 밤에, 저녁형 인간은 아침에 착오를 일으키기 쉬운 예도 나타났다. 카너먼과 프레더릭은 경우에 따라서 시스템 II가 시스템 I의 착오를 수정할 능력이 의외로 약할지도 모른다는 견해를 밝혔다.

여러 가지 휴리스틱

카너먼과 프레더릭은 최근의 연구에서 속성 바꿔치기가 이루어지지 않는다는 이유로 ‘기준점과 조정’을 휴리스틱 리스트에서 제외했다. 확실히 기준점에서는 속성 바꿔치기가 발생하지 않을지도 모르기 때문에 엄밀한 의미에서 휴리스틱이라고는 말할 수 없다.

그러나 카너먼이 주장한 기준점은 판단하는 사람이 기억에서 인출하기가 용이한 정보다. 우선 시스템 I이 판단의 단서를 직감적으로 찾아낸다. 그런 뒤에 시스템 II가 충분히 조정하지 못하기 때문에 기준점 효과가 발생하는 것이다. 따라서 기준점과 조정도 휴리스틱의 하나라고 생각해도 좋다. 그러나 어느 쪽이 되었든 휴리스틱이 인간의 판단이나 결정에 매우 중요한 구실을 하고 있다는 것만은 확실하다.

광고, 선전, 브랜드도 소비자가 상품을 선택할 때 휴리스틱 노릇을 다하고 있다. 매뉴얼 북은 휴리스틱을 집대성한 것이라 할 수 있다. 그리고 회사에서 사원을 공개 채용할 때 응모자에 관한 정보가 충분하지 않기 때문에, 모집하는 회사 쪽에서는 우선 학력을 보고 응모자의 능력을 추정하는 것이 보통이다. 이것 역시 학력이 휴리스틱으로 사용된 예라고 할 수 있다.

예전부터 사용된 격언이나 속담에는 수많은 휴리스틱이 들어 있다. 예를 들어 ‘급히 먹는 밥에 목이 멘다’, ‘사람을 보면 도둑이라 생각하라’(사람을 가볍게 신용하지 말라)와 같은 속담은 정확한 판단이나 예측을 할 수 없지만 일상생활에서는 충분히 도움이 되는 지침들이다.

‘고정관념이나 상식을 버리라.’ 이런 지침은 자주 듣는 말일 텐데 휴리스틱에 얽매이지 말라는 뜻이다. 이 지침 자체가 또 다른 휴리스틱이긴 하지만 말이다.

데이트 상대나 결혼 상대를 결정할 때 상대방과 교제함으로써 얻을 수 있는 플러스 요소와 마이너스 요소를 모두 고려해서 합리적인 계산을 토대로 결정할 수는 없다. 고려해야 할 것이 너무 많아서 계산하는 데 막대한 시간이 걸릴 것이다. 그뿐인가. 불확실한 사항이 너무 많아서 확정적인 결론을 내릴 수도 없다. 이럴 때는 사랑의 감정에 포로가 된 상대방을 선택하는 경우가 많다. 애정이 휴리스틱 기능을 맡고 있는 순간이다.

로봇 프레임 문제

휴리스틱의 활동을 더 깊이 이해하기 위해서는 인공지능 로봇이 좋은 자료를 제공해준다. 철학자 대니얼 데넷(Daniel C. Dennett)은 인공지능 로봇에 대해 다음과 같은 우화를 만들었다.

로봇 1은 진열대에 있는 예비 배터리를 방에서 가져오려고 했다. 로봇 1은 폭탄이 그 진열대에 같이 있는 것을 알고 있었다. 그렇지만 진열대를 운반하면 폭탄을 건드리게 된다는 것을 잊고 진열대를 운반했다. 그 순간 폭탄이 폭발했다.

로봇의 추론 능력이 부족했기 때문이라고 판단한 설계자는 자신이 의도한 결과뿐만 아니라 의도하지 못한 결과도 추론할 수 있는 능력을 갖춘 로봇 2를 만들었다.

로봇 2는 로봇 1과 마찬가지로 진열대를 방에서 운반하려 했고, 그 행동의 결과를 추론하기 시작했다. 로봇 2는 진열대를 방에서 운반하더라도 방 벽의 색은 바뀌지 않고 진열대의 바퀴가 회전하는 것까지도 모두 추론했다. 그러는 사이에 폭탄은 폭발해버렸다.

그러자 이번에는 목적에 관계없이 결과를 무시할 수 있는 로봇 3을 만들었다. 그런데 로봇 3은 이번에는 전혀 움직이려 하지 않고 추론에만 몰두했다. 벽의 색은 무시해도 좋다. 천장의 소재도 무시해도 좋다…… 로봇 3은 다양한 사항에 착안하여 무시해야 할 리스트를 첨부하기 급급했다. 그러는 사이에 또다시 폭탄은 폭발해버렸다.

로봇들은 왜 이런 간단한 일을 할 수 없는 것일까?

무시해도 좋은 것과 무시해서는 안 되는 것을 확인하는 일은 간단해 보여도 로봇에게는 쉽지 않다. 인공지능 연구자는 이런 문제를 ‘프레임 문제’라 부른다. 문제 해결을 위해 어떤 것이 관련되어 있어서 무시하면 안 되는지, 반대로 어떤 것은 무시해도 되는지를 적절하게 결정할 수 없는 것이 프레임 문제다.

바꿔 말하면 무시해도 되는 것을 한 프레임(틀), 무시해서는 안 되는 것을 별개의 프레임으로 놓아야만 문제 해결에 가까워진다. 이때 어떤 것을 ‘무시 가능 프레임’에 넣고, 어떤 것을 ‘무시 불가 프레임’에 넣어야 할지를 제대로 알 수 없는 것이 프레임 문제다.

그렇다면 인간은 어떨까? 어떤 결정을 내릴 때 무엇을 고려하고 무엇을 무시해야 할지를, 우리들을 둘러싼 환경이나 조건 같은 모든 사항을 검토하여 결정할 수는 없다. 환경에는 무한한 정보가 있고 우리들의 인지 능력은 한정되어 있기 때문이다. 따라서 인간도 프레임 문제와 무관하지 않다. 그러나 인간이 프레임 문제로 고민하고 있는 것처럼 보이지는 않는다.

정상적인 판단력을 갖춘 인간이라면 로봇이 직면한 문제는 상식선에서 해결할 수 있다. 진열대를 끌어내면 진열대 위에 있는 폭탄도 함께 나온다는 것을 누구나 알 수 있고, 진열대를 끌어내도 벽의 색깔이 바뀌지 않는다는 것을 안다. 특수 장치가 있다면 모를까 상식적인 범위 내에서는 괜찮다는 것을 인지하고 있다. 그래서 폭탄이 폭발하는 일 없이 무사히 배터리를 회수할 수 있다. 상식이란 별로 깊이 생각하지 않고 직감적으로 떠오르는, 거의 적절한 결과를 초래하는 행동 규칙이다. 즉 상식은 일종의 휴리스틱이다.

아인슈타인은 “상식이란 18세까지 몸에 익힌 편견의 컬렉션”(《아인슈타인 150 단어》)이라고 말했는데, 편견(바이어스)이 발생할 가능성이 있어도 문제 해결에 도움이 되는 것이 휴리스틱을 이용한 상식이다.

인간은 그 밖에도 다양한 휴리스틱을 사용하여 문제를(불완전하나마 그럭저럭) 해결하고 있다. 논리나 계산에서는 완벽한 로봇이 할 수 없는 일을 인간은 간단히 처리할 수 있으며, 합리성(다른 의미로 인간의 파워)으로 해결할 수 있다.

인간도 프레임 문제로 고뇌한다

그러나 인간도 프레임 문제와 완전히 무관하지는 않다. 초보 운전자가 운전에 미숙한 것은 운전 조작 그 자체가 능숙하지 않다는 기술적인 측면도 있지만, 운전할 때 어떤 정보가 중요하고, 어떤 정보가 중요하지 않은지에 대한 프레임을 적절히 사용할 수 없기 때문이다.

운전자 자신의 바로 앞차나 다가오는 차 또는 도로 상황만을 응시하다가 후방이나 옆 차에 대한 주의가 산만해지기도 한다. 경험이 쌓여 운전에 익숙해지면 주의력의 분산이 가능하지만, 반대로 너무 분산되기 쉽고, 길을 걷는 미인에게 정신을 팔거나 동승자와 대화하는 데 열중하여 다른 차의 움직임에 부주의해지기도 한다. 운전 중에 발생할 수 있는 모든 상황에 주의를 기울이는 것은 불가능하기 때문에 인간에게도 프레임 문제는 존재한다.

인위적으로 프레임을 고정했기 때문에 문제가 해결되지 않는다는 점이 퍼즐의 특징이다. 예를 들어 다음 쪽에 있는 그림 3-1과 3-2 같은 퍼즐을 생각해보자. 이들 퍼즐이 어려운 것은 프레임이 방해하고 있기 때문이다.

그림 3-1에서는 주위에 있는 점 8개가 프레임(틀)이 되기 때문에 외부 여백을 이용할 수 있다는 사실을 알아채기 어렵다. 그림 3-2에서는 종이의 표면이 프레임으로 작용해 뒷면을 사용할 수 있다는 사실을 알기 어렵다. 점 8개나 종이 표면이 만든 물리적인 프레임이 심리적인 프레임을 만들어내기 때문에 거기서 탈피할 수 없게 된다. 따라서 직감적으로 떠오른 프레임과 전혀 다른 프레임으로 사고하지 않으면 문제를 해결할 수 없다. 이런 종류의 퍼즐이나 퀴즈 등은 머리를 유연하게 사용하지 않으면 풀 수 없다. 머리를 유연하게 하려면 고정적인 프레임을 깨야만 한다. 정답은 102쪽에 있다.

페리 메이슨, 에르큘 포와로, 셜록 홈스 같은 이들이 명탐정으로 불리는 것은 일반 사람들과 전혀 다른 프레임에 착안하여 다른 사람들이 눈치채지 못하는 일들을 재빨리 간파하기 때문이다. 남녀의 의식 차이는 동서고금을 막론하고 연애소설의 주요 테마지만, 그것을 한마디로 말하면 남녀의 프레임 차이에서 비롯된다. “나하고 일 중에 어떤 게 중요해?”, “그런 건 결정할 수 없어.”

댓글남기기