2009년 8월 11일 화요일

죄수의 딜레마 보론

서울비님의 교실에서 해본 Win-Win 게임이라는 포스팅을 매우 흥미롭게 읽었다.
몇가지 생각이 뻗어나가는 것들이 있어서 보론 성격의 포스팅.

1) 인류애와 진화적으로 지속가능한 전략(ESS)
물론 엑셀로드 이후 이 게임이 특별히 새로운 것 없이도 자주 반복되는 실험이긴 하지만, 서울비님의 교실실험이 흥미롭고 유의미했던 지점은 이 죄수의 딜레마를 '인류애' 혹은 '양심'이라는 키워드로 타파할 수 있는 가능성에 대한 고찰이라고 본다. 교실과 학생... 이라는 특이점과 순수함이라는 성격때문이었을까.
그러나 대개의 경우, 이러한 접근법은, 이상적일 수는 있으나 진화적으로 지속가능한 전략(Evolutionarily Stable Strategy)이 되기는 어렵다. 바로 '틈입'에 취약하기 때문. 역설적으로 '교육', '양심', '도덕', '인류애' 무엇이든간에 W카드를 내도록 하는(배신을 하지 못하게 하는) 압력이 강한 집단일 수록, 극소수의 배신자에게는 '배신'의 보상이 더 커지게 되기 때문이다.


2) 내쉬균형
우선, 서울비님의 점수 룰은 그대로 둔 채, 경제적 동기를 부여해보자.
이 게임의 참가자는 수회 연속(주최자가 그만하자고 할 때까지)으로 게임을 한 후, 각 팀이 획득한 점수만큼 주최측으로부터 사탕을 받는다고 하자.
그러면 당장 양쪽팀은 상호협력하기 시작한다. 상대방의 득실과는 상관없이 나의 점수만으로 보상을 받을 수 있다는 것을 아는 순간, 이 게임은 상호협력전략이라는 내쉬균형에 이르게 된다.
마치, 월드컵 조별예선전에서, 무승부만 하면 두 팀다 올라갈 수 있다는 것을 깨달은 축구팀처럼 두 팀은 주최측이라는 공동의 적을 두고 상호협력을 통해 자신의 보상을 극대화하는 한편, 상대로부터 불필요한 견제를 받지 않기를 원한다. 이런 경우 배신으로의 유혹은, 단 1번의 확실한 이득에 비해, 남은 기간동안 벌어질 혼선을 생각한다면 그다지 서로 바람직하지 않은 전략이 된다. (이 게임에서 남은 경기 수는 주최자만 안다는 것을 주의)

3) 기간의 한정
그러나 이러한 내쉬균형은 단순히 게임 회수를 미리 한정지어 공지하는 것만으로 간단히 깨어질 수 있다. 예를 들어 10게임을 진행할 것임을 미리 공지한다면, 9게임간 상호 협력하여 27점씩을 획득한 상태에서 보복의 걱정없이 6점을 얻을 수 있다는 배신의 기회는 거부하기 힘든 유혹이다. 물론 상대방도 비슷하게 생각할 것이기 때문에 상호배신의 방아쇠는 좀 더 일찍 당겨지기 마련이다.
그러나 현실에서는 오늘 보고 내일 안볼 관계가 아닌 한 이러한 기간한정 룰은 약간 비현실적인 면이 있는 것도 사실이다. 집단내에서의 사회적 약속이 배신에 대한 억제책으로 작용할 수 있는 힌트라 하겠다.


4) 목표의 한정
그렇다면 게임의 룰을 바꿔서 10회 게임시 15점 이상을 획득한 팀에만 사탕을 일정갯수 준다면 어떻게 될까?
점수에 상관없이 보상으로 주어지는 사탕갯수가 일정하다면, 양팀은 서로 15점 이상을 유지하는 선에서 상호협력이 이루어질 것을 예상하기는 어렵지 않다. 15점 이상의 추가점수를 얻기 위한 전략 중에 배신이라는 선택지는, 보상되는 사탕에 비해 사회관계속의 불편한 긴장상태를 유지해야 하는 부담이 더 클 수 있기 때문이다.

물론 점수에 따라 지급되는 사탕의 갯수가 다르다면 또다른 전략이 필요하긴 하겠다. 배신의 보상에 따른 추가이익에 대한 보상이 충분히 크다면 배신은 사회압력을 이겨낼 만큼 충분히 매력적이 될 수 있다.

어쨌거나 공동의 목표가 존재한다면 충분히 상호협력이 이루어지도록 사회적 압력이 작용함에도 불구하고, 배신의 가능성이 있다는 것은, 배신의 유혹이 너무 크도록 보상이 과도하기 때문은 아닐까?


5) 배신, 그 참을 수 없는 유혹
이제, 점수 룰을 바꿔보자.
W-W의 경우 : 각각 6점씩 부여함으로써 상호협력의 보상을 키운다.
M-M의 경우 : 상호배신의 페널티를 더 늘려서 각각 -6점씩 준다.
W-M의 경우 : 배신의 유혹을 줄이고자(?) 배신으로 얻는 이익을 1점만 주고, 배신당한 쪽의 페널티는 0점만 부여한다. (파격적이다!!)

확실히 서울비님의 최초실험보다 배신의 유혹을 덜 받도록 구조화시켰다. 사소한 이익을 얻기 위해 배신을 하기에는 그 리스크가 너무 크다. 아마도 이러한 점수 구조는 상호협력을 이끌어내는 강력한 유인제가 될 수 있을 것이다.

그러나, 이러한 점수 구조조차, 반드시 상호협력을 보장하는 마법의 주문은 아니다.

서울비님의 학생들을 2명씩 짝지워 교실 토너먼트를 주최한다고 하자. 최종 우승자가 뽑힐 때까지 토너먼트를 진행하고, 최종 우승자에게는 사탕을, 나머지 탈락자들에게는 화장실 청소를 시키도록 하자.

이러한 전형적인 승자독식시스템에서는 배신은 유혹이 아니라 구조가 된다. 비록 마이너스 점수로 떨어진다 하더라도 상대방보다 1점이라도 높아야만 다음 토너먼트로 올라갈 수 있다면, 배신은 경쟁을 위한 가장 좋은 무기가 되기 때문이다.

6) 다시 처음으로.
애초에 '점수'를 부여한다는 것은 점수에 따른 보상차이가 존재한다는 함의이다. 승자'독식'까지는 아니더라도 승자와 패자사이에 '격차'가 존재하고, 그 '격차'가 보상의 절대량만큼이나 중요하다면 배신은 '격차'의 확보를 위해 중요한 도구가 된다.
토너먼트 형태가 아니라 하더라도, 이러한 가치관의 집단 속에서는 배신의 가능성은 상존하게 된다. 심지어, 상호협력하도록 하는 사회적 압력이 강한 집단일 수록, 역설적으로 배신자가 성공할 가능성은 더 높아진다. 배신을 하지 못하도록 교육이나 도덕이나 양심이나 인류애를 강조할 수록, 외부로부터의 배신자의 틈입에 취약해진다.


'보상'과 '격차'는 현실속에서는 자본주의의 가장 근본적인 동작기제라고 할 수 있다. 이러한 전제 앞에서 상호배신 대신 상호협력을 통한 공동이익의 증대를 목적으로 한다면,

1) 보상과 격차를 무효화하던가 (자본주의의 폐지)
2) 배신자에 대한 즉각적이고도 강력한 '공적 복수'를 집행하던가 (국가의 규제, 개입)

그러나 단지 성선설과 비슷한 입장으로 상호협력 예찬론식의 접근이라면, 이 게임 자체에 숨어있는 구조적 모순 대신 배신자 개인의 양심문제로 치환되버려, 학생들로 하여금 근본적인 모순을 직시하고 해결책을 고민하도록 할 기회를 놓치는 것이 아닌가 하는 기우가 든다.

댓글 7개:

  1. trackback from: 교실에서 해본 윈윈(Win-Win) 게임
    △사진출처 : smlp.co.uk @ Flickr 1) 상대방이 W 카드를 내고, 나도 W 카드를 내면 두 팀 모두 3점을 받는다. 2) W 카드를 내는 상대방을 배신하고 M카드를 내면 6점, W 카드를 낸 쪽은 -6점을 받는다. 3) 상대방을 서로 불신하고 둘 다 M 카드를 내면 양쪽 모두 -3점을 준다. 위 상황에서 가장 합리적인 선택은 무엇일까? 유명한 '죄수의 딜레마' 게임이론 알지? 서로 상대방이 무슨 카드를 낼지 모르는 상황에서 2)의 선..

    답글삭제
  2. 의미 있는 지적들이 많습니다. 그냥 에세이 형식의 글인데 꼼꼼하게 지적하고 가르쳐주셔서 감사드려요.



    제 글이 '성선설'에 근거한 '상호협력 예찬론식의 접근'이라는 지적에는 조금 고개가 갸웃하지만, 이바닥님의 글 덕분에 제 글 안에 있는 주관주의나 개인주의적 요소의 약점이 잘 드러난 것 같습니다.



    이 약점을 모르거나 온정주의로 흘리고자 한 것은 아니었고, 인간이 사회심리적 존재이고, 수치를 기반으로 행동한다는 인식을 강조하고 싶었습니다. ... 예컨대 승자독식 사회에서 가장 큰 위험은 배신이 구조적으로 반복된다는 점이 아니라, 오히려 수치심이 구조적으로 무감각해진다는 데 있다고 봅니다. 배신으로 이익을 얻는 것은 구조적 상벌 체계로서 당연히 억제해야 하고 그럼으로써 사회시스템이 지속적으로 돌아가겠지요. 그러나 수치심과 인간의 연대감을 잃은 사회는 오래가지 못할 것입니다.





    감사드리며~~~

    답글삭제
  3. @서울비 - 2009/08/11 17:52
    서울비님의 반대의견 같은 건 아니구요...

    2차 실험을 기대하고 있습니다. 학습된 기억을 바탕으로 한 전략이라는 관점에서 흥미로운 결과가 나올 것 같습니다. 수치심과 연대감은 '기억'을 매개로 하니까요. ^^;

    답글삭제
  4. ^^ 조언 고맙습니다.



    근데 애들이요.. 똑같은 거 두 번 하는 거 싫어할 거 같아요 ㅠ ㅠ

    답글삭제
  5. 카드를 안내버리는 룰은 없어요? ㅎㅎ



    서울비님 글 보고 룰을 조금 바꿔보면 좋겠다 싶었는데

    이바닥님이 해주셨네요



    서점 순회중 광화문에서 밥 먹다가

    근처 사무실 직원의 월급을 듣고서는

    오만가지 잡생각이 지나갔더랬죠.

    글 말미의 조처가 취해진다면 좋을지도 모르겠군요 히히



    글 잘보고 갑니다~

    답글삭제
  6. 죄수의 딜레마를 검색하다가 이바닥님의 글과 서울비님의 글을 읽게 되었습니다. 자본주의와 인간의 논리에 대해 쉽게 이해할 수 있었습니다.



    그런데, 보상이라는 문제에 대해서 의문을 제시해 보고자 합니다

    '비합리성의 심리학'이라는 책에서 보았는데요,

    여러번의 실험결과 사람들이 보상이 주어진다고 더욱 일을 열심히 한다기 보다는 '자각'을 바탕으로 자율적 선택으로 자신의 만족감과 자부심이 있을 때 일의 성취도도 높고 열심히 한다고 합니다.



    서울비님이 제시한 수치심과 비슷한 맥락의 인간심리가 아닌가 생각됩니다. 사회구조를 이러한 심리를 바탕으로 구성해 간다면 좀 더 풍요롭고 살기 좋은 세상이 되지 않을까 생각합니다

    답글삭제
  7. http://seoulrain.net/1785
    기존의 글이 어찌어찌하다가 날라갔어요 ㅠㅠ

    답글삭제