서울비님의 교실에서 해본 Win-Win 게임이라는 포스팅을 매우 흥미롭게 읽었다.
몇가지 생각이 뻗어나가는 것들이 있어서 보론 성격의 포스팅.
1) 인류애와 진화적으로 지속가능한 전략(ESS)
물론 엑셀로드 이후 이 게임이 특별히 새로운 것 없이도 자주 반복되는 실험이긴 하지만, 서울비님의 교실실험이 흥미롭고 유의미했던 지점은 이 죄수의 딜레마를 '인류애' 혹은 '양심'이라는 키워드로 타파할 수 있는 가능성에 대한 고찰이라고 본다. 교실과 학생... 이라는 특이점과 순수함이라는 성격때문이었을까.
그러나 대개의 경우, 이러한 접근법은, 이상적일 수는 있으나 진화적으로 지속가능한 전략(Evolutionarily Stable Strategy)이 되기는 어렵다. 바로 '틈입'에 취약하기 때문. 역설적으로 '교육', '양심', '도덕', '인류애' 무엇이든간에 W카드를 내도록 하는(배신을 하지 못하게 하는) 압력이 강한 집단일 수록, 극소수의 배신자에게는 '배신'의 보상이 더 커지게 되기 때문이다.
2) 내쉬균형
우선, 서울비님의 점수 룰은 그대로 둔 채, 경제적 동기를 부여해보자.
이 게임의 참가자는 수회 연속(주최자가 그만하자고 할 때까지)으로 게임을 한 후, 각 팀이 획득한 점수만큼 주최측으로부터 사탕을 받는다고 하자.
그러면 당장 양쪽팀은 상호협력하기 시작한다. 상대방의 득실과는 상관없이 나의 점수만으로 보상을 받을 수 있다는 것을 아는 순간, 이 게임은 상호협력전략이라는 내쉬균형에 이르게 된다.
마치, 월드컵 조별예선전에서, 무승부만 하면 두 팀다 올라갈 수 있다는 것을 깨달은 축구팀처럼 두 팀은 주최측이라는 공동의 적을 두고 상호협력을 통해 자신의 보상을 극대화하는 한편, 상대로부터 불필요한 견제를 받지 않기를 원한다. 이런 경우 배신으로의 유혹은, 단 1번의 확실한 이득에 비해, 남은 기간동안 벌어질 혼선을 생각한다면 그다지 서로 바람직하지 않은 전략이 된다. (이 게임에서 남은 경기 수는 주최자만 안다는 것을 주의)
3) 기간의 한정
그러나 이러한 내쉬균형은 단순히 게임 회수를 미리 한정지어 공지하는 것만으로 간단히 깨어질 수 있다. 예를 들어 10게임을 진행할 것임을 미리 공지한다면, 9게임간 상호 협력하여 27점씩을 획득한 상태에서 보복의 걱정없이 6점을 얻을 수 있다는 배신의 기회는 거부하기 힘든 유혹이다. 물론 상대방도 비슷하게 생각할 것이기 때문에 상호배신의 방아쇠는 좀 더 일찍 당겨지기 마련이다.
그러나 현실에서는 오늘 보고 내일 안볼 관계가 아닌 한 이러한 기간한정 룰은 약간 비현실적인 면이 있는 것도 사실이다. 집단내에서의 사회적 약속이 배신에 대한 억제책으로 작용할 수 있는 힌트라 하겠다.
4) 목표의 한정
그렇다면 게임의 룰을 바꿔서 10회 게임시 15점 이상을 획득한 팀에만 사탕을 일정갯수 준다면 어떻게 될까?
점수에 상관없이 보상으로 주어지는 사탕갯수가 일정하다면, 양팀은 서로 15점 이상을 유지하는 선에서 상호협력이 이루어질 것을 예상하기는 어렵지 않다. 15점 이상의 추가점수를 얻기 위한 전략 중에 배신이라는 선택지는, 보상되는 사탕에 비해 사회관계속의 불편한 긴장상태를 유지해야 하는 부담이 더 클 수 있기 때문이다.
물론 점수에 따라 지급되는 사탕의 갯수가 다르다면 또다른 전략이 필요하긴 하겠다. 배신의 보상에 따른 추가이익에 대한 보상이 충분히 크다면 배신은 사회압력을 이겨낼 만큼 충분히 매력적이 될 수 있다.
어쨌거나 공동의 목표가 존재한다면 충분히 상호협력이 이루어지도록 사회적 압력이 작용함에도 불구하고, 배신의 가능성이 있다는 것은, 배신의 유혹이 너무 크도록 보상이 과도하기 때문은 아닐까?
5) 배신, 그 참을 수 없는 유혹
이제, 점수 룰을 바꿔보자.
W-W의 경우 : 각각 6점씩 부여함으로써 상호협력의 보상을 키운다.
M-M의 경우 : 상호배신의 페널티를 더 늘려서 각각 -6점씩 준다.
W-M의 경우 : 배신의 유혹을 줄이고자(?) 배신으로 얻는 이익을 1점만 주고, 배신당한 쪽의 페널티는 0점만 부여한다. (파격적이다!!)
확실히 서울비님의 최초실험보다 배신의 유혹을 덜 받도록 구조화시켰다. 사소한 이익을 얻기 위해 배신을 하기에는 그 리스크가 너무 크다. 아마도 이러한 점수 구조는 상호협력을 이끌어내는 강력한 유인제가 될 수 있을 것이다.
그러나, 이러한 점수 구조조차, 반드시 상호협력을 보장하는 마법의 주문은 아니다.
서울비님의 학생들을 2명씩 짝지워 교실 토너먼트를 주최한다고 하자. 최종 우승자가 뽑힐 때까지 토너먼트를 진행하고, 최종 우승자에게는 사탕을, 나머지 탈락자들에게는 화장실 청소를 시키도록 하자.
이러한 전형적인 승자독식시스템에서는 배신은 유혹이 아니라 구조가 된다. 비록 마이너스 점수로 떨어진다 하더라도 상대방보다 1점이라도 높아야만 다음 토너먼트로 올라갈 수 있다면, 배신은 경쟁을 위한 가장 좋은 무기가 되기 때문이다.
6) 다시 처음으로.
애초에 '점수'를 부여한다는 것은 점수에 따른 보상차이가 존재한다는 함의이다. 승자'독식'까지는 아니더라도 승자와 패자사이에 '격차'가 존재하고, 그 '격차'가 보상의 절대량만큼이나 중요하다면 배신은 '격차'의 확보를 위해 중요한 도구가 된다.
토너먼트 형태가 아니라 하더라도, 이러한 가치관의 집단 속에서는 배신의 가능성은 상존하게 된다. 심지어, 상호협력하도록 하는 사회적 압력이 강한 집단일 수록, 역설적으로 배신자가 성공할 가능성은 더 높아진다. 배신을 하지 못하도록 교육이나 도덕이나 양심이나 인류애를 강조할 수록, 외부로부터의 배신자의 틈입에 취약해진다.
'보상'과 '격차'는 현실속에서는 자본주의의 가장 근본적인 동작기제라고 할 수 있다. 이러한 전제 앞에서 상호배신 대신 상호협력을 통한 공동이익의 증대를 목적으로 한다면,
1) 보상과 격차를 무효화하던가 (자본주의의 폐지)
2) 배신자에 대한 즉각적이고도 강력한 '공적 복수'를 집행하던가 (국가의 규제, 개입)
그러나 단지 성선설과 비슷한 입장으로 상호협력 예찬론식의 접근이라면, 이 게임 자체에 숨어있는 구조적 모순 대신 배신자 개인의 양심문제로 치환되버려, 학생들로 하여금 근본적인 모순을 직시하고 해결책을 고민하도록 할 기회를 놓치는 것이 아닌가 하는 기우가 든다.