[컬럼] 게임이론과 암호경제학
상태바
[컬럼] 게임이론과 암호경제학
  • 조중환 기자
  • 승인 2018.10.25 09:47
  • 댓글 0
이 기사를 공유합니다

▲ 김종승 SK텔레콤 블록체인

사업개발 유닛 팀장

블록체인 성공의 근간에는 게임이론(Game Theory)이 있다. 중앙화된 권위(Centralized Authority)의 부재에도 블록체인의 신뢰 네트워크가 유지되는 것은 그 암호학적 퍼즐이 게임이론이라는 경제학적 모델로 해결될 수 있기 때문이다. 불특정 다수의 네트워크 참여자들이 자신의 이익을 추구하면서도 악의적 행동을 하지 않고 네트워크의 가치를 극대화하는 데에 기여할 수 있도록 하는 ‘컨센서스(Consensus) 알고리즘’은 게임이론의 원리에 기반해 구현된다. 그렇다면 여기서 게임이론이란 무엇이며 게임이론은 어떤 문제를 해결하고자 하는 이론인지 이해하는 것이 필요하다.

경제학에서 정의하는 게임은 크게 ‘협조 게임(Cooperative Game)’과 ‘비협조 게임(Non-Cooperative Game)’으로 나눌 수 있다. 협조 게임은 경제 주체들 간에 구속력이 있는 협정을 사전적으로 맺을 수 있다는 전제 하에 다자 간의 전략적 상호관계를 그 대상으로 한다. 이에 반해 비협조 게임은 경제 주체들 간의 사전적 합의가 가능하지 않은 경우를 말한다. 주류 경제학자들은 경제, 경영, 정치 등 각종 사회현상을 설명하고 경제 주체들의 행동을 예측하는 데 있어서 비협조 게임이론이 더 우월한 것으로 본다. 게임이론은 경제학, 정치학, 법학, 국제관계론, 심리학, 협상이론 등 사회과학뿐만 아니라 생물학과 같은 자연과학에서도 활발히 적용될 정도로 유용성을 인정받고 있다.

우선 게임이론의 역사를 살펴보자. 게임이론에 가장 큰 공헌을 한 경제학자는 바로 영화 ‘뷰티풀 마인드’의 실제 모델인 존 내쉬(John F. Nash, Jr.) 교수다. 존 내쉬는 1950년 출간한 'Equilibrium points in n-person games'이라는 2페이지 짜리 논문과 1951년 'Non-Cooperative Games'라는 짧은 논문을 통해 게임이론의 초석을 구축했다. 하지만 존 내쉬는 이후 조현병으로 인해 수십 년 동안 입원과 퇴원을 반복하며 후유증에 시달리게 됐고, 1990년대에 들어서서야 서서히 회복된다. 이후 1994년 마침내 존 내쉬는 게임이론 경제학자인 존 하사아니(John C. Harsanyi)와 라인하르트 젤텐(Reinhard Selten)과 공동으로 노벨경제학상을 수상한다. 존 내쉬 교수 이후 수많은 경제학자들이 게임이론을 지속적으로 연구하고 있으며, 윌리엄 스펜서 비크리(William Spencer Vickrey), 로버트 아우만(Robert Aumann), 토머스 셸링(Thomas Schelling) 등 경제학자들이 게임이론에 대한 공로로 노벨경제학상을 수상하게 된다.

이제 게임이론에서 정의하는 게임의 구성요소에 대해 알아보자. 게임의 구성요소는 크게 여섯 가지다.

첫 번째 구성요소는 게임의 의사결정 주체인 ‘경기자(Player)’ 또는 참여자다. 이더리움을 예로 들자면, 이더리움 노드에 참여하는 채굴업자, 스마트 컨트랙트를 실행하는 디앱(dApp) 개발자, 이더(Ether) 보유자 등이 전형적인 경기자다. 전통적인 게임이론에서는 의사결정 주체를 완벽하게 이성적인 인간으로 가정하고 이들 간의 전략적 상호관계를 분석 대상으로 한다. 즉, 각 경기자는 합리적인 의사결정자라고 가정한다. 이 때 합리성(Rationality)이란 자기이익 추구(Self-Interestedness)와 일관성(Consistency) 있는 의사결정이라는 두 가지 요건으로 정의된다. 하지만 인간은 불완전하고 감정적인 부분을 가지고 있으며 때로는 이성적으로 설명하기 힘든 행동을 하기도 한다. 따라서 게임이론에서 가정하는 인간의 의사결정은 현실세계에서의 인간 행동양식과 차이가 날 수밖에 없다는 점도 고려해서 새롭게 모형화를 해야 한다.

두 번째 구성요소는 바로 게임의 ‘의사결정 순서’다. 의사결정이 순차적으로 이뤄지는 게임(순차게임: Sequential Move Game)과 모든 경기자의 의사결정이 동시에 이뤄지는 게임(동시게임: Simultaneous Move Game)으로 구분된다. 두 가지 게임 유형은 각각 ‘전개형 게임(Extensive Form Game)’과 ‘전략형 게임(Strategic Form Game)’으로 맵핑될 수 있다. 블록체인 플랫폼에서의 채굴과 블록 생성은 참여자의 의사결정이 동시에 이루어지는 전략형 게임이라고 볼 수 있다.

게임의 세 번째 구성요소는 각 경기자가 알고 있는 ‘정보(Information)’다. 게임이론에서는 각 경기자가 자신이 특정 전략을 선택할 때 상대방이 어떠한 행동을 취했는지 알고 있는지 여부에 따라 ‘완전 정보(Perfect Information)’와 ‘불완전 정보(Imperfect Information)’로 구분한다.

네 번째 구성요소는 각 경기자가 취할 수 있는 ‘행동(Action)’, 또는 전략적 의사결정이다. 블록체인 플랫폼에서는 블록 생성과 같이 컨센서스 메커니즘에 참여하는 모든 활동이 경기자의 행동으로 해석된다.

다섯 번째는 구성요소는 게임의 ‘결과(Outcome)’다. 게임의 결과란 모든 경기자들이 규칙에 따라 전략을 선택함으로써 실현되는 최종적인 상태를 뜻한다. 

그리고 마지막으로 게임의 ‘보수(Payoff)’가 있다. 보수란 주어진 게임에서 경기자가 궁극적으로 얻고자 하는 정량화된 물질적 가치 또는 효용(Benefit)으로 정의된다. 채굴업자를 비롯한 이더리움 네트워크의 모든 참여자들은 자신들이 특정 행동을 함으로써 얻게 될 보수를 고려해 전략을 선택한다. 비트코인 플랫폼의 경우 채굴업자가 블록을 생성한 대가로 받게 되는 비트코인 보상과 트랜젝션 수수료가 곧 참여자 보수가 된다. 게임이론이 경제학자뿐만 아니라 사회과학자 전반의 관심을 끈 이유 중 하나는 바로 이런 게임의 구조가 현실세계의 수많은 전략적 상황에 적용될 수 있기 때문이다.

게임이론에서 대표적 사례로 제시되는 것은 바로 ‘죄수의 딜레마(Prisoner’s Dilemma)’다. 공범으로 의심되는 두 명의 용의자가 체포돼 조사를 받고 있다고 가정하자. 용의자 모두 범행을 자백할 경우 이들은 각각 징역 5년의 실형을 선고받는다. 두 용의자가 끝까지 범행을 부인할 경우 증거 불충분으로 각각 6개월만 복역하게 된다. 그런데, 만약 한 명은 범행을 끝까지 부인하고 다른 한 명은 범행을 자백할 경우, 범행을 부인한 용의자는 징역 10년형을 선고받으나 범행을 자백한 용의자는 집행유예로 풀려난다고 가정하자. 이 때 용의자 A가 자백을 할 경우, 용의자 B는 범행을 부인하는 것(징역 10년)보다 자백을 선택하는 것(징역 5년)이 최선이고, 용의자 A가 범행을 부인할 경우, 용의자 B는 범행을 부인하는 것(징역 6개월)보다 자백을 선택하는 것(집행유예)이 최선이다. 어떤 경우든 각 용의자에게 있어서는 자백은 부인보다 항상 높은 보수를 얻을 수 있는 전략이다.

이때 상대방이 어떤 전략을 선택하든 상관없이 내 전략 중에서 가장 높은 보수를 가져다 주는 전략을 ‘강우월전략(Strictly Dominant Strategy)’이라고 부른다. 반면 어떤 전략이 ‘강열등전략(Strictly Dominated Strategy)’이라는 것은 상대방이 어떠한 전략을 선택하든 이 전략보다 더 높은 보수를 얻을 수 있는 대안이 있음을 뜻한다. 죄수의 딜레마 게임에서는 자백이 강우월전략이 되며, 부인은 강열등전략이 된다. 물론 용의자 둘 다 더 행복해지는 길이 있다. 용의자 모두 범행을 끝까지 부인하면 6개월만 복역하고 풀려날 수 있다. 그러나 상대방을 신뢰할 수는 없는 상황이다. 죄수의 딜레마는 경제 주체가 각자 자신의 이익을 극대화함으로써 달성되는 균형 상태의 자원 배분은 사회 전체적으로는 비효율적일 수 있다는 진리를 표현하고 있다. 즉, 죄수의 딜레마는 사적 이익을 극대화하는 경쟁적 균형과 공동체 차원에서의 가장 바람직한 사회적 최적화 사이의 괴리를 드러낸다.

게임이론에서는 어떤 게임이 주어지더라도 합리적 경기자들의 전략 선택과 결과에 대한 예측을 위해 ‘균형(Equilibrium)’이라는 개념을 전제한다. 우월전략이나 열등전략이 존재하지 않는 경우에도 나 이외의 다른 경기자가 현재 전략을 고수한다는 가정 하에 내가 현재의 전략을 다른 전략으로 바꿀 ‘인센티브(Incentive)’가 있느냐는 질문을 던질 수 있다. 만약 경기자들 중 누군가가 현재의 전략을 버리고 다른 전략을 선택함으로써 자신의 보수를 높일 수 있다면, 현재의 상황은 불안정적일 수밖에 없다. 반면 어느 누구도 현재 전략으로부터 이탈할 유인이 없다면, 현재의 상황은 안정적이다. 이와 같이 특정 게임에서 다른 경기자가 현재 전략에서 이탈해 다른 전략을 선택하지 않을 경우, 어떠한 경기자도 이탈할 유인이 없는 안정적 상태를 ‘내쉬균형(Nash Equilibrium)’이라고 한다. 죄수의 딜레마 게임에서는 용의자 둘 다 자백하는 것을 내쉬균형으로 볼 수 있다.

그렇다면 내쉬균형 개념은 블록체인에 어떻게 적용될 것인가? 무엇보다도 블록체인 플랫폼의 핵심인 컨센서스 알고리즘의 작동 원리는 바로 게임이론에 기반하고 있다. 블록체인 에코 시스템에서 채굴업자, 플랫폼/스마트 컨트랙트 사용자, 토큰 보유자 등은 중앙화된 권위에 의해 통제받지 않는다. 게임 참여자들은 각각 다른 참여자의 행동에 대한 예측을 기반으로 자신의 보수를 극대화하는 방향으로 행동하게 되는데, 이런 행동들이 블록체인 네트워크의 신뢰를 더 강화할 수 있도록 설계하는 것이 컨센서스 알고리즘의 핵심이다. 특정 참여자가 자신의 보수 극대화를 목적으로 블록체인 네트워크에 악의적인 행동을 할 경우, 그런 행동으로 인해 결국 자신이 손실을 입게 되는 결과로 이어질 수밖에 없다.

새로운 블록체인 플랫폼을 개발하고자 한다면 먼저 게임의 결과가 내쉬균형이 될 수 있도록 바람직한 균형에 대한 정의가 우선 요구된다. 그리고 참여자들이 선택할 수 있는 행동들이 무엇인지 그리고 각각의 경우 어떤 보상을 받게 될 것인지 사전에 정의돼야 한다. 즉, 참여자의 바람직한 행동을 유도하기 위해서는 인센티브와 패널티 구조의 설계를 통해 게임의 내쉬균형이 유지될 수 있도록 해야 한다는 의미다.

그리고 참여자의 바람직한 행동으로 인해 게임의 만족스러운 결과가 균형인지 검증하는 작업이 필요하다. 블록체인 네트워크의 각 참여자의 이해관계가 상충할 경우에도 행동의 결과로 나타나는 균형점이 존재하는 지 확인하는 것이 중요하다.

일반적으로 많은 게임에 있어서는 균형점이 다수 존재할 수 있다. 이 경우 전체 네트워크 차원에서 가장 바람직한 균형이 선택될 수 있도록 하는 것이 중요하다. 네트워크에 악의적인 행동을 하는 공격자가 존재하는 ‘나쁜 균형(Bad Equilibrium)’이 일어날 수 있다면 이 가능성을 차단하는 조정이 필요하다.

이와 같이 균형에 대한 이론은 게임이론의 근간을 이룬다. 토머스 셸링에 따르면, 균형이란 어떤 동작이나 활동, 조정이나 반응이 사라지고 무언가 고정적이고 안정적인 평형을 이루거나, 상호 작용을 하는 사물들이 결국 조정을 거쳐 안정되고 평형을 이루는 상태를 말한다. 균형은 잠재적이며 계속해서 스스로 변화한다. 균형은 단지 하나의 결과로써, 안정된 이후에 나타난다는 의미다. 그래서 균형은 일종의 조정 과정이 있다는 것을 인정할 때 성립된다. 조정 과정을 무시하고 지나치게 단순화하거나, 균형을 결정하는 변수들을 무시하고 균형의 우세를 과장하면 문제가 발생한다.

여러 개의 균형이 존재할 경우 모든 게임 참여자는 보수 실현 극대화를 위해 다수의 균형 중 어떤 균형을 선택을 할 것인지에 대해 조정을 거칠 필요가 있다. 특히 게임 참여자가 다른 참여자의 선택을 알지 못한 채 특정 전략을 선택해야할 경우 조정은 쉽지 않다. 이런 ‘조정 게임(Coordination Game)’의 경우 이론적으로 실현가능한 여러 개의 균형 가운데 직관적으로나 현실적으로 가장 실현될 가능성이 높은 균형을 ‘포컬 포인트(Focal Point)’ 또는 ‘셸링 포인트(Schelling Point)’라고 한다. 토머스 셸링에 따르면 포컬 포인트란 상대가 자신의 행동에 가지고 있는 기대와 자신이 상대의 행동에 가지고 있는 기대가 한 점에서 수렴하기 위한 단서가 되는 것을 의미한다. 즉, 내가 예측하리라고 상대가 예측하는 것을 다시 내가 예측한다는 사실을 제외하고는 어느 누구도 어떤 것을 예측할 만한 논리적 이유를 제공하지 않는 상황에서 어떤 결론에 도달한다. 이런 끝도 없이 꼬리에 꼬리를 무는 예측은 한 점으로 귀결되기 마련이고, 그 점은 서로 자신이 더 이상 물러서지 않으리라고 상대가 예측할 것이라고 생각하는 바로 그 지점을 말한다.

블록체인 플랫폼 업그레이드 사례를 살펴보자. 블록체인 플랫폼의 업그레이드 사례는 전형적인 조정 게임으로 볼 수 있다. 시스템과 정책 업그레이드를 고려하는 블록체인 플랫폼의 경우, 가능한 결과는 첫 번째, 전체 체인이 업그레이드를 포기하고 현재 상태를 유지하는 것, 두 번째, 전체 체인이 새로운 시스템으로 업그레이드되는 것, 그라고 마지막으로 현재 상태를 유지하는 것을 선호하는 사용자와 업그레이드를 선호하는 사용자로 나눠져 결국 플랫폼이 분리되는 케이스가 발생할 수 있다. 그렇다면 블록체인 플랫폼이 하드포크(Hard Fork)와 같은 바람직하지 않은 균형에 이르지 않도록 하기 위해서는 어떻게 해야할 것인가.

참여자 입장에서는 체인의 현재 상태와 미래 상태를 비교해서 자신의 선호를 선택할 수 있지만 다른 한편으로는 체인의 ‘네트워크 효과(Network Effect)’를 고려하지 않을 수 없다. 즉, 다른 조건이 동일하다면 내가 선호하는 체인을 선택하는 것이 당연하지만, 양쪽에 대한 선호도가 큰 차이가 나지 않는다면 내가 선택한 체인이 스몰 체인으로 전락할 수밖에 없는 상황에서는 다수가 선호하는 체인을 선택하는 것이 전략적으로 우월하다. 내 선호 선택이 다른 참여자의 선택에 의존한다면 이는 일종의 조정 게임이며 조정의 문제는 앞서 설명한 포컬 포인트 개념으로 해결할 수 있다.

포컬 포인트는 모든 참여자들이 이해할 수 있는 공공연한 신호(Signal)다. 포컬 포인트는 여러 내쉬균형이 존재하는 경우 참여자들이 동일한 특정 균형점으로 향할 수 있도록 가이드하는 신호인 셈이다.

블록체인 플랫폼을 업그레이드해야 하는 상황에서는 ‘거버넌스 시스템(Governance System)’이 일종의 포컬 포인트를 보여줄 수 있다. 거버넌스 시스템이 참여자 선호 투표를 통해 다른 참여자의 선호를 알 수 있도록 한다면 이를 통해 조정이 이뤄질 수 있기 때문이다. 즉, 거버넌스 시스템 자체가 포컬 포인트가 된다. 거버넌스 시스템은 블록체인 사용자들이 자신의 이익 극대화를 위해, 자신의 최초 선호가 아닌 조정된 선택을 할 수 있도록 도와주는 역할을 한다.

블록체인 플랫폼 또는 디앱과 같은 탈중앙화된 시스템에서는 조정 게임을 닮은 수많은 케이스가 발생할 수 있다. 내쉬균형과 포컬 포인트와 같은 게임이론의 기본 개념을 잘 활용한다면 더 나은 블록체인 네트워크를 설계하는 데 큰 도움이 될 것이다. 나아가 게임이론뿐 아니라 암호경제학(Cryptoeconomics)의 핵심을 이루는 메커니즘 디자인(Mechanism Design)과 마켓 디자인(Market Design) 방법론으로 경제시스템을 설계한다면 블록체인 신뢰 네트워크를 더욱 더 견고하게 만들 수 있을 것이다.



댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
0 / 400
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.