다양성의
물리학
김범준
성균관대학교 물리학과 교수.
과학도 다양성을 생각한다. 과학자 사회의 구성이 다양할수록 과학 발전에 도움이 된다는 것도 잘 알려져 있다. 아래에 이어지는 글은 과학자의 다양성 이라기보다는, 과학의 연구 주제나 내용으로서의 다양성에 대한 것이다. 다양한 연구로 꾸준히 밝혀진 다양성의 가치에 대한 이야기다. 여러 다양한 예가 있다. 먼저, 구성이 다양한 도시일수록 그 도시에서 출원되는 특허가 많아진다. 특허 수로 측정한 한 도시의 혁신의 양은 도시 안 다양성과 함께 늘어난다는 연구결과다. 생명 진화에서 다양성이 가진 가치는 더 말할 나위도 없다. 유전자 다양성이 줄어들면 급격한 환경 변화에 적응하기 어려운 생물종이 멸종하기도 한다. 환경의 급격한 변화를 막는 노력과 함께, 종 다양성과 종의 개체수를 일정 규모 이상으로 유지하기 위해 우리가 힘써야 하는 이유다. 극도로 오염된 환경에서 생존하는 생물 종은 얼마 되지 않아 종 다양성이 줄어든다는 것도 잘 알려져 있다. 이를 이용해, 환경이 얼마나 건강한지를 그 환경에서 살아가는 생물종의 다양성으로 측정할 수도 있다. 경제 현상 연구에서도 다양성의 가치가 발견되기도 했다. 한 나라가 현재 생산하는 상품 품목이 다양할수록 그 나라가 미래에 경제 발전을 이룰 가능성이 높다는 연구결과도 있다. 이처럼, 우리가 마주하는 여러 현실 영역에서 다양성의 가치를 발견할 수 있다. 현실에서 다양성의 긍정적인 효과를 배워, 다양성을 과학 연구의 방법으로도 적극 활용하기도 한다. 생명 진화에서 다양성의 가치를 배워, 잠재 후보의 다양성을 일정 수준으로 유지해 최적화 문제를 푸는 알고리즘이 제안 되기도 했다. 더 나은 해결책을 찾으려면, 좁고 깊은 탐색보다, 다양하고 넓게 탐색하는 것이 더 유리하다. 배경과 지식이 다양한 여러 사람이 함께 참여하면 더 나은 해결책을 찾아낸다는 집단지성에서 배워, 여러 다른 다양한 알고리즘의 예측 결과를 결합한 앙상블 예측을 기상 예측에 이용하기도 한다. 성공적인 예측을 위해서는 앙상블에 함께 참여하는 모형의 다양성이 그중 특정 모형의 우수성보다 더 중요하다. 최근 주목받고 있는 인공지능의 지도학습에서도 데이터의 다양성은 무척 중요하다. 다양한 여러 현실 데이터를 이용해 인공지능을 학습시키지 않으면 인공지능은 엉뚱한 결과를 출력한다. 고양이와 강아지의 옆모습을 특정 조명 상태에서 촬영한 이미지만을 학습한 인공지능이 다른 환경에서 찍은 고양이와 강아지 정면 사진을 제대로 구별할 수는 없는 일이다. 사용자와 일대일 채팅으로 대화하는 인공지능 챗봇이 사회 일부 편향된 의견과 소수자에 대한 혐오 내용을 아무렇지도 않게 출력해 큰 충격을 주기도 했고, 범죄가 발생할 확률을 예측하는 인공지능이 피부색에 따라 다른 편향된 결과를 출력한다는 것이 알려지기도 했다. 학습 데이터의 편향이 결과의 편향으로 이어진 사례다. 다양성은 중요하다. 과학의 여러 연구 분야에서 다양한 연구를 통해 명확히 밝혀진 사실이다. 다양성은 도시의 혁신과 국가 경제 성장에 도움이 되고, 과학의 여러 문제에서 더 나은 해결책을 찾는 방법으로도 큰 도움을 주고 있다. 과학은 다양성의 가치를 꾸준히 발견하고 있다.
다양성이 큰 도시가 더 혁신적이다 1)
필자의 전공은 물리학 안에서 통계물리학이다. 여러 다양한 구성요소가 서로 영향을 주고받는 거시적인 시스템이 통계물리학의 연구 대상이다. 과거, 물리 시스템에 주로 국한되었던 통계물리학의 연구주제는 21세기 들어 폭발적으로 외연이 확장되었다. 물리학의 입자가 서로 상호작용하는 시스템에 대한 연구가, 무엇이라도 많이 모여 서로 상호작용하는 시스템에 대한 관심으로 이어졌다. 바로 복잡계(complex system)에 대한 연구다. 여러 분자로 이루어진 기체나 액체 시스템과 같은 전통적인 통계물리학의 연구 주제를 넘어, 요즘은 많은 사람이 함께 영향을 주고받으며 살아가는 사회를 복잡계의 시각에서 연구하기도 하고, 많은 경제 주체가 참여하는 경제 시스템을 연구하기도 한다. 일정한 지역 안에서 활발히 상호작용하는 많은 사람들로 이루어진 도시도 예외가 아니다. 물리복잡계를 넘어 사회복잡계, 경제복잡계, 그리고 도시복잡계에 대한 연구가 현재 활발히 진행 중이다. 상호작용하는 많은 구성요소로 이루어진 복잡계는 놀랍고 재밌는 특성을 보여줄 때가 많다. 대표적인 것이 바로 복잡계가 보여주는 창발현상(emergent phenomena)이다. 보이지 않던 해가 멀리 보이는 동쪽 수평선에서 떠오르듯이, 구성요소 하나에서는 찾을 수 없는 특성을 전체 복잡계가 새롭게 보여주는 것이 바로 떠오름 현상이라고도 부르는 창발현상이다. 창발을 보여주는 시스템은 전체가 부분의 단순한 합이 아니라는 특성을 나타낸다. 즉, 1 + 1이 2가 아닐 수 있다는 뜻이다. 도시도 마찬가지다. 인구 백만인 두 도시에서 어떤 양을 각각 계산해 단순히 둘을 더하면, 인구 2백만인 한 도시에서 관찰된 양과 다르다.
   두 도시가 있다. 첫 번째 도시의 인구는 두 번째 도시의 두 배라고 한다. 첫 번째 도시에서 사람들이 가지고 있는 재산을 모두 화폐단위로 환산해 계산한 총재산을 두 번째 도시에서 마찬가지로 계산한 총재산과 비교하면 둘 사이에는 어떤 관계가 있을까? 언뜻 생각하면 인구가 두 배인 도시의 총재산은 인구가 그 절반인 두 번째 도시가 가진 총재산의 두 배가 될 것이라고 짐작할 수 있다. 바로 1 + 1 = 2를 이용한 예상이다. 하지만, 실제 많은 도시의 데이터를 모아서 분석하면 통계적인 특성은 이와 다르다. 인구가 두 배인 도시의 총 재산은 2배가 아니라 평균 2.2배다. 즉, 일인당 재산을 계산하면, 인구가 많은 도시일수록 사람들이 평균적으로는 더 부유하다는 결론이다. 도시는 1 + 1이 2가 아니다. 도시의 총재산은 1 + 1 = 2.2라는 묘한 식을 만족한다.
   도시의 총재산뿐 아니다. 도시에서 출원되는 특허의 수를 마찬가지로 실제 데이터를 모아 분석하면, 특허의 수도 1 + 1 = 2.2다. 인구가 더 많은 도시일수록 일인당 특허 출원 수는 늘어난다. 또 도시를 운영하기 위해 필요한 기반 시설의 양을 현실 데이터로 분석하면 이 경우에는 1 + 1 = 1.8이 된다. 도시의 인구가 두 배 늘어나면, 하수도의 길이나 도로의 길이와 같은 도시 기반시설의 양은 두 배보다 적게 늘어난다. 도시는 인구가 늘어날수록 더 부유해지고, 더 혁신적이 되고, 더 효율적이 된다. 물론 인구가 늘어나면 발생하는 부작용도 있다. 도시에서 발생하는 범죄의 수도 1 + 1 = 2.2를 만족한다. 뿐만 아니라, 대도시로의 인구 집중은 여러 복잡한 사회 문제를 일으킨다. 이 모든 것이 도시가 1 + 1 = 2라는 식을 만족하지 않아 생기는 일이다.
   1 + 1 = 2를 만족하지 않는 도시의 기묘한 특성은 그렇다면 왜 나타날까? 아래 이어지는 특허 출원에 대한 논의는 현실을 극도로 단순화한 것임을 기억하고 필자의 설명을 듣기 바란다. 먼저, 출원되는 특허의 수는 도시에서 생산되는 새로운 아이디어의 숫자에 비례할 것이 분명하다. 다음에는 서로 다른 두 유형의 도시를 상상해보자. 유형 A에 속하는 도시에서 사람들은 새로운 생각을 떠올릴 때 독방에서 면벽수도를 한다. 다른 이를 만나지 않고, 혼자 골똘히 생각하다 떠올린 아이디어로 특허를 낸다. 이런 유형에 속한 도시에서 출원되는 특허의 수는 도시의 인구 N에 비례할 것이 확실하다. 예를 들어, 10만 명당 1명이 일 년에 한 건 정도 면벽수도로 특허를 낸다면, 20만 인구의 도시에서 는 2건, 100만 인구라면 10건의 특허가 출원될 것으로 쉽게 예상할 수 있다. 면벽수도를 특허의 방법으로 이용하는 유형 A의 도시에서 출원되는 특허의 수는 N에 비례한다. 자, 다음에는 두 번째 B 유형의 도시를 생각해 보자. 이 도시 사람들은 서로 만나서 이야기를 나누는 것을 즐긴다. 새로운 생각을 떠올릴 때도, 혼자 독방에 틀어박혀 골똘히 생각하는 것이 아니라, 다른 사람을 만나 얘기를 나누는 방식을 택한다. 또, 누구를 만나서 이야기를 나눌지에 대해 아무런 제한이 없어서, 도시의 누구와도 같은 확률로 만난다고 가정해보자. 즉, 이 도시에 사는 사람들은 하나같이 모두가 서로 친구라는 얘기다. 둘이 서로 만나 이야기를 나누다 보면, 어쩌다 새로운 생각을 떠올리게 된다고 가정하면, 유형 B에 속하는 도시에서 출원되는 특허의 수는 이 도시 안에서 두 사람이 만나는 모든 경우의 수에 비례한다고 할 수 있다. 만약 인구가 N명이라면 이 도시에서 서로 만나는 2명을 뽑는 경우의 수는 N(N-1)/2이다. 대화를 나눌 첫 사람으로 N명 중 1명을 고르는 가짓수가 N이고, 이 사람을 뺀 N-1명에서 대화의 둘째 상대를 고르는 가짓수가 N-1이다. 하지만, 철수가 영희를 만나나 영희가 철수를 만나나, 똑같은 둘의 만남이라서, N(N-1)로 계산하면 모든 가능한 경우를 두 배로 계산한 셈이다. 결국 답은 N(N-1)/2가 된다. 도시의 인구가 충분히 크다면 N-1은 N과 거의 같고, 따라서 유형 B인 도시에서 출원되는 특허의 수는 N의 제곱에 비례하게 된다. 위에서 함께 생각해본 두 도시의 유형은 아무리 봐도 현실적이지 않다. A 유형 도시 사람들처럼 따로따로 면벽수도로 특허를 내는 사람은 현대 현실 사회에 거의 없다시피 하고, B 유형처럼 모두가 모두와 친구인 도시도 현실에는 없다. 즉, 현실의 도시에서 출원되는 특허의 수가 Na에 비례한다고 적으면, 유형 A인 도시에서 얻은 a = 1은 너무 작은 값으로 보이고, 유형 B인 도시에서 얻은 a = 2는 또 너무 큰 값으로 보인다. 아마도 현실에서는 a의 값을 1과 2 사이로 추정하는 것이 그럴듯하다.
   현실의 많은 데이터를 모아 분석한 연구결과에 따르면 인구가 2배인 도시에서 출원되는 특허의 수는 앞에서 이야기했듯이 평균 약 2.2배이다. 위에서 단순한 모형으로 얻은 결과를 일반화해서 인구 N인 도시에서 출원되는 특허의 수가 Na에 비례한다고 적으면, 현실에서의 지수 a는 2a = 2.2를 만족한다. 계산기를 눌러보니 a = 1.15 정도다. 여러 도시의 데이터로 확인한 결과가 바로 이 값이다. 먼저, 현실에서 a가 1보다 큰 이유는 명확하다. 사람들이 만나야 새로운 생각을 할 수 있기 때문이다. 그렇다면 a가 2보다 작은 이유도 명확하다. 도시에 사는 사람들 모두가 서로 친구는 아니기 때문이다. 도시에 사는 사람들이 얼마나 폭넓게 사람들을 만나는지를 연구한 논문도 있다. 2) 개인정보가 없는 익명 통화 패턴에 관한 빅데이터를 분석해서 포르투갈의 여러 도시에서 사람들이 얼마나 많은 다른 이와 통화를 하는지 살펴본 연구다. 인구가 N인 도시에서 전체 통화 상대의 수가 Nb에 비례한다고 적고, 현실의 데이터로부터 b = 1.12라는 결과를 얻었다. 현실에는 존재하지 않는, 모두가 서로 친구인 상상의 유형인 B도시에서 추정한 a = 2보다 작은 값이다. 현실 빅데이터를 이용해 출원되는 특허의 수와 전화 통화의 상대방의 수를 분석하면, 둘 모두 도시의 인구보다 더 빠르게 늘어난다는 공통점을 보인다. 1.15와 1.12가 거의 같은 값이라는 것을 떠올리면, 도시에서 출원되는 특허의 수가 도시의 인구보다 더 빠르게 늘어나는 이유를 알 수 있다. 사람들이 서로 소통하기 때문이다. 새로운 생각도 서로 만나야 떠오르는 것이 우리 인간이다.
   자, 다음에는 다양성에 대한 이야기를 해보자. 사람들이 만나 이야기를 하다 새로운 생각을 떠올리게 된다는 가정으로 위의 논의를 해봤다. 하지만, 만나는 두 사람의 생각이 처음부터 완전히 같았다면, 만난다고 해서 새로운 생각을 떠올리기는 어렵다. 사람들의 생각이 다양하고, 다양한 생각을 가진 사람들이 서로 만날 때, 사람들은 새로운 아이디어를 떠올릴 수 있다. 따라서, 도시를 구성하는 사람들이 다양할수록, 그 도시에서 출원되는 특허의 수가 늘어난다는 생각을 할 수 있다. 실제 현실에서도 인구가 비슷한 두 도시라도 출원되는 특허의 수가 다르다는 연구결과가 있다. 이 데이터를 분석하는 방법을 떠올리는 것은 어렵지 않다. 특허의 수가 평균적으로는 N1.15에 비례한다는 것을 확인했으니, 각 도시에서 출원되는 특허의 수를 그 도시의 인구의 1.15승으로 나누고 나서, 그렇게 얻어진 값들로 여러 도시를 비교하면 된다. 도시를 구성하는 사람들의 다양성을 측정하는 것은 쉽지 않지만, 도시의 다양성을 직종의 다양성으로 측정해 도시의 다양성이 출원되는 특허의 수에 영향을 준다는 것을 밝힌 연구가 있다. 사람들은 서로 소통해 새로운 혁신을 만들어내고, 도시의 창의성은 도시의 다양성과 깊은 관계가 있다. 다양성은 사회적, 문화적인 측면에서 중요한 가치일 뿐 아니라, 한 사회의 경제적 성장과 혁신을 위해서도 중요한 가치라는 것은 큰 의미가 있다. 우리 사회가 다양성을 늘려가야 하는 이유에는 다른 이에 대한 배려와 불평등 해소뿐만 아니라 다른 과학적 근거도 있다는 말이다. 다양성이 늘어야 사회가 더 혁신적이 되고, 늘어난 혁신은 경제 발전에도 도움이 된다.
   통계물리학 분야 연구자들이 발표한 일련의 논문이 있다. 3) 여러 국가의 국내 총생산(Gross Domestic Product, GDP)이 시간에 따라 어떻게 변화해 왔는지, 실제 현실의 데이터를 설명하는 개념으로 경제적 복잡성(Economic Complexity)을 측정하는 지표를 제안한 연구들이다. 흥미롭게도 연구자들은 자신들이 제안한 경제적 복잡성의 측정 지표를 적합도(fitness)라고 불렀다. 적합도가 높은 생물종이 이후 더 많은 자손을 남기듯이, 연구자들이 제안한 경제적 적합도는 한 나라의 미래 경제 발전의 선행 지표일 수 있다는 의미를 이 용어에 담고자 한 것으로 보인다. 논문 연구자들이 제안한 경제적 적합도는 한 나라가 얼마나 다양한 영역의 상품을 생산할 수 있는지에 관계된다. 특정 첨단 상품을 대량 생산할 수 있는지 여부보다도, 이러한 첨단 상품을 만들어내기 위한 다양한 기반 산업 영역의 생산능력을 고루 갖추고 있는지가 오히려 더 중요하다는 결론이다.
   논문에 실린 그래프 중 필자가 강한 인상을 받은 그림이 있다. 가로축에는 연구자들이 제안한 적합도를, 그리고 세로축에는 GDP를 그리면, 한 나라의 현재 상태는 이렇게 표현된 2차원 평면 위에서 한 점으로 표시된다. 시간에 따라 한 나라가 2차원 평면 위에서 어떤 궤적을 그리며 변화했는지를 살펴보면 일관적인 패턴을 볼 수 있다. 물리학과 비선형동역학 분야에서는 이런 방식으로 동역학적인 변화를 살펴보는 방법을 널리 쓴다. 이와 같은 2차원 평면을 위상공간이라고 하고, 위상 공간의 한 점을 위상점, 그리고 위상공간에서 위상점이 보여주는 궤적을 위상궤적이라고 부른다. 논문의 그래프에서 명확히 알 수 있는 것이 있었다. 바로 높은 적합도를 가진 국가는 결국 GDP의 꾸준한 상승을 보여 왔다는 것이었다. 위상공간의 오른쪽 아래인 높은 적합도와 낮은 GDP에서 출발한 국가는 예외 없이 GDP가 높은 위상공간의 오른쪽 윗부분으로 향하는 위상궤적을 보여준다. 한편, 과거 높은 GDP를 가졌어도 적합도가 낮았던 나라들은 GDP의 꾸준한 상승을 전혀 볼 수 없었다. 이 연구에 참여한 물리학자의 강연을 한 국제학회에서 직접 들었던 경험이 있다. 강연자가 잠깐 얼핏 보여주고 넘어간 강연 자료의 한 페이지에서, 북한이 이 2차원 평면에서 현재 어느 위치에 있는지가 필자의 눈에 띄었다. 북한은 현재 상당히 높은 수준의 적합도를 가지고 있으면서 가장 GDP가 낮은 국가 중 하나였다. 위에서 소개한 연구 결과에 따르면, 북한은 세계에서 가장 높은 미래 경제 성장의 가능성이 있는 나라로 보였다. 북한이 전 세계의 경제 시스템과 연결될 미래를 필자가 고대하는 이유다.
다양성은 더 나은 해결책을 준다
주어진 문제에 대한 최적의 답을 찾는 문제는 여러 학문 분야에서 중요하다. 이를 최적화 문제(optimization problem)라 부른다. 물리학도 예외가 아니다. 서로 상호작용하는 수많은 구성요소로 이루어진 물리 시스템이 궁극적으로 선호하는 최종의 상태는 어떤 물리량이 최솟값을 가질 때가 많다. 물이 얼면 결정구조를 가진 얼음이 되는 이유도, 교과서에서 본 육면체 모양 소금의 결정구조도 바로 이렇게 결정된다. 가장 낮은 에너지를 가지는 바닥상태가 많은 물질의 고체상태의 모습을 결정한다. 이처럼 온도가 충분히 낮을 때에는 에너지의 바닥상태가 물질의 평형상태에 해당한다. 반대로 아주 높은 온도일때는 에너지가 가장 낮은 상태가 아닌, 엔트로피가 가장 높은 상태가 물질이 최종적으로 도달하게 되는 평형상태다. 온도가 낮을 때 물이 얼어 얼음이 되는 이유는 얼음이 물보다 에너지가 낮기 때문이다. 온도가 높을 때 물이 증발해 수증기가 되는 것은, 수증기가 물보다 엔트로피가 더 크기 때문이다. 통계물리학의 자유에너지는 이런 면에서 아주 유용하다. 절대온도와 엔트로피를 곱한 값을 에너지에서 뺀 양으로 정의되는 자유에너지를 이용하면 위의 모든 과정을 쉽게 기술할 수 있다. 물이 얼어 얼음이 되고 물이 끓어 수증기가 되는 모든 변화의 과정에서 자유에너지가 줄어든다. 거시적인 물리 시스템의 평형 상태는 자유에너지가 최솟값이 되는 상태다.
   생물학에서 모든 종은 주어진 환경에서 가장 높은 적합도를 가지는 유전형을 선호한다. 생물종의 적합도는 간단하게는 이 종이 만들어내는 생존 자손의 수로 생각할 수 있다. 변이가 생겨서 유전형이 조금씩 다른 여러 자식이 태어나고 이 중 주어진 환경에 적응해 가장 많은 자손을 이어서 남기는 자식이 이후 세대로 유전자를 물려준다. 낮은 온도에서 물리 시스템은 에너지가 최소가 되는 바닥상태를 선호하지만, 생물학에서의 생물종은 높은 적합도를 선호한다. 에너지와 적합도를 대응시키면 최솟값과 최댓값만 다를 뿐, 둘 사이에 비교가 가능하다. 물론, 생물종이 높은 적합도에 해당하는 유전형을 탐색해 찾아가는 과정은 물리학에서 물질이 바닥상태를 찾아가는 과정과는 비교할 수 없을 정도로 복잡하다. 바로 적합도 자체가 한 생물종이 살아가는 주변의 무생물적 환경뿐 아니라 다른 모든 생물종의 영향을 받아 끊임없이 변화하고 있기 때문이다. 바로 요즘 진화과학에서 이야기하는 포괄 적합도(inclusive fitness)의 개념이다.
   물리학에는 에너지 풍경 혹은 에너지 지형(energy landscape)이라는 개념이 있다. 울퉁불퉁 높은 산봉우리와 깊은 산골짜기가 펼쳐져 있는 산 풍경을 떠올려보라. 우리가 현실에서 자주 보는 산 풍경에서 산의 높이 방향을 물질의 에너지로 생각하고 산이 옆으로 펼쳐진 수평 방향을 물질이 가질 수 있는 여러 다양한 구성 방법으로 비유하면, 에너지 지형이 어떤 것인지 떠올릴 수 있다. 물리학의 많은 물질들은 낮은 온도에서 에너지 지형의 가능한 가장 깊은 골짜기에 있으려 한다. 같은 비유로 생물학의 적합도 지형(fitness landscape)도 생각할 수 있다. 이때 산의 높이 방향은 생물종의 적합도에 해당하고, 산이 펼쳐진 수평 방향은 생물종이 가질 수 있는 가능한 유전형으로 생각할 수 있다. 물리학의 많은 문제는 주어진 산 풍경에서 가장 깊은 산골짜기에 해당하는 에너지의 바닥상태를 찾는 것에 해당한다면, 생물종이 맞닥뜨리는 문제는 끊임없이 변화해 가는 산 풍경에서 가장 높은 산봉우리로 오르는 노력에 해당한다. 물질이 맞닥뜨리는 문제보다 훨씬 더 어려운 문제다. 왜? 잠깐 차지한 산봉우리는 산 풍경이 변하면 더 이상 꼭대기가 아니기 때문이다. 제 자리에 가만히 있는 생물종은 결국 멸종한다. 잠깐 차지했던 적합도 지형의 높은 산꼭대기는 시간이 지나면 더 이상 살 수 없는 깊은 산골짜기가 된다. 살아있으려면, 생명은 끊임없이 변하는 적합도 지형 안을 끊임없이 이동해야 하는 셈이다.
   여러 학문 분야에서 맞닥뜨리는 최적화 문제를 해결하는 여러 다양한 알고리즘이 있다. 그중 생명의 진화에서 아이디어를 얻은 것이 바로 유전 알고리즘(genetic algorithm)이다. 실제 생명의 진화 과정을 컴퓨터 프로그램의 알고리즘으로 흉내 내어 구현하는 방법이다. 에너지 바닥상태를 찾는 최적화 문제를 예로 유전 알고리즘을 설명해보자. 에너지 지형의 수평 방향은 가능한 모든 시스템의 구성 방법에 해당한다. 유전 알고리즘에서는 현재 시스템이 가질 수 있는 상태의 조합을 생각하고, 이들이 둘씩 짝으로 만나 결합해 후손을 남긴다고 생각한다. 후손은 자신의 부모가 가진 조합을 적절히 결합해 만들어진 새로운 상태를 가진다. 이렇게 탄생한 후손이 주어진 최적화 문제에 더 나은 답을 준다면 이 후손은 생존해 이후에 자손을 남기지만, 부모 세대보다 더 못한 자손이라면 생존하지 못해 사라진다. 이런 방법을 계속 반복하다 보면, 주어진 최적화 문제에 대해 더 나은 답을 주는 상태를 향해 계속 나아가게 된다. 유전 알고리즘은, 생명의 진화에서 과학이 배운, 컴퓨터를 활용한 최적화 문제의 효율적인 해결 방법이다. 이런 방식으로 유전 알고리즘을 구현하다 보면 마주치게 되는 심각한 문제가 있다. 만약 물리학의 바닥상태를 찾는 문제를 유전 알고리즘을 적용해 구현하면, 프로그램 내 시스템의 현재 상태는 점점 에너지 지형의 골짜기를 향해 나아간다. 시간이 지나다 보면, 부모 모두 한 골짜기 안에서 택해지게 되고, 따라서 둘의 결합으로 만들어지는 후손도 같은 골짜기에서 태어나게 된다. 결국 시간이 지나다 보면, 에너지 지형의 한 골짜기 안에서만 진화 알고리즘의 세대가 계속 이어지게 된다. 한번 깊은 골짜기 하나에 빠지면 이후에 세대가 지나도 그 골짜기 안에만 계속 머문다는 심각한 문제가 발생한다. 지금 있는 골짜기보다도 에너지 지형 저 너머 더 깊은 골짜기가 있을 수 있는데도 불구하고 한 골짜기에 계속 머물게 되는 문제다. 유전 알고리즘을 이용한 최적화 문제의 해결 방법이 맞닥뜨리는 이 문제를 국소 해(local solution)와 전역 해(global solution)의 문제라고 한다. 찾아야 하는 골짜기는 전체 영역(global)에서 가장 깊은 골짜기인데, 유전 알고리즘이 좁은 영역(local) 안에서의 깊은 골짜기에 빠져 헤어 나오지 못하는 문제다. 국소 해의 문제는 그럼 어떻게 해결할 수 있을까? 당연한 해결책이 있다. 바로 자손을 만들기 위해 결합하는 부모 세대로 많이 닮지 않은 둘을 택하는 방법이다. 이것도 자연에서 우리가 배울 수 있는 방법이다. 과거 인류가 씨족 사회의 형태로 작은 마을을 이뤄 살아갈 때도, 남녀의 혼인은 가능한 다른 마을 사람 사이에서 했던 것도 마찬가지다. 최적화 문제의 해결에도 다양성이 중요하다.
   다윈은 갈라파고스 군도의 여러 섬을 방문하면서 섬마다 독특한 형질을 갖도록 진화한 핀치 여러 종을 관찰하게 된다. 지리적으로 떨어진 섬에서는 각 섬에 특화한 서로 다른 환경이 있고, 주어진 환경에 가장 성공적으로 적응하려는 진화의 압력으로 독특한 부리 모양을 가진 여러 핀치 종이 다양하게 만들어졌다는 것을 다윈은 발견하게 된다. 필자의 연구그룹에서 최근 진행한 연구가 바로 다윈의 핀치 이야기에서 얻은 아이디어로 출발했다. 바닥상태를 찾기가 무척 어려운 문제로 잘 알려진 물리 시스템을 택해서(정확한 해를 구하는 것이 불가능한 것으로 알려진 3차원의 스핀-유리 모형을 이용했다.), 바닥상태를 찾는 과정에서 어떻게 하면 부모 세대의 다양성을 유지할 수 있을지를 고민하다 재밌는 아이디어를 떠올리게 되었다. 무척 간단한 생각이다. 갈라파고스 군도의 여러 섬처럼 서로 다른 환경에서 약간씩 다른 에너지 지형을 가지는 여러 시스템을 동시에 알고리즘 안에서 진행하면서, 가끔씩은 서로 다른 국소적인 에너지 지형에서 만들어진 두 시스템이 서로 만나 다음 세대의 상태를 만들어내도록 한 아이디어다. 다윈의 핀치에 견주어 설명해보면, 간혹 다른 섬에 멀리 떨어진 두 핀치가 만나 기존의 핀치와는 상당히 다른 유전형을 가지는 자손이 태어나도록 하는 방법이라 할 수 있다. 어느 정도의 다양성을 유지하는 것이 에너지의 바닥상태를 찾는데 효율적인 방법이라는 것을 확인 할 수 있었다. 가장 나은 해결책을 찾는 최적화 알고리즘에서도 다양성을 유지하는 것이 성공의 지름길이다. 가장 높은 곳에 가려면 가능한 넓게, 다양하게 탐색해야 한다는 뜻이기도 하다.
다양성은 사람들 사이의 교류를 넓힌다
한 사람이 가지고 있는 의견은 정말 다양하다. 정치적으로는 진보적인 성향을 가진 사람도 경제적인 측면에서는 보수적일 수 있고, 듣는 음악도 읽는 책도 모두 다를 수 있다. 사람이 가진 생각은 일차원의 직선 위에서 한 숫자로만 표현할 수 없는 복잡성을 가진다. 과거 인공지능의 발전 과정에서 한동안 장벽으로 작용했던 흥미로운 문제가 있다. 바로 XOR 문제라고 불리는 논리 연산에 대한 것이다. 배타적 논리합(exclusive-or)이라고 불리는 XOR은 무척 단순한 논리 연산 함수다. 입력으로 두 값이 주어지고, 두 값으로 주어진 각각의 짝에 대해 하나의 참/거짓 값을 출력하는 논리연산은 여럿이 가능하다. 예를 들어, 두 논리값이 (참, 참), (참, 거짓), (거짓, 참)이면 참을 출력하지만 (거짓, 거짓)의 경우에는 거짓을 출력하는 것이 OR이라고 적는 논리합이라는 논리연산이다. 참에 해당하는 값으로 1을, 거짓에 해당하는 값으로 0을 대응시키면, 논리합은 (1,1), (1,0), (0,1)이라는 2차원 평면의 세 점에 대해서는 1을, 원점인 (0,0)에 해당하는 입력에는 0을 출력하는 연산이다. 이 글을 읽는 독자도 한번 간단히 그림을 그려보면, (1,1), (1,0), (0,1)이란 세 점과 (0,0) 사이를 가로지르는 직선을 쉽게 그릴 수 있다는 것을 알 수 있다. 즉, 논리합은 직선으로 표현되는 선형 연산을 통해서 구현할 수 있다는 이야기다. 배타적 논리합은 다르다. (1,1)(0,0)에는 0을 출력하고, (1,0)(0,1)에는 1을 출력하는 논리연산이다. 2차원 평면에 정사각형의 네 꼭짓점이 있고, 이중 서로 대각선 방향으로 마주하는 두 점은 같은 결과를 출력하는 논리연산이다. 독자도 한번 종이에 네 점을 그리고 시도해보시라. 배타적 논리합에 해당하는 결과를 구현하려면 직선 하나를 그어 네 점을 두 그룹으로 나눌 수 있어야 한다. 하지만, 어떻게 직선을 그리더라도 대각선 방향으로 떨어져 있는 두 점을 한 그룹으로 해서, 네 점을 두 그룹으로 나눌 수 없다는 것을 알 수 있다. 즉, 딱 하나의 선형 연산의 방법으로는 배타적 논리합을 구현할 수 없다는 이야기다. 이 문제가 바로 유명한 XOR 문제다. 이후, 신경망의 구조를 이용해 논리연산을 구현하는 과정에서 입력층과 출력층 사이에 은닉층을 하나 추가하면, 두 번의 선형 연산이 가능하게 되어, XOR문제를 해결할 수 있다는 것이 알려지게 되었다. 요즘 널리 이용하는 딥러닝도 여러 은닉층을 가지는 인공신경망의 구조를 이용하고 있다.
   사람이 가진 생각도 마찬가지가 아닐까? 정치적인 성향이 진보인지와 보수인지를 가로축에, 경제적인 의견은 시장의 자율성을 강조하는 입장과 정부의 적극적인 개입을 강조하는 입장으로 나눠 세로축에 간단히 표현하더라도 각자의 정치/경제에 대한 입장에 따라 모두 네 개의 조합이 가능하다. 딱 두개의 의견의 축만 있는 경우에도 사람들을 두 그룹으로 마치 두부 한모를 칼로 자르듯 간단히 나누는 것은 불가능하다는 것을 알 수 있다. 바로 XOR 문제에서 우리가 배울 수 있는 교훈이다.
   정치학자 악셀로드의 논문을 소개하고자 한다. 4) 논문에서 문화의 확산과 수렴을 연구하기 위해 이용한 간단한 모형에서는 한 사람이 가질 수 있는 문화적인 요소를 D-차원의 벡터로 표시했다. 만약 D = 3이라면, 한 사람이 가질 수 있는 상태는 (x, y, z)라는 3개의 숫자로 표현할 수 있다. 예를 들어, x는 이 사람이 가진 음악에 대한 취향, y는 미술에 대한 취향, z는 문학에 대한 취향이라고 생각해 볼 수 있다. 서로 다른 문화 요소에 대한 취향 각각은 또 여러 다양한 값을 가질 수 있다. 이것도 예를 들자면, 음악에 대한 취향인 x는 클래식 음악인 경우가 x = 1, K-팝 음악은 x = 2, 트로트 음악은 x = 3으로 적는 식이다. 각 문화 요소의 취향에 얼마나 다양한 경우가 있는지를 N으로 표시하면, 클래식, K-팝, 트로트처럼 세 취향이 가능하면 N = 3에 해당하게 된다. 악셀로드의 연구에서 중요한 조절변수가 바로 D와 N이다. 각자가 가진 문화요소의 벡터 표현을 비교해 둘이 서로 비슷할수록 둘 사이에 상호작용과 교류가 일어날 확률이 높다고 논문의 모형은 가정했다. 우리 일상의 경험으로도 쉽게 동의할 수 있는 가정이다. 우리는 주로 비슷한 취향의 사람들과 교류하는 성향이 있기 때문이다. 모형 내부의 한 사람 A가 문화 취향의 벡터가 자신과 비슷한 사람 B와 일단 상호작용을 하게 되면, A는 B와 값이 다른 문화 요소 중 하나를 D개 중에서 택하고, 이 요소에 대해 B가 가진 값으로 자신의 값을 변화시키도록 했다. 예를 들자면 이런 식이다. 음악에 대한 취향은 다르지만 미술과 문학에 대한 취향이 비슷한 두 사람은 각자의 문화 요소 벡터가 비슷해서 상호작용을 할 확률이 크다. 이 두 사람 A와 B가 상호작용을 하게 되었고, A는 트로트를 B는 클래식을 좋아하는 상황이라면, A의 음악 취향이 B의 취향을 따라 클래식으로 바뀌게 된다. 아주 단순한 이론적인 모형이지만, 시간이 진행하면서 특정 문화 요소의 벡터를 가진 사람들이 늘어나는 방식으로 이 가상의 전체 사회에 문화가 전파된다. 악셀로드의 연구가 알려주는 결과가 흥미롭다. 먼저, 각 문화 요소에 허락된 취향이 다양할수록, 즉 위의 표기에서 N이 늘어날수록, 같은 취향을 균일하게 가진 그룹의 수가 늘어난다는 결과는 우리의 직관과 일치한다. 이 세상에 클래식 음악만 있는 것보다는 다양한 음악의 장르가 있다면 사람들은 선호하는 음악의 장르에 따라 여러 그룹으로 나뉠 수 있다는 결과이다. 만약 D가 늘어나면 어떻게 될까? 이 경우의 악셀로드 모형의 연구결과가 필자에게는 무척 흥미로웠다. 바로 같은 취향을 균일하게 가지는 집단의 수가 줄어든다는 것이었다. 필자는 악셀로드의 결과를 보면서, 여러 다양한 의견의 축이 존재하는 사회에서 더 큰 통합의 가능성을 생각했다. 각자의 취향이 딱 하나의 값으로 표현되는 것이 아니라 고차원의 벡터로서 여러 좌표축을 따라 존재한다면, 사람들은 더 큰 규모로 의견의 일치에 이르게 된다고 해석할 수 있는 여지가 있는 결과였다. 나와 정치적 의견이 달라도 경제적 의견이 비슷하다면, 우리가 서로 귀를 기울여 분열을 막을 수 있다는 의미로도 읽힐 수 있는 결과다. 최근 우리 사회에서도 심각하게 문제가 되고 있는 사회의 분열을 막으려면, 하나의 사안에서는 나와 의견이 다르더라도 다른 사안에서는 나와 의견이 같을 수 있다는 것을 잊지 말아야겠다는 교훈도 얻을 수 있다. 획일화된 딱 하나의 잣대로 사람들을 판단하기보다, 다름 안에서 같음을 보려 우리가 노력해야 하는 것은 아닐까? 극단적인 분열을 극복하고 사회의 통합을 유지하려면 사람들의 다양성을 인정해야 한다는 말이다.
다양성의 과학, 과학의 다양성
앞에서 이야기한 다양성과 도시의 혁신, 그리고 다양성과 경제 발전에 대한 논의로도 당연히 과학자 사회의 구성이 다양할수록 과학이 더 빨리 발전할 수 있으리라는 예측을 할 수 있다. 최근 일선 과학 연구의 현장도 마찬가지다. 한 사람의 과학자가 할 수 있는 연구를 N명의 과학자에 대해 모두 모아 단순합을 구하면 N에 비례한다. 하지만 N명의 과학자가 함께 소통하며 연구하면, 전체가 성취하게 될 연구는 N보다 더 빠르게 늘어날 것이 분명하다. 과학에서 꾸준히 발견되어온 다양성의 중요한 가치는 과학자 사회 내부의 다양성에도 적용될 수 있다. 세상에 대한 이해가 가장 근본적인 목표라 할 모든 과학분야도 마찬가지다. 물리학이라는 획일화된 잣대로 바라보는 자연보다는 여러 분야의 과학자가 함께 바라봐 이해하는 자연이 더 풍성하고 아름다울 것도 분명하다. 과학 연구에도, 그리고 과학자 사회에도, 다양성은 포기할 수 없는 중요한 가치다.
목차
다양성의 물리학
포스트코로나 시대의 돌봄국가
듣기
화면 설정
arrow_drop_down
  • 돋움
  • 바탕