자식 가진 사람에게 자기 아이가 엄마나 아빠 같은 말을 처음 할 때처럼 신기한 기억은 별로 없을 것이다. 누워서 젖만 빨 줄 알았던 핏덩이가 한 두 마디라도 말을 하면 그처럼 대단해 보이는 일도 없다. 하지만 그 아이가 학교에 다닐 나이 정도 되면 말 한두 마디 한다고 놀라고 신기해하는 사람은 별로 없다. 서너 살 먹은 아이가 글자 한두 개 알아보는 것은 정말 대단한 일이지만 중학생이 만화책을 하루에 10권 읽었다고 대단하다고 할 부모는 없다. 공부 안하고 만화책 본다고 욕먹지나 않으면 다행이다.
내 생각에는 인공지능이 그런 젖먹이의 단계인 것 같다. 많은 사람들이 일부 인공지능의 결과에 대해서 신기해 하긴 하지만 이게 실제로 뭘 할 수 있는지에 대해서는 딱히 답을 하기 힘들다. 인공지능에 대한 연구가 시작된지는 오래되긴 했지만 영상 인식이나 음성 인식 같은 일부 기초 분야를 뛰어 넘는 언어 처리나 창의적인 영역에서는 거의 아무런 성과가 없는 것이 사실이다. 기초 분야도 아주 너그럽게 봐주면 성과가 있다고 할 수 있겠지만 내 생각에는 아직 어린 아이들의 재롱에 불과한 수준이다. 사람과 비슷한 정도의 영상 인식 능력을 갖추는 것은 아직도 요원한 일이다. 인공지능에서 꽤 앞서 간다는 구글 사가 만든 구글포토는 얼마 전 흑인 사진을 보고 고릴라라고 인식한 것 때문에 문제가 되었는데 내 전화기에서도 구글포토를 통해 고양이를 검색하면 고양이와 함께 햄스터도 검색된다.
작년 와이어드 지에 실린 영상 인식의 한계에 대한 기사에 따르면 첨단 기술을 이용한 영상 인식도 터무니 없는 결과를 낸다. 아래의 추상적인 패턴들은 각각 황제 펭귄, 불가사리, 야구공, 전자 기타, 화물칸, 리모콘, 공작, 회색 앵무새로 인식되었다.
사진이 아니라 손으로 그린 그림 같은 경우는 특히 컴퓨터가 약한데, 사람이라면 누구나 인식할 해, 달, 집, 산과 같은 손그림을 제대로 인식하는 컴퓨터는 없다.
글자 인식도 오래된 분야이긴 하지만 일상적인 글자체로 아주 깨끗하게 인쇄된 경우가 아니면 사람에 비해 인식률이 굉장히 낮다. 아래 책표지의 사진에 쓰인 글씨들도 대부분의 사람들이 쉽게 읽어낼 수 있지만 현재 수준의 컴퓨터가 읽어내기는 거의 불가능하다.
위의 사진은 구글 번역기에서 인식한 사진인데 어떤 것이 글자고 어떤 것이 글자가 아닌지 판단하는 것에도 어려움을 겪고 있음을 알 수 있다. 그렇게 해서 인식한 내용은 다음과 같다.
초등학교 1학년 중에도 이렇게 글자를 제대로 인식하지 못하는 학생은 별로 없다. 하지만 이런 얘기를 하면 그림이랑 섞여 있기 때문에 어렵다던가 폰트가 일상적인 것이 아니라서 인식이 어렵고 이런 그림을 컴퓨터에게 보여준다는 사실 자체가 공정하지 않은 짓이라는 등의 반응을 듣는 경우도 있다. 글쎄, 내 생각에는 이 정도는 읽을 수 있어야 글자 인식을 어느정도 한다고 할 수 있을 것 같은데 사람들은 인공지능에 대해서 무척이나 관대한 것 같다. 마치 우리가 갓 태어난 아이들을 대할 때처럼 말이다.
하지만 인공지능의 상황과 미래에 대한 글들을 주변에서 읽어 보면 이렇게 생각하지 않는 전문가들이 꽤 있는 것 같다. 마치 당장이라도 컴퓨터가 사람을 대체해서 모든 일을 할 수 있을 것 같은 식의 기사들을 많이 볼 수 있다. 얼마 전 바둑을 잘 두는 사람을 이겨서 화제가 된 알파고 때문에 최근에는 그런 기사와 글들이 더 많아졌다. 알파고는 바둑에서 이긴 것 때문에 워낙 유명해져서 이제는 인공지능과 별 관계가 없는 모든 컴퓨터 기술까지 대표하는 존재가 되었는데 사실 바둑과 같은 게임에서 이기는 것은 기술적으로는 어느 정도의 성과라고 볼 수는 있지만 인공지능 발전에서 큰 의미가 있는 일이라고 보기는 힘들 것 같다. 호프스태터는 40여 년 전 이미 괴델, 에셔, 바하에서 체스로 사람을 이기는 일이 인공지능이 가장 먼저 할 수 있는 일 중에 하나임을 예측했다. 바둑팬들은 바둑이 체스와는 수준이 다른 게임이라고 주장하며 이번에 알파고의 승리가 인공지능의 새 지평을 연 듯한 반응을 보이지만 사실 두 게임의 차이가 그렇게 크다고 보기는 힘들다. 많은 사람들이 경우의 수를 얘기하지만 두 게임 모두 단순히 가능한 경우의 수를 따지면 우주의 원자의 개수보다 수억 배 이상 많기 때문에 어차피 크게 의미 있는 숫자는 아니다. 체스도 열 몇 수만 두면 그 게임의 상태는 역사상 한 번도 존재하지 않았던 형태가 된다. 인공지능이 장착된 컴퓨터가 바둑보다 체스에서 인간에 먼저 승리를 거두긴 했지만 그것은 인공지능 연구자들이 체스에 더 친숙하기 때문이지 다른 이유는 없는 것 같다. 바둑에 친숙한 동양인들이 인공지능에 먼저 관심을 가졌다면 당연히 인공지능이 바둑에서 먼저 성과를 냈을 것이다. 현재 스타크래프트라는 컴퓨터 게임에서는 컴퓨터가 엄청나게 저조한 성적을 보이고 있지만 그렇다고 해서 꼭 스타크래프트가 바둑보다 더 어려운 분야라고는 할 수 없다. 만약 호프스태터가 바둑에 관심이 있었다면 바둑에서의 승리를 예측했을 것이다.
이런 얘기를 하긴 했지만 사실 나는 바둑에 대해서 거의 아무것도 모르고 체스나 스타크래프트도 한 번 해본 적이 없다. 인공지능에 대해서도 조금 공부를 하긴 했지만 그 지식 수준은 전문적인 수준과는 거리가 한참 멀다. 하지만 신문에 요즘 많이 나오는 인공지능에 대한 기사들이 거의 백프로 엉터리라는 사실은 이쪽 분야에 관심이 조금이라도 있는 사람은 쉽게 알 수 있다. 신문기사에 독자들을 낚기 위한 흥미로운 요소가 있어야 하는 것은 어쩔 수 없는 사실이지만 갈수록 사실과 기사와의 간극은 점점 커지는 것 같다. 전문가라는 사람들도 크게 다르지는 않다. 사실 어떤 분야의 미래와 사회에 끼치는 영향에 대해서 가장 낙관적인 예측을 하는 사람은 바로 그 분야의 전문가들이다. 만약 전문가가 자기 분야의 전망이 그렇게 밝지 않다고 주장한다면 그건 좀 이상한 일이다. 내가 왜 이 쓸데없는 일을 하는지 고민하는 것은 자신의 정신 건강에도 별로 이득이 안 되는 일이다. 때문에 전문가들도 자기 분야에 대해서는 현실보다는 훨씬 낙관적인 전망을 하게 되고 자기 분야가 정말 필요하고 사회적 영향도 큰 분야라고 주장하기 마련이다. 특히 돈과 관련이 많은 기술 분야는 특히 그렇다. 그렇기 때문에 그 사람들의 이야기를 들을 때는 그 전망에 대한 기대 수준을 몇 단계 낮추어서 들을 필요가 있다. 오히려 상식 있는 비전문가의 의견이 더 정확할 때도 많다. 그렇다고 이 글이 그런 상식을 가진 시각을 제공한다고 주장하는 것은 아니다. 그런 판단은 모두 기사나 글을 접하는 사람의 몫일 수밖에 없다. 그래도 인공지능에 대한 약간의 지식은 그런 판단에 도움이 될지 모르겠다는 생각에서 인공지능에 대한 간단한 소개를 하려 한다.
먼저 인공지능이라는 단어부터 살펴보자. 이 인공지능이라는 단어를 들으면 지능이라는 말이 들어있기 때문에 마치 사람의 지능을 인공적으로 재구축하는 것이라는 느낌을 받을 수 있는데 여기서부터 인공지능에 대한 오해가 비롯된다. 그래서 사람들은 인공지능의 능력에 대해서 실제와는 완전히 상반된 기대를 해왔던 것이 아닌가 싶다. 사람들이 쉽게 하는 영상 인식이나 언어 이해 같은 것들은 컴퓨터도 쉽게 할 수 있을 것이라고 생각하고 보통 사람에게 어렵다고 생각되는 체스나 바둑 혹은 퀴즈쇼와 같은 분야는 컴퓨터에게도 어려울 것이라고 생각하고 그런 쪽에서 성과를 내면 마치 대단한 일을 한 듯한 반응을 보인다. 얼마전 알파고의 바둑 경기에서도 알파고의 경기 능력에 대해서는 크게 감탄하면서도 바둑판 앞에 앉아서 알파고의 수에 따라서 바둑돌을 두는 사람에 대해서는 아무도 관심을 갖지 않았다. 너무도 단순한 작업을 하는 그 사람에 대해 관심을 갖는다는 것 자체가 이상하겠지만 사실 그 사람을 대치할 수 있는 컴퓨터나 로봇은 없다. 경기장에 들어가서 자기 자리를 찾아 앉아 바둑돌을 집어서 원하는 자리에 놓는 작업은 현재 컴퓨터나 로봇이 절대 대치할 수 없는 작업이고 가까운 미래에도 그런 동작을 할 수 있는 컴퓨터나 로봇의 등장은 기대하기 힘들다.
내 생각에는 인공지능이 인간지능의 재구축도 아니고 심지어 인간지능의 모사도 아니라는 사실을 이해하는 것이 인공지능의 본질을 이해하는 데에 있어서 가장 중요한 단계인 것 같다. 인공지능 역시 특정 문제들을 해결하기 위해서 개발된 컴퓨터 프로그램에 불과하다. 이 글을 읽고 있는 사람도 브라우저라는 컴퓨터 프로그램을 사용하고 있을 것이다. 브라우저와 같이 일반적인 컴퓨터 프로그램과 인공지능이 다른 점은 인공지능이 좀 더 다양한 입력을 처리할 수 있다는 것이다.
이런 컴퓨터 프로그램을 만드는 데에는 몇 가지 정해진 틀이 있는데 그런 각각의 틀을 보통 인공지능의 분야라고 부른다. 알파고를 비롯해 가장 많이 쓰이고 사람들의 입에도 많이 오르내리는 틀이 ‘신경망(neural networks)’라고 불리는 분야이다. 사람의 신경과 비슷한 방식으로 동작한다고 해서 이런 이름이 붙었지만 사실 그 관계는 아주 피상적이다. 아무튼 신경망 분야는 현재의 인공지능에서 핵심으로 자리 잡았기 때문에 신경망에 대한 이해는 인공지능의 이해에 있어서 필수가 되었다. 요즘 말이 많은 기계 학습이니 ‘딥 러닝’이니 하는 것도 기본적으로 신경망과 같은 것이라고 볼 수 있다.
신경망은 간단히 말해서 몇개의 숫자들을 보고 특정 판단을 내리는 방식 중 하나다. 간단한 예를 들어보자면 어떤 사람이 성인인지 아닌지를 알려면 그 사람의 나이를 알면되는데 17이라는 숫자를 보면 성인이 아니다라고 판단하고 24라는 숫자를 보면 성인이다라고 판단할 수 있다. 그냥 나이가 20보다 큰지 작은지만 알면된다. 하지만 이렇게 기준이 정해져 있지 않은 경우에는 판단이 힘들다. 예를 들어 키를 보고 성인인지 아닌지를 판단하는 것은 쉽지 않은 일이다. 길에 나가 보면 나이든 노인들보다 어린 중고등학생들이 키가 더 큰 것 처럼 보인다. 아무튼 한가지만 보고 판단하기는 어렵기 때문에 다른 여러 기준을 복합적으로 봐야 한다. 예를 들어 주름살의 개수라던가 지난 한 해 동안 키가 얼마나 변했냐던가 하는 기준들 말이다. 이런 다양한 기준을 조합해서 판단을 내리는 것이 신경망이 기본적으로 하는 일이다.
예를 들어 결혼 후보자를 찾을 때 키와 재산을 본다고 하면 먼저 신경망은 다음과 같은 질문을 한다.
이 사람은 키가 180이고 재산이 2억5천인데 후보자로 적절할까요?
재산은 좀 부족하지만 키가 맘에 들기 때문에 좋다고 하면 신경망은 또 다음과 같은 경우를 물어본다.
이 사람은 키가 150이고 재산이 10억인데 후보자로 적절할까요?
돈은 좀 많지만 이런 키작은 사람이랑은 살 수 없기 때문에 싫다고 하면 또 다음과 같은 경우를 물어본다.
이 사람은 키가 250이고 재산이 1조인데 후보자로 적절할까요?
이 사람은 외계인인 동시에 사기꾼이 틀림없기 때문에 후보자로 적절할리가 없다. 그래서 답은 아니오이다.
이런 질문을 한 천 번 정도 하고 나면 신경망은 대략 이 사람이 원하는 후보자의 범위를 알게 되고 질문하지 않은 조합의 키와 재산에 대해서도 다 결혼 후보자로서의 적절성을 따질 수 있게 된다. 여기서 중요한 것은 적절한 범위에서 다양한 조합에 대한 질문을 해야 한다는 것이다. 질문에 등장하는 신랑감들 키가 모두 180 아니면 150이었다면 1000번의 질문을 하더라도 170이라는 키가 후보자로 적절한지는 판단하기 어렵다. 반면에 172와 165가 모두 적절하지 않다는 답을 들었다면 170이라는 키도 적절하지 못할 것이라는 판단은 하기 쉽다. 이를 그림으로 그리면 대략 다음과 같다.
빨간 영역이 당신이 원하는 진정한 키와 재산의 범위를 나타내고 엑스자로 표현된 점들이 실제 적절한 후보자들의 예라고 한다면 신경망은 엑스자로 표시된 예들을 통해 이 범위를 찾아내는 것이 목표인 것이다. (엑스자의 개수가 천 개는 안되지만 그냥 그렇다고 상상하길) 한번 범위를 결정하고 나면 그 다음에는 어떤 키-재산 조합에 대해서도 이 사람이 적절한 결혼 후보인지를 결정할 수 있게 된다.
구글에서 제공하는 신경망 놀이 사이트에 가보면 실제 신경망의 동작을 시각적으로 볼 수 있다. (http://playground.tensorflow.org/) 이런 걸 처음 보는 사람은 이게 뭔가 할 수도 있지만 사실 바로 앞에서 예를 든 것과 비슷한 일을 하는 것이다. 플레이 버튼을 눌러보면 배경의 그림이 조금씩 변하는 것을 볼 수 있다. 예를 들면 아래와 같은 그림을 볼 수 있다.
그림에서 파란 점들이 후보자들의 예들이고 바탕의 색깔이 신경망이 생각한 정답의 범위인데 처음에는 두개가 전혀 다르다가 점점 비슷해져서 나중에는 신경망이 생각한 정답의 범위 안에 실제 답들이 들어가게 되는 것을 볼 수 있는데 이런 과정을 학습이라고 부른다. 처음에는 그냥 아무 범위나 찍었다가 실제 예들과 비교해가면서 비슷하게 맞춰나가는 과정이라고 할 수 있다.
신경망 이론은 무척 복잡한 이론이기는 하지만 기본적인 내용은 이게 거의 다라고 볼 수 있다. 나머지 복잡한 내용은 얼마나 많은 기준을 적용할 수 있는지, 얼마나 빨리 학습을 할 수 있는지를 다루는 기술적인 문제가 대부분이다. 앞에서 예를 든 경우 키와 재산의 두 가지 기준만 봤지만 실제 인공지능의 적용에서 다루는 기준은 수천 수만 수억 개의 기준을 다루기 때문에 계산이 엄청나게 복잡해지고 단순한 알고리즘을 통해서는 우주의 종말이 와도 계산할 수 없기 때문에 이를 최대한 효과적으로 계산할 필요가 있고 그런 것을 다루는 것이 신경망 이론의 주요 과제라고 볼 수 있다.
내가 보기에 이런 과정은 꽤 훌륭한 작업이기는 하지만 컴퓨터에 지능을 부여하는 작업이라고 보기는 힘들 것 같다. 컴퓨터 계산 능력의 발전 덕분에 엄청남 계산을 하고 많은 정보를 수용하는 것이 가능해지긴 했지만 여전히 앞의 기준이라던가 어떤 답을 내야 하는지 결정은 어차피 사람이 해야 하고 내부 구조도 문제에 맞추어서 매번 사람들이 다 설계를 해야한다. 결국 신경망의 능력은 사람이 얼마나 적절한 기준을 선택했는지 얼마나 적절한 학습 정보를 제공했는지에 결정된다. 결혼 후보를 고르는데 그 사람의 엄지 발가락의 길이라던가 사는 집의 벽지 색깔을 기준으로 생각하는 사람은 별로 없을 것이다. 신경망은 엄지 발가락 길이와 키 중에서 어떤 것이 적절한 기준인지 알지 못한다. 알파고의 경우도 컴퓨터의 승리라기 보다는 적절하게 신경망을 설계하고 추가적인 알고리즘을 적절하게 적용한 프로그래머의 승리라고 봐야 할 것이다.
세상에 대한 이해가 없이 숫자 조합만 보고 판단을 하는 것에는 근본적인 한계가 있을 수 밖에 없다. 기본적으로 세상에는 숫자화하기 힘든 기준들이 많다. 가치, 행복, 감정과 같이 정의 자체가 어려운 개념들은 컴퓨터에 어떻게 입력해야할지 알기 어려운 것이 당연한 일이지만 언뜻 보기에는 명확하게 보이는 값들도 신경망에서 사용하는 입력으로 쓰려면 자세한 검토와 조정이 필요하다. 또한 어떤 숫자 조합을 봐야 하는지 그 자체도 사람이 정해줘야 하고 문제가 약간 바뀌면 완전히 새로운 학습 과정을 거쳐야 한다. 알파고의 경우도 바둑 규칙이 조금 변경된다면 이에 대응하기는 극히 어려울 것이다. 얼마 전에 퀴즈쇼에서 우승해 화제가 되었던 IBM의 왓슨 컴퓨터도 지금은 거의 실직 상태이다. 의료 자문 등의 분야에 쓸 거라고 처음에 크게 떠들었지만 퀴즈쇼를 잘하는 컴퓨터는 그 퀴즈쇼만 잘 할뿐 그 컴퓨터를 다른 분야에 적용하는 것은 프로그램을 새로 만드는 것과 크게 다를 바 없는 작업이다. 또한 컴퓨터는 자기가 왜 이런 판단을 했는지 설명하지 못한다. 때문에 컴퓨터의 판단을 평가하기는 극히 어렵다.
그렇다면 지금 수준에서는 힘들다고 해도 앞으로 기술이 더 발전하면 컴퓨터가 정말 그럴 듯한 수준에서 세상을 이해하는 날이 올까? 내 생각은 굉장히 부정적이다. 인공지능은 걸음마 단계에 들어서기 전에 벌써 성장의 한계에 도달한 것 같은 느낌이다. 기본적인 접근 방식의 변화가 없는 이상 앞으로 큰 도약을 하기는 힘들 것 같다. 하지만 그런 질문 자체가 잘못된 것일 수도 있다. 컴퓨터는 어떤 일을 하기 위한 도구에 불과하다. 그저 원하는 작업을 효율적으로 할 수 있게 도와줄 수 있는 역할이면 충분하다. 언젠가부터 사람들은 새로 나온 스마트폰에 뭔가 특별히 새로운 기능이 들어갈 것을 기대하지 않게 되었다. 신형 스마트폰이라도 달라진 것은 그저 카메라 화질이 좋아지고 좀더 빠른 성능에 효율적인 소프트웨어가 들어가는 정도이고 추가된 기능도 그냥 편의성을 높이는 정도의 기능일 뿐이다. 인공지능도 컴퓨터에서 그 정도의 기능에 불과하다. 앞으로 인공지능 분야는 조금 더 인식률이 높아지고 조금 더 빠른 속도로 결과를 얻는 정도의 발전이 있을 것이고 그 정도면 컴퓨터의 한 기능으로서 충분한 것이다. 인공지능에 대한 낭만적인 기대는 영화와 게임 속에서 많이 충족되었고 그 정도면 충분한 것이다.
* 이 글에 대한 권한은 아포리아에 있습니다. copyrights@aporia.co.kr ([이상국 칼럼] Aporia Review of Books, Vol.4, No.5, 2016년 5월, 이상국, 소프트웨어 엔지니어)