0. 새로운 인류

산업혁명과 자본주의의 시대에 들어오면서 인류는 무한한 재화생산 가능성을 가지게 되었고 그를 바탕으로 인류는 영장류의 한 종으로서, 20만년 호모사피엔스의 종의 역사를 마감하고 전혀 새로운 종족으로 진화하였습니다. 하늘을 날 수 있고 바다 속에도 들어가고 심지어 지구둘레를 하루 만에 주파하고 우주 밖에까지 진출할 수 있는 능력을 가지게 되었습니다.

AI도 새로운 인류가 가진 도구의 하나입니다. 다만 대부분의 사람들은 광고나 영화의 로봇을 연상하면서 인공지능에 대한 환상을 가지거나 막연한 두려움을 가지고 있습니다. 일부 엔지니어나 뇌과학을 한다고 하는 사람들은 그 두려움을 증폭시키고 과장된 논리를 만들어 이득을 보려고 하기도 합니다. 그래서 이 참에 인공지능 AI에 대해 제대로 알아 보도록 하겠습니다.

 

가. 현수준의 AI

1. AI의 이해/몰이해

– AI = Artificial Intelligence : Artificial은 인공으로 번역되지만 가짜 혹은 만든 것으로도 번역될 수도 있습니다. 인공지능은 아는 사람에게는 대단한 것이 아닙니다. 일례로 예전 광고에서 전기밥솥에 들어간 작은 장치를 놓고도 인공지능이라고 말하였습니다.

실체를 모르는 높으신 분들에게 뭐든지 다 할 수 있는 마법의 기술처럼 취급되는 경향이 있습니다만, 이것은 광고의 힘입니다. – 영화의 로봇을 말하는 것은 아닙니다.

요즘 유행하는 알파고 같은 인공지능을 말할 때는, 머신러닝, 딥러닝을 말해야 합니다. 그냥 기계학습으로 말하자면 여러 개의 모아둔 값에서 가장 많은 것을 또 오차계산해서 역계산, 조금씩 수정해서 정확한 윤곽을 만드는 기술이라고 말을 드릴 수 있고. 기계학습으로 학습한 가장 빈도수가 많은 값에 오차 보정 알고리즘을 더했다고 보면 됩니다.

노이즈가 제거된 정제한 데이터를 머신러닝에 사용하면 레이어 수에 상관없이 일정한 값에 쉽게 수렴을 합니다. 또한 그 예측력도 일반적으로 사용되고 있는 회귀모델(단순 통계학, 데이터 처리)에 비해서 결코 우수하지 않습니다.

딥러닝은 머신러닝과는 조금 다른데 이는 다음에 설명합니다.

 

2. 2가지 AI ~ 실제로는 하나만 존재

* 알파고와 왓슨의 정체 (약 Weak AI)

알파고와 왓슨은 프로그램입니다. 데이터를 기반으로 확률적 값을 추출하는 프로그램으로 예전부터 있었던 전문가 시스템의 확장 (확장된 Database, 빨라진 계산능력)이라고 볼 수 있습니다.

= Big data > Data Warehousing > Data Mining

다만 이전의 전문가 시스템에서 더 나아간 점은 딥러닝 혹은 머신러닝을 통한 통계적 선택 기법이 더 해졌다는 것입니다. 하지만 회귀분석 – 선형회귀를 이용하고, 신경망을 모방하여도 학습-사실은 데이터를 선택하고 (피드백을 통해서 보정하더라도) 판단하지 못합니다.

* 강한 지능 (Strong AI)

없습니다. 없을 수 밖에 없습니다.

인간의 인식과정을 모르는 사람들은 상상조차 못하지요.

 

3. 현 AI의 수준

자발 학습(선택) 등의 방법을 도입 – 생물에게서 모방 (짚신벌레보다 못해)

모든 현상에 반응하는 행위들 (수많은 주변 환경요소) – 확률적 선택 – 살아남은 선택의 보존과 유산 (수억년의 진화)

결론부터 말하자면 별 것 없습니다. 과학적 수준에서의 진보를 논할 정도에 다다르지 못했습니다. 기술적인 변화들은 양적 발전의 결과 (반도체 저장능력)이고 본질적인 차이를 나타내는 과학발전에 기반한 것은 없습니다.

– 다음은 위키에서 인용

딥러닝의 가장 큰 특징은 모델의 부피를 키우고, 데이터를 쏟아부으면 무조건적으로 그만큼의 성능향상을 보인다는 점이다.

어떤 사람들은 딥러닝을 다른 기계학습과 동떨어진, 마법의 기술처럼 착각하는 경향이 있는데, 사실 많은 기계학습 알고리즘이 딥러닝의 한 종류라고 볼 수 있다. Logistic regression은 말할 것도 없고 또, 한번 언급되었지만, 인공신경망류 기법들은 통계학적으로 보면 아주 크고 복잡한 혼합 회귀 모델의 일종이라고 볼 수 있다.

(딥러닝이 일반적인 MLP에 비해 가장 문제가 되는 것 중 하나는 다수의 hidden layer을 사용한다는 거다. 이게 무슨 뜻인지 간단하게 설명하자면, 매 층을 지날 때마다 정답을 낼 수 있는 공식의 교정과정이 일어난다고 보면 된다. 다만 그 교정과정이 1부터 0까지의 숫자를 계속 곱하여 수정하는 방식이기 때문에 깊은 히든 레이어인 경우 차츰 공식의 기울기가 0에 가까워지는 문제가 존재한다. [3] 이 때문에 기울기 소멸 문제는 한때 인공신경망 학계를 고사시킨 전례가 있다. 다행히도 현재는 사전학습(가중치), 전달함수 변경, 역전사알고리즘, 부분가중치학습 등 크게 몇가지 해결책이 있다.

고전적인 회귀모델을 쓰지 않고 행렬방식의 인공지능을 쓰는 가장 큰 이유는, 첫째, 데이터 노이즈를 귀납적인 행렬연산에 의해 필터링할 수 있고, 둘째, 고정된 수학적인 모델 값이 아니라 데이터 변화에 대한 학습을 통해 예측모델을 진화시킬 수 있다는 점이다. 일반적인 경우, 딥러닝과 일반 머신러닝과의 차이를 히든레이어의 수로 설명하는 사례가 많은데 틀린 말은 아니나, 정확한 설명은 아니다.

히든레이어의 개수가 머신러닝으로 최적해를 찾는 것을 도와주는 것이 아니라, 정제되지 않는 방대한 데이터의 노이즈를 해소하고 빠르게 예측된 해를 찾게 해 주는 것이다. 예컨대, 히든레이어(Hidden Layer)가 많으면, 피드백 회수가 적더라도 수학적으로 빠른 수렴(최적의 해)을 할 수 있고, 데이터 노이즈에 별 영향을 받지 않고 최적 예측값을 구현할 수 있다. 히든레이어의 역할은 빠른 수렴력과 데이터 노이즈 영향을 어느정도 회피할 수 있다. 이는 노를 젓는 사람이 많으면 물살에 영향을 극복하여, 빠른 속도로 배를 움직이게 하는 원리와 같다. 이 말은 바꾸어 말하면 아무리 히든레이어가 많다고 해도, Garbage in Garbage out (나쁜 데이터는 나쁜 결과가 나온다) 이다. 혹은 과잉수렴(Overfitting)을 하게 되어 나쁜결과를 예측할 수도 있다. 최근 나오는 인공지능 프로그램들은 과잉수렴을 막기 위해 데이터 세트(Set)를 해석(Test)과 검증(Validation) 데이터로 나누고, 해석 데이터로 예측모델을 만들어 검증용 데이터로 다시 예측모델을 평가하는 방법을 쓴다.

결론적으로 딥러닝과 일반 머신러닝의 가장 큰 차이는 히든 레이어(Hidden Layer) 수가 아니다. 머신러닝과 딥러닝의 가장 큰 차이는 자가학습(Auto Self Learning)이다. 여기서 자가학습의 구성로직은 데이터 특성이 가지고 있는 물리학적, 수학적 혹은 경험적이지만 논리적인 함수에 기반으로 하고 있다.

알파고는 바둑승률에 대한 역대 기보 데이터를 찾아 학습하고, 바둑의 행렬위치 (가로 세로 19 * 19) 별 다양한 기보 속에서 학습한 결과에 대한 승률을 계산하여 승률이 가장 높은 위치 값에 바둑알을 놓은 방식을 구현한 것입니다. 말은 이렇게 쉽게 했지만, 그 구현 방식은 매우 어려웠을 것입니다. 실제 알고리즘도 알고리즘이지만, 딥러닝의 핵심 작업인 기보 데이터의 전처리 과정만 생각해봐도 굉장히 고난이도의 준비작업이었을 것입니다. 하지만 알파고의 길을 이제 수많은 따라쟁이들은 쉽게 가고 있습니다. 자원도 훨씬 적게 사용하는 법을 배웠습니다. 중국의 절예같은 경우입니다.

사람이 바둑을 배울 때를 생각해 보면 대략 3급 (기원5급) 수준까지는 수읽기도 하고 행마도 생각해 가면서 친구들과 두다보면 따라가는 것이 어렵지 않습니다. 그 이후가 문제인데 이때부터는 일단 외워야 합니다. 모든 가능한 것들을 패턴으로 외워야 실력이 됩니다. 끝내기와 사활은 완전히 기계적으로 답이 나와야 합니다. 이런 상황에서라면 단순 계산기능과 데이터 저장기능이 탁월한 컴퓨터가 확실히 유리한 것입니다.

일본의 AI 프로그램이 일본의 사법시험 예심을 통과했다고 하는 보도를 보았습니다. 이것은 애석하게도 별로 뉴스거리가 아닐 수도 있습니다. 왓슨이 암과 관련하여 의료보조시스템으로 활약하듯이 법조계에서도 법률보조 시스템으로서 AI가 도입되는 것에 비하면 너무도 작은 사이즈의 시스템이기 때문입니다. 법률보조시스템으로 활동하려면 법률DB, 판례DB의 구축은 이미 되어 있지만 자연어 처리부분이 생각보다 미진해서 정확도가 떨어지는 것입니다. 제퍼디 같은 퀴즈프로그램도 마찬가지입니다. 퀴즈는 너무 쉽습니다. 다만 사람이 구사하는 일반적인 언어를 해석해서 정해진 Data와 연결하는 것이 어려울 뿐입니다.

자율주행 자동차의 딥러닝 학습은 이미지 학습에 의한 사물인지와, 사물속도 (위치변화/시간), 주행차량 속도 3가지 큰 영역으로 나누고 1초 뒤 , 5초 뒤를 선 예측한 후, 가장 안정적인 방법으로 사물회피를 통해 안정적 주행을 위한 핸들링, 속도제어를 하는 것입니다. 크게 보면 이미지 학습 = 패턴파악 쪽에 인공지능이 많이 연계되어 있고, 나머지 주행영역은 예측제어 영역입니다.

네비게이터의 오류를 보면서 조금만 로직을 잘 정비하면 이런 실수는 하지 않을텐데 하는 아쉬움들이 많죠? 카톡을 할 때나 문자를 보낼 때 단어 선택해 주는 도움이 전혀 기쁘지 않는 것도 AI, Data 처리와 머신러닝에 대한 갈증이 되고는 합니다.

딥 러닝의 부활 이후 주로 자동 음성 인식(ASR, automatic speech recognition)과 컴퓨터 비전(vision) 분야, 언어번역 분야에서 나름 유의미한 성과를 보여주고 있습니다. 이들은 보통 딥 러닝의 새로운 응용들의 지속적인 성능 향상을 위해 만들어진 TIMIT(Texas InstrumentsMIT가 제작한 음성 Database), MNIST(이미지 클러스터링을 위한 hand-written 숫자 이미지 데이터베이스로 National Institute of Standards and Technology가 제작) 등의 데이터베이스를 사용했습니다. 최근에는 Convolution Neural Networks 기반의 딥 러닝 알고리즘이 뛰어난 성능을 발휘하고 있으며, 앞서 말한 컴퓨터비전과 음성인식등의 분야에서 특히 탁월한 성능을 보이고 있습니다.

딥 러닝에 대한 부정적 시각중 하나로 딥 러닝에 사용되는 방법들의 이론적인 뒷받침이 빈약하다는 것이 있습니다. 대부분의 딥 러닝 알고리즘은 경사 하강법에 기초를 두고 있습니다. 그런데 경사 하강법 자체는 이론적으로 이해가 잘 되었지만, 이와 함께 사용하는 다른 알고리즘은 이론적인 검증이 빈약합니다. 그러한 알고리즘 중 하나인 contrastive divergence는 이 알고리즘이 실제로 정말 수렴하는지, 수렴한다면 얼마나 빠르게 수렴하는지에 대한 부분이 현재 분명하게 증명되지 않았습니다. 이와 같이, 딥 러닝에 사용되는 방법들은 이론적이기보다는 경험적으로 검증된 방법들을 사용하기 때문에 종종 블랙박스로 이해되기도 합니다.

보통 사람들이 딥 러닝을 모든 것을 해결해주는 솔루션으로 바라보는 것에 대해 딥 러닝은 유일한 솔루션이 아니고, 강한 인공지능 문제와 관련하여서는 아예 답이 없다(완전 걸음마 수준조차 가지 못했다)는 것을 알아야 합니다. 딥 러닝을 모든 것을 해결해주는 솔루션으로 보기에는 기능적으로 여전히 부족한 점이 많습니다.

심리학자인 게리 마커스는 다음과 같이 말했습니다. (철학자나 언어학자가 아닙니다)

현실적으로, 딥 러닝은 지능형 기계를 구축하는 것의 일부분에 불과합니다. 딥 러닝에 쓰이는 테크닉들은 인과 관계를 나타내는 능력이 부족하고 논리적 추론을 하는 것에 확실한 방법을 가지고 있지 않습니다. 그리고 이 방법들은 어떤 물체가 무엇인지, 용도가 무엇인지 등과 같은 추상적인 정보를 인식하는 데에 오랜 시간이 걸립니다. 왓슨과 같이 현재 가장 강력한 인공지능 시스템은 딥 러닝을 복잡한 여러 개의 테크닉 중 단지 한 부분을 위해 사용하고 있습니다.”

 

나. 현재 수준의 AI로는 어려운 것들

1. 범주를 다루는 작업

아예 불가능합니다. 이것은 의학, 생물학자 혹은 엔지니어들이 생각할 수 없는 것들입니다. 범주는 일반화와 추상화를 통해서 가능한데 인식의 철학적 바탕을 이해하지 못하면 불가능할 수 밖에 없습니다. 사물의 질적 판단과 그것이 어떤 상위집합에 속해 있으며 왜 그 상위집합이 의미가 있는지를 모두 사람이 판단해 주어야 합니다.

(인식론, 언어학) 사물의 분류 (눈, 산에 쌓인 눈, 얼음위의 눈)

이것이 가능하려면 우선 인간의 언어가 가진 추상성을 먼저 이해해야 합니다. 따라서 AI 발전에 언어학이 동원되어야 합니다.

세계의 계통적 구성에 대한 사고와 원리, 개념, 계통, 인과를 이해하려면 철학의 도움이 필요합니다. AI 전문가 집단에 이를 다루는 철학자가 있다는 소식은 없더군요.

(집단과 가치의 문제는 아예 다루지 않겠습니다.)

~ 구분 >> 양의 이해, 질의 이해 – 질의 이해 >> 분류 >> 범주 >> 추상화

~ 시각 (빛의 양, 빛의 질 > 패턴 > 학습과 선택을 통한 사물의 파악)

다른 경험 = 다른 인식

 

2. 원인을 규명하고 원리를 찾는 작업

현재 수준의 비젼시스템을 보면 양적인 시각데이타를 다양한 패턴에 대입하여 확률적인 유사성을 따져서 사물을 분간하는 방식을 취합니다. 하지만 이때 패턴은 미리 정해 주어야 합니다. 그 사물의 의미도 마찬가지입니다. 자율주행에서 옆차의 간격은 이해가 되지만 갑자기 날아든 까치는 이 시스템에 엄청난 도전이 될 수도 있습니다. 사물을 양적인 수치로 받아들이기(인식이 아니라 수용) 때문입니다.

생물들에서 일반적인 간단한 추상화 (관계와 의미, 먹을 수 있는 것, 포식자)를 AI로 구현하는 것조차 엄청나게 지난한 일입니다. 왜냐하면 현재의 AI 기술은 현상들을 개념으로 분류할 수 없기 때문입니다.

인과관계의 파악을 위해서는 왜라는 질문이 있어야 합니다. 그리하여 능동적인 실천이 필요하고 이것은 선택보다 휠씬 높은 단계의 작업입니다. AI가 가질 수 없는 의식적 활동입니다. 인과관계는 현상의 선후 관계와는 전혀 다릅니다. ‘실험에서 까마귀가 버턴을 누르면 먹이가 나오더라’ 하는 것은 사물의 본질과는 상관없습니다. 임상적/통계적 방법과 추상화 방법의 차이입니다.

 

3. 자아인식과 공감능력, 의식

의식 – 자아파악 >> 1차 도약

공감능력, 감정이입, 동일시 (집단, 조직, 사회를 이룰 수 있는 능력) >> 2차 도약

언어의 발전, 과학적 사고체계=철학의 발견 >> 3, 4차 도약

앞에서 말한 의식적 활동에 대한 논지입니다.

의식 = 의도적인 사고, 다양한 주변 환경들 사이의 관계 파악은 인간과 몇몇 고등동물에서만 발견되는 것입니다. (뇌과학 아무리해도 알 수 없습니다)

의식과 구별되는 비의식은 보통의 동식물들의 행위나 활동에서 일반적으로 나타납니다.

본능, 반사, 선택 (걷기, 자전거타기, 운전 시 시야와 조응하는 발의 움직임), 호르몬의 작용들로 이루어져 있으며 이는 거의가 DNA에 애초부터 발현할 가능성으로 심어져 있습니다. 운전을 처음 배우고 익힐 때는 의식에 의해 발과 손의 움직임이 제어되지만 숙달되면 의식의 적극적인 관여없이도 진행되는 이같은 활동은 기계적이어서 인간에게는 의식 활동에 휴식을 주는 것입니다.

인간의식은 참으로 신기한 작용입니다. 의도적인 사고가 물질기반에서 일어나는 것은 현재의 컴퓨터 이론으로는 꿈도 꾸지 못하는 고급의 지경입니다. 더욱이 신인류의 의식활동은 고도로 추상화된 개념체계를 가진 철학을 통해서 세계를 제대로 해석하게 만들었습니다.

 

4. 강한 AI는 신기루

인식의 과정을 이해하지 못한 엔지니어들이나 뇌과학자들은 선택이 곧 지능이라고 생각할지 모릅니다.

개구리가 움직이는 것들 중에서 반응하는 것을 모두 같을 것이라고 생각하는 것과 같습니다. 개구리도 잎이 움직이는 것과 암컷개구리와 사마귀를 모두 구별합니다. 뱀도 구별하고 다람쥐도 구별합니다. 다만 자신에게 필요한 방법으로 구별하는 것이겠지요.

흔히 붕어를 0.1초 기억이라고 말하잖아요. 인식 > 반영 > 센서 민감도 > 데이터 저장 방식 – 이런 것들을 생각해 보아야 합니다. 붕어가 먹이에 반영하는데 낚시에 의해 자신이 물 밖으로 나가게 될 것이라고 상상할 수가 없습니다. 기억 저장이 일반적인 동물에게 필요할 것이라고 보지 않습니다. 그러다 보니 본능에는 그러한 상황에 대한 답은 (먹이라고 판단된다 > 잡아먹는다) 까지만 있는 것입니다. (바늘을 물었다 > 물밖에 나가게 된다 > 죽는다) 이러한 과정에 대해 저장할 곳이 없습니다. 이는 사람들이 다이어트를 잘 못하는 것과도 통합니다. 우리 사람의 10만년 DNA역사는 그간 항상 먹을 것이 있으면 저장해야 한다는 환경에 적응해 왔으니, 지금과 같은 물자가 넘쳐나는 신세계는 DNA가 알 수 없는 것입니다.

AI 다음 단계는 앞서 말한 그 패턴이 왜, 어째서 의미가 있는 지를 해석하는 방향을 찾아 가야 합니다. 일차적으로는 보다 정교한 구별을 위해서 다양한 수용결과를 조합할 필요가 있습니다. 고양이 얼굴만 아니라, 털의 촉감, 소리, 행동의 모음 등을 모두 합쳐서 고양이로 판단하는 것입니다. 다음으로는 그것들의 공통점들 중에서 가장 핵심적인 것(여기에는 플루크가 반드시 등장합니다. 하지만 그 과정조차 필요합니다)들을 찾아냅니다. 나아가서 개와 돼지, 앵무새, 도마뱀과의 차이도 찾아야 합니다. 그리고 계통 속에서 고양이라는 범주를 만들어내야 합니다.

인간만이 가능한 현상의 정의, 의미의 구분은 인간의 인식능력에 기반한 것입니다. 이는 인간 진화의 혁명(질적도약)의 결과물입니다. 이는 하드웨어적인 변화가 아니라 소프트웨어적 변화이기에 엔지니어, 공학적 접근으로는 절대 이해가 불가능합니다.

뇌과학도 필요하지만 강한 AI에 대한 최소한의 가능성을 찾으려면 언어, 사회구조, 과학과 철학를 연구해야 하고 그래야 AI가 발전합니다.

 

결론 (정리)

1. 현재의 AI는 컴퓨팅 파워를 이용한 전문가 시스템까지 와 있습니다. 그 이상도 이하도 아닙니다. 이것은 빅데이타를 이용한 통계적 방법에 기반한 선택과정을 효율적으로 고안해 낸 것입니다.

2. 인간을 모방한다는 강한 AI는 개념에서부터 잘못되어 있습니다. 왜냐하면 선택은 아무리 잘해도 왜라는 질문을 만들어 내지 못하기 때문입니다. 인과관계는 현상의 선후관계가 아니기 때문입니다. AI가 강해지려면 인간 언어에 포함된 범주에 대한 연구와 인식론을 공부해야 합니다.

3. 기술변화에 대한 막연한 두려움

산업혁신 – 자율주행차량과 자율공장 : 센서가 인간의 오감 수준에 도달하였고 계산과 분류능력, 통신, 데이터저장 수준이 충분히 발전하여 자율주행과 자율공장이 가능한 수준에 도달하였습니다. 그렇다면 인간의 일자리는 어떻게 될까요? 단순조작 노동이 대체되고 없어지는 것이지 숙련은 더욱더 필요로 합니다.

딥러닝으로 보다 강화된 전문가시스템은 우리 일상을 어떻게 바꾸게 될까요? 전문가시스템의 도움을 받는 전문가는 보다 정확하고 편리하게 결정을 할 수 있게 됩니다. 즉 전문가시스템은 시스템이고 그를 사용하는 전문가는 없어지지 않습니다.