인공지능(AI), 데이터를 만나 신용 거래를 개선하다!




인공지능 vs. 인간, 세기의 대결 이후 1년


전 세계가 주목했던 인공지능(AI)과 인간의 바둑 승부! 인공지능의 놀라운 가능성을 확인했던 세기의 대결 이후 벌써 1년이 지났습니다. 그렇지만 인공지능에 대한 관심은 여전히 뜨거운데요. 이제 머신러닝과 딥러닝까지 가세해 대기업은 물론 스타트업과 벤처캐피탈 그리고 정부 정책에 이르기까지 글로벌 이슈를 이끌고 있습니다.

실제 구글, 마이크로소프트, 아마존, 페이스북 등 글로벌 IT 기업들은 음성 인식, 이미지 식별, 번역, 가상 비서, 챗봇 등 관련 서비스를 앞다퉈 출시하며 연일 헤드라인을 차지하고 있는데요. 그런데 여기 최신 인공지능 기술을 적극 활용하고 있는 또 다른 기업들이 있습니다. 바로 ‘21세기 원유’라 불리는 데이터를 분석하거나 분석 툴을 제공하는 에퀴팩스(Equifax)SAS(쌔스)입니다.



1899년 설립된 에퀴팩스는 미국 3대 신용 평가사입니다. 전 세계 8억2000만 이상의 소비자와 9100만개가 넘는 기업에 대한 데이터를 수집하고 분석합니다. 이 방대한 데이터를 기반으로 딥러닝 기술을 적극 활용해 신용 평가 방식을 개선하고 있습니다.


▲ SAS 비주얼 데이터 마이닝과 머신러닝 8.1에서 생성된 신경망



인공지능과 머신러닝의 역사


인공지능의 역사는 뿌리가 깊습니다. 1950년대 빠른 연산 작업에 활용되던 초기 컴퓨터를 또 다른 유형의 인지 작업에 적용할 수 있는 2가지 방식이 등장합니다. 바로 인공지능과 머신러닝!

두 방식에는 몇 가지 차이점이 있습니다. 인공지능 방식은 수학의 한 분야인 기호 논리학과 관련됩니다. 당시 지배적이었던 컴퓨터 공학 패러다임의 일부로 알고리즘, 모델, 프로그램을 프로그래밍 언어로 코딩해서 컴퓨터가 해야 할 일을 정의하는 프로그래머의 역할을 수행했죠.

반면 머신러닝 방식은 통계와 관련됩니다. 컴퓨터가 데이터 자체와 데이터의 패턴을 발견하거나 데이터를 그룹화하는 통계적 절차에 의존해 새로운 데이터 유형을 학습하고 예측할 수 있게 했습니다. 예를 들어 컴퓨터는 학습을 통해 특정 작업의 성능과 정확성을 최적화하고, 예측을 통해 데이터를 분류하고 그룹화했죠.



딥러닝을 일깨운 ‘데이터’


전통적인 컴퓨터 공학에서 데이터는 프로그램이 처리하는 대상과 처리 결과를 의미했습니다. 그러나 머신러닝 방식에서 데이터는 스스로 다음 할 일을 결정합니다. SAS의 올리버 샤펜버거(Oliver Schabenberger) 수석부사장 겸 최고기술책임자(CTO)는 “우리는 머신러닝을 이끄는 것은 바로 데이터라는 사실을 이따금 잊곤 한다”라고 말하기도 했죠.

머신러닝은 수년간 스팸 필터링, 필기 인식, 기계 번역, 사기 탐지, 제품 추천 등 다양한 분야에 성공적으로 적용됐습니다. 구글, 아마존, 넷플릭스와 같은 ‘디지털 네이티브’ 기업들의 수많은 성공 사례들은 머신러닝 알고리즘이 데이터를 활용해 소비자 행동을 얼마나 잘 예측할 수 있는지 그 무한한 가능성을 증명하고 있죠!

더 많은 데이터는 더 강력한 예측 모델과 더 정확한 예측으로 이어집니다.그런데 ‘빅데이터’는 새로운 유형의 ‘데이터 중심 기업’은 물론 머신러닝의 새로운 유형 ‘딥러닝’을 탄생시킵니다.


▲ 빅데이터는 머신러닝의 새로운 유형 ‘딥러닝’을 탄생시킵니다.



딥러닝, 눈부신 통계적 발전을 이루다


딥러닝은 다계층 인공 신경망을 적용해 머신러닝을 한층 더 발전시킵니다. 인공 신경망은 1943년 처음 개발된 인간 신경망의 전산 모형에서 영향 받습니다. 이후 1957년 이중 네트워크에 기반한 패턴 인식 알고리즘인 퍼셉트론(Perceptron)을 통해 최초의 소프트웨어 형태로 구현됐죠.


당시 제한된 연산력 때문에 한동안 빛을 보지 못했던 DNN(Deep Neural Network) 기법은 최근 10년간 고급 알고리즘과 빅데이터 그리고 특히 데이터를 병렬 처리하는 그래픽 처리 장치(GPU) 형태의 연산력이 증가하며 눈부시게 부활했습니다. 그 결과 컴퓨터 훈련에 쓰이는 시간이 현저히 줄었죠.


DNN은 여러 레이어의 하드웨어와 소프트웨어를 통해 대량의 데이터를 이동시킵니다. 이때 각 레이어마다 데이터를 표시하고, 학습한 내용을 다음 레이어로 전달합니다. SAS의 샤펜버거 부사장은 “인공지능은 인간처럼 생각하는 기계를 만들고 DNN은 한정된 과제를 해결하려고 한다”라고 설명합니다. 딥러닝은 인간과 같은 지능을 포기한 대신 기계가 학습하고 수행할 수 있는 한정된 작업의 범위를 크게 확대시킵니다.



신용 평가 업계에 새로운 바람이 불다


머신러닝이 발전을 거듭하는 동안 에퀴팩스는 전통적인 신용 평가 방법의 한계를 깨닫습니다. 당시 신용 평가 업계에는 로지스틱 회귀와 같은 전통적인 머신러닝 방식을 유지해야 한다는 통념이 있었습니다. 신용 평가 규제를 준수하기 위해서는 결과를 해석할 수 있어야 했는데요. DNN과 같은 최신 머신러닝 방식은 더 정확한 결과를 도출하지만 해석이 어렵다는 큰 문제가 있었습니다. 프로세스가 너무 복잡해서 심지어 통계 프로그래머조차 머신러닝이 어떻게 해당 결과를 도출했는지 완전히 이해하기 힘들었죠.


그러나 에퀴팩스는 포기하지 않고 신경망 해석 방법을 찾아냅니다! 그리고 수학적 증거를 통해 완전히 해석 가능한 신경망 솔루션을 증명했죠. 각 입력을 신경망의 은닉층(hidden layer)으로 매핑하고, 최종 모델이 되는 속성을 해석할 수 있는 일련의 기준을 도입했습니다. 그 누구도 시도한 적 없는 혁신이었습니다!


에퀴팩스는 신경망을 통해 모델의 예측 능력을 최대 15%까지 개선했습니다. 분석 데이터 세트의 크기가 크고 분석이 복잡할수록 개선 효과는 더 커지는데요. 사실 신용 평가 과정에서 기반 모델을 구축할 때 세그먼트 생성에 시간이 많이 소비됩니다. 최적의 세그먼트를 결정하기 위해 모델 구축 시간의 20%까지 쓰기도 하죠. 하지만 신경망 맥락에서 볼 때 이러한 세그먼트는 은닉층이며, 모든 일은 신경망이 처리합니다. 머신은 애널리스트를 대신해 세그먼트와 세그먼트 별 가중치를 파악하죠.

 

 

▲ DNN(Deep Neural Network)은 신용 평가 모델의 예측 능력을 최대 15%까지 개선시킵니다.



머신러닝, 신용 거래를 개선하다


신경망은 과거 데이터 과학자들이 직접 했던 모델 구축과 테스트 작업의 일부를 자동화합니다. 덕분에 모델 개발 속도가 크게 향상됐지만 에퀴팩스는 ‘완전한 자동화’를 목표로 하고 있습니다. 특히 데이터 과학자 업무의 상당 부분을 차지하는 모델 조정의 자동화를 구상하고 있는데요. 에퀴팩스는 뛰어난 예측과 해석 능력을 갖춘 신경망이 있다면 신용 평가 과정에 사람이 개입할 필요가 없다고 설명합니다. 마치 사용자가 클릭할 때마다 모델이 조정되는 검색 최적화나 제품 추천처럼 말이죠!


더욱이 오늘날 신용 평가에 영향을 미치는 요인들은 데이터를 중심으로 합니다. 개인 당좌 예금 잔고나 지난 6개월간의 사용 내역처럼 말이죠. 이제 데이터 속성은 과거 데이터 과학자들이 개발한 가설 대신 대량의 이력 데이터나 트렌드 데이터를 기반으로 딥러닝 프로세스를 통해 생성됩니다.


실제 에퀴팩스는 미국의 2년치 주택담보대출 데이터를 분석합니다. 그 결과 거절된 수많은 대출들이 안전하게 승인될만하다는 놀라운 결과가 나왔습니다. 승인 대출의 범위가 크게 확대될 수 있다는 뜻이죠! 이렇듯 최신 머신러닝 기술은 신용 거래의 개선이라는 혜택을 선물했습니다. 바야흐로 신용 거래의 새로운 시대가 밝아오고 있습니다.

 

 

▲ 최신 머신러닝 기술은 신용 거래의 개선이라는 혜택을 선물했습니다.






저자

길 프레스(Gil Press) | 자유 기고가