SAS 커스터머 인텔리전스 360(SAS Customer Intelligence 360): 머신러닝의 블랙 박스 모델이란?


머신러닝이 마케팅 생태계 내에서 지속적으로 발전함에 따라 현대화된 알고리즘 접근법의 해석력이 중요해지고 있습니다. 지난 번 게시했던 머신러닝 해석력 관련 블로그에서 인공지능(AI)과 머신러닝을 신뢰하기 위한 필수 조건, 데이터 세트를 이해하고 해석하는 방법, 그리고 머신러닝 모델의 작동 원리에 대한 인사이트를 도출하는 변수를 표시하는 방법에 대해 설명한 바 있는데요. 


“우리는 머신러닝에 의해 구동되는 애플리케이션에 둘러싸여 있으며, 기계가 내린 결정에 받는 영향은 날을 거듭할수록 증가하고 있다” 


(머신러닝 해석력에 대해 더욱 자세히 알고 싶으시다면 아래 머신러닝 모델 해석력 시리즈를 클릭해주세요! ) 


1탄: 인공지능(AI)과 머신러닝을 신뢰하기 위한 필수 조건, 해석력! 

2탄: 데이터 세트를 이해하고 해석하는 방법 

3탄: 부분의존성(PD) & 개별조건부기대치(ICE) 플롯 정복하기! 


머신러닝이 고객 분석과 맞춤 마케팅에 어떻게 적용되는지 한번 살펴볼까요? B2C(Business-to-Consumer) 분야에서 새롭게 떠오르는 머신러닝 활용 사례로는 아래가 있습니다.

  • 고객 여정 최적화 

  • 액퀴지션 마케팅(Acquisition Marketing) 또는 리드 스코어링(Lead Scoring)

  • 상향 판매 및 교차 판매 성향 모델 

  • 가격 최적화 

  • 트래픽(Traffic) 및 수요(Demand) 예측 

  • 유지 또는 이탈률 감소

  • 광고 타겟팅 


데이터를 기반으로 마케팅을 진행하는 담당자들에게는 이러한 활용 사례가 익숙할 텐데요. 하지만 머신러닝은 정확도, 맥락 및 정밀도를 높여 고전 통계 분석을 이어갑니다. 다양한 비즈니스 문제는 포리스트(Forests)그래디언트 부스팅(Gradient Boosting)서포트 벡터 머신(Support Vector Machines) 등 대부분의 사용자는 잘 알지 못하는 알고리즘으로부터 점진적으로 수혜를 받을 수 있습니다. 마케팅 분석가는 이해관계자에게 영향을 미치는 활동과 관련해 예측이 어떻게 만들어졌는지를 이해하는 것보다 모델의 예측 정확도에 중점을 두는데요. 


예를 들어, 어떤 사람들은 디스플레이 미디어 광고를 클릭하는 이유를 파악하는데 중점을 두기보다, 클릭 수가 증가해 핵심성과지표(KPI)가 향상된 것에 만족하는 것으로 그치죠. 


하지만 또 다른 사람들은 특정 전술이 왜 다른 전술보다 더 효과적인지 알아내기 위해 분석상의 정밀도와 해석상의 인사이트에 대해 알고 싶어하는데요. 웹사이트 전환률 목표가 있는 경우, 어느 고객이 목표를 달성하는데 도움이 되는 성향을 가졌는지 식별하는 것도 하나의 방법이지만 고객의 행동을 분석 및 이해하면 아래와 같은 사항들을 알 수 있습니다.

  • 잠재 고객이 유료 고객으로 전환될 가능성을 확인할 수 있는 세분화

  • 전술 최적화 행동지침과 같은 A/B, MAB 및 MVT 테스팅 전략

  • 전환율 목표 인사이트를 위한 채널 및 여정 속성 측정


복잡한 모델은 이해하기 어려울까요?


머신러닝 모델의 해석력은 다면적이고 계속 진화하는 주제입니다. 복잡하지 않고 이해하기 쉬운 애플리케이션은 일반적으로 화이트박스 모델(White Box Model), 또는 화이트박스 투명 모델이라고 불리는데요. 모델의 메커니즘과 예측은 화이트박스 모델을 통해 이해하기 쉬운 용어로 설명할 수 있습니다. 즉, 대화에서 대답할 수 없는 “왜”라는 질문을 없애는 것입니다. 


분석가가 전략적 레버(인풋)를 변경했을 때, 이 결정이 예측 결과에 어떻게 영향을 미치는지에 대해 설명할 수 있다고 가정해보세요. 타당한 이유를 뒷받침해서 말이죠. 전문가, 비전문가 모두가 분석가의 설명을 들은 이후 마케팅 전략을 명확하게 이해할 수 있다면 이는 굉장히 성공적인 결과라고 할 수 있습니다.



그러나 최근 머신러닝과 인공지능(AI)의 발전으로 모델은 굉장히 복잡해졌는데요. 여기에는 심층신경망 또는 다른 모델의 앙상블도 포함됩니다. 이런 모델은 블랙 박스 모델(Black Box Model)이라고 불립니다.


블랙 박스 모델은 뛰어난 예측 능력을 제공하는 복잡성 때문에 이해하고 신뢰하기 어려운 모델이란 측면이 있는데요. 블랙 박스 모델은 일반적으로 모델이 내린 예측에 대한 명확한 설명을 제공하지 않습니다. 블랙 박스 모델은 실행 가능한 확률을 주지만, 확률에 대한 근거를 확인하는 것은 어려운데요. 아래로 몇 가지 예를 들어보겠습니다. 

  1. 웹사이트 클릭 스트림과 외부 광고 서비스 등의 디지털 데이터는 우리가 흔히 쓰는 빅데이터라는 용어가 나오게 된 영감의 원천 중 하나인데요. 머신러닝 모델에는 수천개, 혹은 심지어 수백만개의 마케팅 활용 사례를 위한 기능이 있을 수 있습니다. 

  2. 입력 피쳐(Input Feature)와 추정된 모수 사이에 일대일 관계는 없습니다. 

  3. 종종 여러 모델의 조합은 예측에 영향을 미칩니다. 

  4. 머신러닝 알고리즘은 많은 데이터를 필요로 하는데요. 정확도를 높이기 위해서는 방대한 양의 데이터가 요구됩니다. 


머신러닝을 실험하는 비즈니스들은 모델을 신뢰할 수 있는지, 그리고 모델을 통해 올바른 결정을 내릴 수 있는지 확인하고 싶어하는데요. 


만약 분석가가 데이터 세트를 통해 무엇을 도출했는지 파악하지 못하거나 데이터 세트 중 결과에 있어 보다 영향력 있는 데이터 포인트가 무엇인지 식별하지 못한다면, 비즈니스에 대한 실용적인 내용을 전달하고 알맞은 조치를 취할 수 있을까요? 적어도 특정 결과가 왜 비즈니스에 긍정적인 또는 부정적인 결과를 가져올지 설명할 수 있어야 합니다. 


만약 알고리즘이 잘못된 내용을 학습하게 되면 어떻게 될까요? 만약 알고리즘이 채널 터치포인트(Channel Touchpoint) 기술에 적용될 준비가 되지 않았다면 어떻게 될까요? 그럴 경우 사실의 와전, 지나친 간소화 또는 과대 적합을 초래할 위험이 있습니다. 머신러닝을 적용할 때 주의하지 않는다면 고객 개인화는 불가능할 수 있습니다.



높은 정확도만으로는 충분하지 않습니다


머신러닝에서 정확도는 예측과 입력 데이터 세트에서 도출된 실제 값을 비교해 측정합니다. 정확도가 높을수록 더 좋은 것이 맞긴 하지만 꼭 반드시 그런 것은 아닌데요. 마케팅에서는 분류 모델이 매우 유명합니다. 여기서 어느 모델이 변환될 것인지, 어느 모델이 변환되지 않을 것인지에 대한 질문은 더 많은 질문으로 이어지는데요. 이는 아래와 같습니다. 

  • 최대한 정확한 고객 행동 전환 및 고객 행동 비전환 예측 결과를 도출하고 싶나요? 

  • 고객 행동 비전환 예측성에 대한 오류를 더 많이 수용하며 타겟팅 작업에서만 정확도와 고객 전환 행동의 극대화에 대해 더 많은 관심을 가지고 있나요? 


위의 질문은 비즈니스 동인에 따라 답을 구하기 까다로워질 수도 있는데요. 비즈니스가 내린 결정은 선택한 접근법에 따라 재무 수익성 또는 손실에 영향을 미칩니다.


이전에 모델을 구축해본 경험이 있는 경우 리프트 곡선, ROC 플롯(ROC Plots), 오분류 차트 및 오차 행렬과 같은 진단을 통한 모델 평가를 언급하고 있음을 알 수 있을 텐데요. 


머신러닝의 세계에서는 정확도만으로는 충분하지 않습니다. 


머신러닝 모델은 데이터에서 중요해 보이지 않는 기능이나 패턴을 암기해 높은 정확도를 얻을 수 있습니다. 입력 데이터에 편향이 있는 경우, 인사이트가 활용된 운영 환경에서 예측 결과가 와전될 수 있습니다. 


정확한 예측만으로는 충분하지 않습니다. 이 외에도 많은 것들이 필요합니다. 블랙 박스 모델을 확실하게 설명할 수 있어야 하며, 머신러닝 모델을 신뢰할 수 있도록 모델의 투명성 또한 제고해야 합니다.


▲SAS 비주얼 애널리틱스(SAS Visual Analytics): 모델 비교



시사점


SAS의 비전은 디지털 마케팅 담당자가 분석 기술을 통해 효과적으로 일을 할 수 있도록 지원하는 것입니다. 소비자 선호도는 예측하기 어렵습니다. 하지만 통합 마케팅 솔루션 SAS 커스터머 인텔리전스 360(SAS CI 360; SAS Customer Intelligence 360)의 SAS의 알고리즘 저장소를 사용하면 머신러닝을 적용하고 데이터 기반의 개인화를 통해 관련성을 창출할 수 있습니다.


SAS의 커스터머 인텔리전스(CI) 솔루션은 기업이 강력한 예측 마케팅을 통해 고객에 대한 이해를 한층 더 높이도록 지원합니다. 기업은 인바운드 및 아웃바운드 채널을 통해 개별 고객의 상황에 맞게 소통함으로써 고유한 고객 경험을 제공할 수 있습니다. 실제 960여 글로벌 고객들이, 40여 한국 고객들이 SAS 커스터머 인텔리전스 360을 마케팅 업무에 활용, 수많은 고객 레퍼런스를 확보하고 있는데요. SAS 웹사이트에서 CI에 대한 자세한 내용과 다양한 고객 사례를 확인해보세요.




저자

수닐 그로버(Suneel Grover) l SAS 자문 솔루션 아키텍트(Advisory Solutions Architect, SAS)


편집

박종필 l 수석, SAS코리아 고객 인텔리전스 담당