가격 책정에서의 설명 가능한 AI: 블랙박스 모델을 신뢰할 수 있는 의사결정으로 전환하기

글쓴이: 수닐 윤, RNA Analytics 수석 보험계리 컨설턴트

1. 소개

데이터 과학 분야가 급속히 발전함에 따라, 많은 기업들이 머신러닝이나 딥러닝을 활용한 모델링에 점점 더 큰 관심을 보이고 있으며, 이러한 기술을 실제 비즈니스 운영에 적용하고 있습니다. 이러한 기술은 높은 예측 성능을 제공한다는 장점이 있지만, 많은 경우 모델이 어떻게 결과를 도출하는지 명확하게 설명하기 어렵습니다. 이러한 모델들은 일반적으로 ‘블랙박스 모델’이라고 불립니다.

실제로는 보험계리사들조차도 복잡한 모델 구조와 내부 계산 과정을 직관적으로 설명하기 어려울 수 있습니다. 그 결과, AI 기반 모델링 결과를 대외적으로 활용하거나 의사결정에 반영하는 데 한계가 있을 수 있습니다.

최근 이러한 실질적인 한계를 해결하기 위해 XAI(설명 가능한 인공지능)를 활용하려는 노력이 확대되고 있습니다. XAI는 사용자가 AI 모델의 결과를 더 쉽게 해석하고, 모델이 의사결정을 내리는 데 어떤 변수와 패턴을 사용하는지 이해할 수 있도록 돕는 방법론입니다. 이 글에서는 XAI의 주요 방법론을 소개하고, 보험 요율 산정 및 모델링 실무에서 이를 어떻게 활용할 수 있는지 논의합니다.

2. XAI의 다양한 방법론

2025년 11월 IAA AI 태스크포스가 발표한 “인공지능 거버넌스 프레임워크” 보고서에 따르면, XAI 방법론은 크게 ‘로컬 메트릭 ( Local Metrics )’과 ‘글로벌 메트릭( Global Metrics)’으로 나눌 수 있다. 각각은 다음과 같은 특징을 지닌다.

국소 지표(Local Metrics )는 각 입력 변수가 개별 예측에 어떤 영향을 미치는지 설명하는 데 중점을 둡니다. 대표적인 방법론으로는 개별 조건부 기대값(ICE), 국소 해석 가능 모델 중립적 설명(LIME), 섀플리 가산 설명(SHAP) 등이 있습니다. 이러한 방법론은 특정 관측치나 계약에 대한 최종 예측에 각 변수가 미치는 영향의 방향과 크기를 보여줍니다. 다음은 SHAP 결과의 예시입니다.

SHAP 결과를 통해 특정 관측치에 대해 각 변수가 최종 모델 출력에 얼마나 기여하는지 파악할 수 있습니다. 예를 들어, 최종 모델 출력이 -2.83으로 계산되고 입력 변수인 BonusMalus의 값이 50인 경우, 이 변수는 기준 예측값에 비해 최종 출력을 약 0.15만큼 낮추는 데 기여한 것으로 해석할 수 있습니다. 이러한 방식으로, 개별 예측에 대한 각 입력 변수의 영향 방향과 크기를 파악할 수 있으며, 특정 계약이나 데이터 포인트에 대한 모델의 결정 근거를 보다 직관적으로 이해할 수 있습니다.

반면, 전역 지표(Global Metrics)는 개별 예측에 초점을 맞추기보다는 전체 모델의 관점에서 각 변수가 예측 결과에 어떤 영향을 미치는지 평가합니다. 대표적인 방법론으로는 부분 의존도 플롯(Partial Dependence Plot), 특징 중요도 안정성(Feature Importance Stability), 공정성 지표(Fairness Metric) 등이 있습니다. 여러 변수를 사용하여 모델을 구축할 때, 전역 지표는 전체 모델에서 어떤 변수가 상대적으로 더 큰 영향을 미치는지 파악하는 데 유용합니다. 다음은 R3S GIP에서 생성된 특징 중요도(Feature Importance) 결과의 시각화 예시입니다.

이 결과는 SHAP 기반의 특징 중요도 결과로, 각 변수가 모델 출력에 미치는 상대적 영향을 보여줍니다. 총 중요도를 100으로 정규화했을 때 변수 NV2의 값이 약 26이라면, 이는 모델에서 예측을 생성하는 과정에서 NV2가 상대적으로 큰 영향을 미친다고 해석할 수 있습니다. 다만, 이 값은 실제 손실률이나 보험금 청구에 대한 직접적인 인과적 기여도를 나타내는 것이 아니라, 모델 출력을 기반으로 한 상대적 중요도를 나타낸다는 점에 유의해야 합니다.

중요도가 낮은 변수들은 후보 변수 제거 또는 모델 단순화를 검토할 때 출발점으로 활용할 수 있습니다. 그러나 실제 변수 제거 여부는 재훈련을 통해 모델의 성능, 안정성 및 비즈니스 타당성을 확인한 후에 결정해야 합니다. 이러한 과정을 통해 모델의 예측 성능을 점검하면서, 더 간결하고 해석하기 쉬운 모델 구축 방안을 검토하는 데 도움이 될 수 있습니다.

3. 고려 사항 및 대안

XAI 기법을 활용하면 AI 기반 모델에 대해 일정 수준의 설명 가능성을 확보할 수 있습니다. 그러나 이러한 방법론만으로는 모든 것을 설명할 수 없으며, 몇 가지 중요한 한계가 존재합니다.

예를 들어, ‘특성 중요도’는 특정 변수가 모델의 예측 결과나 출력에 얼마나 기여하는지를 보여줄 수 있습니다. 하지만 이것이 반드시 해당 변수와 실제 결과 사이에 직접적인 상관관계나 인과관계가 있다는 것을 의미하지는 않습니다. 또한, 변수들 사이에 상관관계가 존재할 경우, 특정 변수의 중요도가 과대평가되거나 과소평가될 수 있습니다.

마찬가지로, 특성 중요도만으로는 특정 변수가 1단위 증가했을 때 최종 결과가 얼마나 변하는지, 또는 그 변화가 실제 비즈니스 관점에서 어떤 의미를 지니는지를 명확히 설명할 수 없습니다. 따라서 XAI 결과는 모델을 이해하기 위한 참고 자료로 활용되어야 하며, 이를 완전한 설명이나 인과적 증거로 해석할 때는 주의가 필요합니다.

이러한 한계를 보완하는 한 가지 방법은 대리 GLM 모델(Surrogate GLM Model ) 접근법을 고려하는 것입니다. 대리 GLM 모델은 신경망이나 그라디언트 부스팅 모델과 같은 복잡한 AI 모델의 예측 결과를 학습하여, 해당 결과를 대략적으로 설명할 수 있는 GLM 모델을 생성하는 방법입니다. 구체적으로, 먼저 머신러닝 모델이 분석 대상 데이터셋에 대한 예측값을 생성하고, 이후 이 예측값들을 목표값으로 설정하여 가장 유사한 결과를 산출하는 모델을 적합시킴으로써 GLM 모델을 구축합니다.

GLM은 구조가 비교적 직관적이라는 장점이 있으며, 사용자가 설명 대상인 예측값과 입력 변수 간의 관계는 물론, 각 변수의 계수와 영향 방향을 파악할 수 있게 해줍니다. 따라서 대리 GLM을 활용하면 AI 기반 가격 책정 결과의 설명 가능성을 보다 이해하기 쉬운 방식으로 보완하는 데 도움이 될 수 있습니다.

그러나 대리 GLM은 원래의 ML 모델 자체를 직접 설명하는 모델이 아니라, 기존 모델의 예측 결과를 대략적으로 재현하는 보조 모델에 불과합니다. 따라서 이를 실제 가격 책정 모델을 대체하는 용도로 사용하기보다는, AI 모델 내 변수들의 영향에 대한 전반적인 패턴과 방향을 이해하기 위한 보조적인 해석 목적으로 활용하는 것이 적절합니다.

4. 결론

머신러닝이 널리 보급된 이후, 보험계리사들이 AI 기술을 활용해 모델링을 개선하려는 노력은 지속적으로 발전해 왔습니다. 최근에는 대규모 언어 모델(LLM)을 비롯한 다양한 AI 기술의 발전으로, 이전에는 데이터 과학자들의 전유물로 여겨졌던 머신러닝(ML)/딥러닝(DL) 기반 모델링에 대한 접근성이 점차 높아지고 있습니다. 그 결과, 보험 실무에서 AI 기반 모델링의 적용 범위가 확대되고 있습니다.

보험계리사들은 다양한 실무 경험을 통해 쌓은 심도 있는 분야 전문 지식을 보유하고 있습니다. 이러한 분야 전문 지식을 AI 기반 모델링 기술과 결합하면, 더욱 정교하고 실무에 유용한 가격 책정 및 모델링 프레임워크를 개발할 수 있을 것으로 기대됩니다.

설명 가능한 AI(Explainable AI)는 보험계리사가 AI를 활용해 도출한 모델링 결과를 보다 이해하기 쉬운 형태로 제시하며, 이러한 결과가 기존의 설명 프레임워크와 함께 활용될 수 있도록 돕습니다. 이를 통해 AI 기반 모델링 결과의 신뢰성을 높이고, 실제 기업의 의사결정 과정에 더 원활하게 반영될 수 있도록 지원합니다.

RNA는 세계적인 보험 계리 소프트웨어 기업으로서 다양한 관련 제품 라인을 보유하고 있으며, 앞으로도 고객사와 함께 관련 기능과 솔루션을 지속적으로 개발해 나갈 계획입니다.

Vicky Daniels 2026년 6월 23일