LLM의 한계를 뛰어넘는 4가지 기술을 탑재한 실용적인 AI 계리 솔루션
저스틴 황 AI 프로젝트 책임자, 이동환 AI 팀장, 스칼렛 배 AI 스페셜리스트가 작성했습니다.
LLM: 현대 사회에서 가장 진보된 AI 모델
AI 모델의 역사적 발전 과정을 추적해 보면 초기 규칙 기반 시스템에서 오늘날의 GPT, Gemini와 같은 고도로 정교한 대규모 언어 모델(LLM)에 이르기까지 놀라운 진화가 이루어졌음을 알 수 있습니다. 이 여정은 기술과 데이터 접근성의 발전에 힘입어 머신러닝과 딥러닝의 단계를 거치며 발전해 왔습니다. 그 결과, AI는 다양한 산업 분야에서 없어서는 안 될 필수 요소가 되었습니다.
최근 AI의 획기적인 발전 중 가장 주목받고 있는 혁신은 인공신경망(LLM)입니다. 이러한 심층 신경망 모델은 수십억 개에서 수조 개에 이르는 방대한 양의 텍스트 데이터를 학습하여 인간의 언어를 이해하고 생성하도록 특별히 설계되었습니다. LLM은 언어 내의 복잡한 관계와 문맥적 뉘앙스를 파악하는 데 탁월합니다.
그러나 LLM의 인상적인 기능에도 불구하고 일부 사용자에게는 여전히 추상적이거나 이해하기 어렵게 느껴질 수 있습니다. 기본적으로 LLM은 수많은 비선형 회귀 모델로 구성된 복잡한 복합체인 딥러닝 모델입니다. 트랜스포머 아키텍처를 통합함으로써 LLM은 텍스트의 장거리 종속성을 이해하는 강력한 능력을 갖추게 되어 인간과 같은 자연어 대화에 참여할 수 있게 됩니다. 이러한 구조와 기능의 조합이 바로 대규모 언어 모델을 정의하는 것입니다.
[그림 1. 신경망 모델과 비선형 회귀 모델]
LLM의 한계와 이를 극복하는 방법
대규모 언어 모델(LLM)의 강점은 부인할 수 없습니다. 뛰어난 자연어 처리 기능으로 문서 분석, 고객 서비스, 콘텐츠 제작 및 기타 여러 분야에서 널리 사용되고 있습니다. 대규모 데이터 세트에 대한 광범위한 학습에 기반한 유연성과 확장성은 타의 추종을 불허합니다.
하지만 LLM에도 분명한 한계가 있습니다. 가장 두드러진 것 중 하나는 모델이 그럴듯하게 들리지만 실제로는 잘못된 정보를 생성하는 환각 현상입니다. 또한 심층적인 도메인 전문 지식과 고급 추론 능력이 부족하기 때문에 LLM은 여러 시트에 걸쳐 수식과 표가 서로 연결되어 있는 복잡한 Excel 스프레드시트를 구조화된 데이터 집합이라기보다는 미로처럼 인식하여 어려움을 겪는 경우가 많습니다.
이러한 한계는 정확성과 신뢰성이 가장 중요한 보험 계리 분야에 LLM을 적용할 때 심각한 위험을 초래합니다. 부정확한 정보에 기반한 결과는 재정 불안정, 규정 위반, 신뢰 상실로 이어질 수 있습니다. 따라서 이러한 고위험 환경에 LLM을 배포하기 전에 사실적 근거와 논리적 구조를 강화하는 방법론을 모색하는 것이 필수적입니다.
솔루션 1: 미세 조정 - 추가 모델 교육을 통해 계리 전문성 향상
LLM의 또 다른 실질적인 한계는 특정 조직이나 산업에 대한 맥락적 적응이 부족하다는 점입니다. LLM은 일반적으로 Google이나 Wikipedia와 같은 광범위한 공개 데이터 소스에 대해 교육을 받기 때문에 보험 상품의 복잡한 계약 구조나 IFRS 17 및 자본 요건과 같은 세부 규제 프레임워크를 완전히 이해하지 못하는 경우가 많습니다. 이러한 도메인별 지식의 부족은 실무 적용에 있어 큰 장벽이 됩니다.
이 문제를 극복하는 효과적인 방법 중 하나는 미세 조정입니다. 미세 조정은 도메인별 데이터, 용어, 작업 패턴을 사용하여 사전 학습된 LLM(기본 모델)을 추가로 학습시키는 프로세스입니다. 즉, 범용 AI를 특수한 전문적 맥락에서 작업을 이해하고 수행하도록 맞춤화된 '사내 전문가'로 전환하는 것입니다.
[그림 2. 미세 조정의 개념, 출처: medium.com]
미세 조정은 다음과 같은 방식으로 수행됩니다:
도메인별 텍스트 데이터를 수집합니다: 상품 브로셔, 기초 문서, 보험 계리 및 가정 문서, 내부 매뉴얼 등의 문서를 수집합니다.
인스트럭션 데이터 세트를 만듭니다: 모델이 제공해야 할 사용자 질문과 이상적인 답변 쌍을 설계합니다.
(예: "이 상품의 주요 혜택은 무엇인가요?" → A: "암 진단비, 암 입원비, 수술비, 통원비가 포함되어 있습니다. 진단급여금은 최초 진단 시 1회만 지급되며...")LLM 기반 모델을 다시 학습합니다: 기본 모델의 매개 변수를 부분적으로 업데이트하여 조직에 맞는 언어 모델을 구축합니다.
검증 및 성능 평가: 실제 비즈니스 관련 질문을 사용하여 모델의 적합성과 정확성을 테스트합니다.
이 접근 방식은 특히 다음과 같은 상황에서 효과적입니다:
- 도메인이 고도로 전문화되어 프롬프트 기반 방법만으로는 일관된 결과를 얻기 어려운 경우
(예: 특정 보험 상품의 보험료, 준비금 또는 현금 흐름을 계산하는 데 사용되는 보험 계리 소프트웨어 코드)
- 반복되는 비즈니스 질문에 대해 일관된 표준을 유지해야 하는 경우
- API 액세스 없이 네트워크에서 격리된 환경에서 온프레미스로 모델을 독립적으로 운영해야 하는 경우
RNA Analytics 현재 고객별 데이터 세트를 사용하여 AI 기반 계리 자동화 시스템인 R3S 모델링 에이전트를 미세 조정하여 작업 적합성과 응답 일관성을 모두 개선하는 것을 목표로 단계적 실험을 진행하고 있습니다.
미세 조정은 "성능 향상을 위한 기술"이자 "신뢰 확보를 위한 전략"입니다. 앞으로 보험 업계에서 AI가 일관된 판단과 설명 가능한 결과를 제공하기 위해서는 단순히 사전 학습된 모델을 선택하는 것 이상으로 미세 조정과 조직 맞춤화가 중요한 역량이 될 것입니다.
솔루션 2: RAG(검색 증강 생성) - 외부 지식 소스를 통합하여 정확도 향상
기존 언어 모델의 한계를 극복하기 위한 핵심 전략 중 하나는 RAG입니다. RAG는 대규모 언어 모델(LLM)이 외부 지식 소스에서 실시간으로 정보를 검색하고(검색), 해당 정보로 응답을 보완한 다음(증강), 최종 답변을 생성(생성)할 수 있게 해줍니다. 사전 학습된 매개변수에만 의존하는 기존 LLM과 달리 RAG는 신뢰할 수 있는 외부 데이터를 참조하여 정확도와 신뢰성을 크게 향상시킵니다.
RAG의 구성 요소와 워크플로우에 대해 자세히 살펴보겠습니다:
쿼리: 사용자의 입력 질문 또는 요청
검색: 입력 쿼리를 기반으로 외부 지식창고에서 의미적으로 연관성이 있는 정보를 검색합니다.
증강: 검색된 정보가 원래 쿼리와 결합되어 응답 생성 모델에 전달됩니다.
생성: 생성: 모델이 증강 입력을 사용하여 최종 응답을 생성합니다.
결론적으로 RAG는 환각을 구조적으로 제어할 수 있는 실용적이고 강력한 프레임워크입니다. 단순히 LLM의 약점을 보완하는 것을 넘어 신뢰할 수 있는 AI 대응 시스템을 구축하기 위한 핵심 기술로 부상하고 있습니다. RAG는 보험 업계의 계리 업무와 같이 정확도가 높은 분야에 특히 적합합니다.
[그림 3. RAG 흐름 및 검색 방법론]
솔루션 3: 데이터 세트 및 문서 서식 - AI가 더 쉽게 읽고 이해할 수 있는 문서 만들기
무엇보다도 모든 AI 프로젝트의 성공에 결정적인 요소는 데이터 세트입니다. 데이터의 품질은 AI의 성능에 직접적인 영향을 미칩니다. 보험 업계를 예로 들어보면, 일부 회사는 이미 AI 시스템에 막대한 금액을 투자했지만 기대한 만큼의 성과를 거두지 못했습니다.
한 가지 중요한 이유는 문서 형식입니다. 보험 데이터가 포함된 많은 문서가 AI가 읽기 어려운 형식으로 작성되어 있습니다. 이 문제는 단순한 오타나 오류를 넘어서는 문제입니다. 문서가 AI가 체계적으로 이해할 수 있는 구조로 되어 있지 않은 경우가 많습니다. 문서의 품질은 보험 계리 생산성 향상을 위해 AI를 사용하는 데 있어 가장 중요한 요소이므로 반드시 개선해야 할 세 가지 주요 문서 작성 관행에 대처하는 것이 필수적입니다.
첫째, PDF 중심의 문서 작성에서 벗어나야 할 때입니다.
PDF는 주로 인쇄용으로 설계되었습니다. 사람의 눈에는 보기 좋게 보이지만 기계가 해석하기에는 그 구조가 모호합니다. 최근 OCR(광학 문자 인식)이나 비전 트랜스포머와 같은 AI 기술을 이용해 PDF를 분석하려는 시도가 있었지만 이러한 방법은 정확도에 한계가 있고 전처리와 후처리에 상당한 시간과 비용이 필요합니다.
반면에 .docx, .tex, .html, .md(마크다운)와 같은 형식은 텍스트 기반의 전 세계적으로 인정받는 표준으로 AI가 정확하게 구문 분석할 수 있습니다. 특히 마이크로소프트의 오픈소스 마크다운 프로젝트는 전 세계 개발자들이 활발히 참여하고 있어 다양한 보험 비즈니스 문서에 안정적이고 신뢰할 수 있는 포맷으로 활용되고 있습니다.
회사에서 여전히 국가별 워드 프로세서나 비표준 문서 형식에 의존하고 있다면 AI 혁신의 물결에서 뒤처질 위험이 높습니다. 이러한 문서를 AI가 읽을 수 있는 형식으로 변환하는 전용 도구를 개발하거나 표준화된 문서 형식으로 전환하기 위한 전사적인 노력을 가속화하는 것이 시급합니다.
둘째, 이미지 대신 수식에 LaTeX 또는 KaTeX 사용
보험 계리 업무에는 복잡한 공식이 자주 등장합니다. 하지만 여전히 수식을 이미지로 삽입하는 것이 일반적입니다. 이미지 기반 수식은 AI가 읽을 수 없습니다. OCR로 어느 정도 인식할 수는 있지만 정확도가 낮고 비용이 증가합니다.
올바른 접근 방식은 TeX 구문을 사용하여 수식을 입력하는 것입니다. 수식이 시각적으로 잘 표현된 것처럼 보이더라도 기본 코드의 구조가 잘못되어 있으면 AI가 이를 해석할 수 없습니다. 이는 "가비지 인, 가비지 아웃"의 전형적인 사례입니다.
특히 KaTeX를 추천합니다. 웹 브라우저에서 빠르게 렌더링되고 비전문가도 쉽게 배울 수 있어 조직 전체에 쉽게 도입할 수 있습니다.
셋째, 전체 문서의 서식을 표로 지정하지 않기
레이아웃을 제어하기 위해 전체 문서를 표 형식으로 배열하는 것은 사람에게는 깔끔해 보일 수 있지만, AI의 입장에서는 암호화된 문서와 같습니다. 표는 제목, 단락, 섹션과 같은 문서의 의미 구조를 모호하게 만들어 AI가 문맥을 이해하기 매우 어렵게 만듭니다. 특히 본문, 부제목, 설명이 모두 표 안에 배치되어 있으면 AI는 의도한 메시지를 분리하고 해석하는 데 어려움을 겪습니다.
문서를 작성할 때는 워드 프로세서에서 제공하는 '제목 스타일', '단락', '목록'과 같은 시맨틱 서식 지정 기능을 사용하는 것이 필수적입니다. 이러한 접근 방식은 AI 가독성에 도움이 될 뿐만 아니라 문서 검색 및 유지 관리도 크게 향상시킵니다.
보험사는 방대한 양의 데이터 자산을 보유하고 있습니다. 하지만 이러한 데이터가 AI가 읽고 쓸 수 있는 형태로 존재하지 않는다면 그 가치를 실현할 수 없습니다.
AI 혁신은 단순히 새로운 기술을 도입하는 문제가 아닙니다. 이는 정보 구조를 표준화하고 인간과 기계가 모두 이해할 수 있는 문서를 만드는 전략적 전환입니다.
지금부터 회사의 문서 형식을 검토하세요. PDF와 이미지 기반 수식을 제거하고 AI 친화적인 문서 구조로 전환하세요. AI 도입의 출발점은 '알고리즘'이 아니라 '문서'입니다.
솔루션 4: 온톨로지 기반 데이터베이스 - AI의 의미 이해 지원
보험 계리 분야에서는 온톨로지 기반 데이터베이스를 구축하는 것이 매우 중요합니다. 온톨로지는 개념과 용어를 명확하게 정의하고 구조화하여 AI가 정보를 더 정확하게 이해하고 처리할 수 있도록 도와줍니다. 계리 업무에 온톨로지를 사용하면 데이터 간의 상호 운용성과 구조적 이해가 크게 향상되어 보다 정확하고 신속한 의사 결정이 가능해집니다.
온톨로지는 특정 도메인 내의 개념과 관계를 명시적으로 정의하는 시스템으로, 보험 상품 구조, 계리/통계/재무 기법, 법률 및 회계 규정, 회사 내부 정책 및 매뉴얼 등의 지식을 구조화합니다. 결과물인 지식 그래프를 데이터베이스에 저장하고 필요에 따라 사용함으로써 대규모 언어 모델(LLM)은 질문에 더 정확하게 응답하고, 문맥을 더 잘 이해하고, 정보 간의 관계를 추론할 수 있습니다.
예를 들어 특정 보험 상품의 책임준비금 산출 방법에 대한 질문을 받으면 LLM은 온톨로지 기반 지식 그래프 데이터베이스에서 관련 규정, 계리 방법론, 기존 유사 상품 등을 종합적으로 검색하여 신뢰할 수 있는 답변을 생성할 수 있습니다. 동시에 어떤 데이터와 개념에 기반한 답변인지 시각적으로 제시하여 투명성과 사용자 신뢰도를 높일 수 있습니다.
[그림 4. 가상의 암 보험 상품에 대한 지식 그래프 예시] [그림 4.
이 기술을 실제로 적용하려면 온톨로지 및 지식 그래프 구축을 위한 단계적 전략과 함께 보험 계리사, 데이터 과학자, AI 엔지니어 간의 협업이 필수적입니다. 자동화된 관계 추출 및 업데이트를 위한 기술과 LLM과 지식 그래프 간의 통합 설계도 중요한 구성 요소로 부상하고 있습니다.
이동환 RNA Analytics AI 랩장은 "LLM은 계리 업무의 효율성과 접근성을 획기적으로 향상시킬 수 있는 잠재력을 가지고 있지만, 안전한 적용을 위해서는 신뢰성 확보가 필수적입니다. 데이터 품질, 표준화된 문서 구조, 온톨로지 기반 데이터베이스는 AI의 한계를 극복하고 보험 계리 업무의 진정한 혁신을 이끌어내는 핵심 요소입니다."라고 말했습니다.
RNA AnalyticsAI 솔루션
RNA Analytics 보험 업계를 위한 차세대 AI 기반 솔루션을 개발하고 있습니다. 이러한 솔루션 중 하나는 회사의 주력 보험 계리 소프트웨어와 함께 보험 계리 모델링 기능을 향상하도록 설계된 R3S Thalexa™입니다, R3S Modeler.
정보 전달의 허브 역할을 하는 뇌의 시상에서 이름을 따온 탈렉사는 보험 산업 전반의 다양한 정보를 연결하고 처리하는 보험 계리 생태계의 중심 허브 역할을 상징합니다.
R3S 탈렉사™
핵심 기능 1: 지식 에이전트
문서 기반 입력 자료에서 정보를 자동으로 추출하여 BB-Matrix(상품 구조 및 가정 관련 데이터가 포함된 테이블)를 채웁니다.
문서 기반 입력 자료에서 온톨로지 기반 데이터베이스를 자동으로 구축합니다.
핵심 기능 2: 모델링 에이전트
AI 기반 챗봇: 보험 계리 이론, 보험 규정 및 R3S Modeler 문서에 대한 실시간 Q&A 지원을 제공합니다.
R3S Modeler 코드 지원: 실시간으로 코드를 제안하여 모델링 생산성을 향상합니다.
R3S Modeler 위한 자율 AI 모델링 시스템: 보험 계리 모델을 자동으로 생성하여 수작업을 최소화하고 효율성을 극대화합니다.
R3S Thalexa™는 문서에서 상품 구조 및 가정 데이터를 추출하여 모델에 적합한 형식으로 정제하고 보험료 및 책임준비금 계산과 수익성 분석까지 연결하는 AI 기반 보험 상품 가격 책정 자동화 플랫폼입니다.
보험사는 탈렉사를 통해 상품 개정 및 신상품 개발 시 필요한 시간과 인력을 획기적으로 줄여 보다 정교한 수익성 평가와 시장 수요에 대한 신속한 대응이 가능해집니다.
[R3S 탈렉사™ 사용자 인터페이스]
RNA Analytics AI 솔루션의 핵심 기능을 꾸준히 확장하고 있습니다. 2025년 1월에는 대표 계리 언어 모델인 ActyLLM을 개발했으며, 2025년 7월에는 프롬프트 기반 Q&A 기능과 모델 코드 제안 기능을 도입할 예정입니다. 연말에는 모델링 에이전트를 통해 완전한 모델 구조를 생성할 수 있는 완전 자율 모델 구축 AI를 출시할 계획입니다. 이 AI 솔루션은 출시 후 사용자 피드백이 축적됨에 따라 더욱 강력한 엔진으로 진화하도록 설계되었습니다.
이 획기적인 기술은 RNA Analytics고도로 숙련된 AI 전문가들에 의해 개발 및 개선되고 있습니다. RNA의 AI 연구소는 보험 계리, 소프트웨어 개발, 데이터 과학 및 인공지능 분야에서 다국적 경험을 쌓은 전문가들로 구성되어 있습니다. 이 팀은 한국, 영국, 호주 등의 시장에서 쌓은 실제 전문 지식을 바탕으로 각 고객의 고유한 요구 사항을 충족하는 맞춤형 AI 솔루션을 제공합니다.
[그림 5. R3S AI 솔루션: 시스템 아키텍처 및 출력 결과]
RNA Analytics AI 프로젝트 책임자인 저스틴 황은 다음과 같이 말했습니다;
"액티엘엘엠과 R3S 탈렉사™가 주도하는 AI 솔루션은 단순한 기술을 넘어서는 것입니다. 보험 업계 전반의 비즈니스 혁신과 디지털 트랜스포메이션을 주도하는 전략적 AI 파트너가 될 수 있도록 설계되었습니다. 자동화된 상품 개발, 수익성 분석, IFRS 17 및 지급여력 요건과 같은 규제 지원을 통해 가시적인 가치를 제공하고 궁극적으로 고객의 경쟁력을 강화하는 것을 목표로 합니다."
보험 계리 업무에 AI를 도입하는 것은 실험 단계를 넘어섰습니다. 이제 정교한 지식 구조와 통합 시스템 설계를 통해 진정한 운영 자동화와 정보 정확도 향상으로 발전하고 있습니다.