업스테이지 AI OCR 솔루션 ‘Document AI’, 보험업계 문서 자동화 실현 평가
2023/10/25
업스테이지 Document AI, 삼성생명 7종 문서 인식률 95% 달성.. 업계 최고 수준
일부 문서 자동화 및 최소한의 검수 필요로 업무 및 노동 효율화 지원
사전학습 모델 활용, 최소의 데이터 학습 비용으로도 최고의 정확도 보장
(업스테이지=2023/10/25) AI 스타트업 업스테이지가 국내 1위 생명보험사 삼성생명에 공급한 금융 특화 AI 광학문자인식(OCR) 솔루션이 업계 1위의 정확도를 달성하며 문서 자동화 최고 난이도로 평가받는 보험업계에서도 문서 자동화를 실현했다는 평가를 받았다.
업스테이지(대표 김성훈)는 지난 4월 삼성생명에 공급한 자사의 대표 AI OCR 솔루션 ‘다큐먼트(Document) AI’의 문서 인식률이 평균 95점 이상의 높은 정확도를 달성했다고 밝혔다.
업스테이지와 삼성생명은 진료비 영수증 등 보험청구 서류 7종 문서를 대상으로 OCR 인식률을 검증, 평균 95%에 달하는 정확도를 추출하며 당초 목표치 90%를 훌쩍 뛰어넘는 쾌거를 이뤘다.
OCR은 이미지 내 문자를 텍스트 데이터로 추출하는 AI 기술이다. 이미지의 형태에 따라 난이도가 달라지며, 그중 보험 서류 처리는 최고 난이도로 꼽힌다. 진료비 영수증의 경우 병원마다 문서 양식이 천차만별이고, 손글씨 등 비정형 데이터가 많이 포함돼 고난도의 인식 기술이 요구된다.
이러한 이유로 통상 80점대에 수렴하는 타사 OCR 모델은 대부분 문서에 사람의 검수가 필요하다. 하지만 삼성생명과의 테스트에서 90점 중후반대를 기록한 업스테이지 모델의 경우 실제 사람의 수정이 필요한 항목은 4% 내외에 불과, 상당 부분 자동화가 가능한 수준임을 실증해 보였다.
또한, 높은 점수에는 모델의 범용성이 주효했다. 업스테이지 Document AI는 사전학습 모델을 기반으로 신규 데이터만 추가로 학습하면 다양한 형태의 문서를 처리할 수 있다. 업스테이지는 이번 삼성생명과의 협업에서 약제비 영수증 항목에서만 삼성생명 데이터를 활용하고, 나머지 6종 문서는 기본 모델만 구동해 평균 95% 이상의 인식률을 기록했다.
또한, 기울어진 각도나 구겨짐, 음영 등이 있는 이미지도 정확히 인식하며 주목을 받았다. 최근에는 스마트폰으로 촬영한 문서 처리 수요가 늘어나고 있어, 다양한 실생활 환경에서 촬영한 고화질 이미지 내 텍스트도 정확하게 뽑아내는 업스테이지 기술력이 더욱 돋보였다는 평가다.
이번 삼성생명과의 협업으로 업스테이지는 고난도로 꼽히는 보험 도메인에서 자동화 성공 사례를 세웠다. 앞으로 은행 등 범 금융권은 물론, 무역, 유통, 교육 등 다양한 산업 분야에서도 손쉽게 AI OCR을 도입해 업무 자동화를 구현할 수 있다는 점을 방증하는 성과다.
삼성생명은 업스테이지 Document AI 도입으로 데이터 입력부터 심사, 보험금 지급에 이르는 전 프로세스를 자동화함으로써 보험금 청구 건이 급증하는 상황에서도 신속한 지급이 가능한 환경을 구축, 언제나 균질한 서비스를 제공할 수 있게 되었다고 밝혔다.
업스테이지 AI OCR 기술력은 이미 자타공인 업계 최고로 꼽힌다. 업스테이지는 NeurlPS, AAAI, ACL, EMNLP 등 국제 AI 학회에서 다수의 논문을 발표하고, 최근 ‘국제 문서 분석 및 인식 학술대회(ICDAR)’에서 주관하는 세계 최고 권위의 AI OCR 경진대회에서 4관왕을 휩쓸었다.
앞으로 업스테이지는 삼성생명과 협력을 강화하고 보험 청구 문서 확장 등 OCR 적용 영역을 더욱 넓혀나갈 예정이다. 이미 삼성생명, 한화생명 등 금융권은 물론 포스코홀딩스, 삼성SDS, HD현대글로벌서비스 등 다양한 산업 군에서 업스테이지 Document AI를 도입하고 있다.
삼성생명 관계자는 “이번 업스테이지와 협업을 통해서 보험 본연의 핵심 가치라 할 수 있는 보험금 지급 서비스를 강화했다”며 “앞으로도 다양한 디지털 기술을 활용해 고객경험을 혁신하기 위한 노력을 계속할 것”이라고 말했다.
김성훈 업스테이지 대표는 “세계적인 수준의 업스테이지 AI OCR 기술력을 국내 1위 생명보험사인 삼성생명과의 협업에서 인정받게 되어 기쁘다”라며 “앞으로 업스테이지는 금융 뿐만 아니라 다양한 도메인에 특화된 AI 솔루션으로 기업들의 디지털 전환을 지원할 것” 이라고 밝혔다.
한편, 업스테이지 Document AI는 다양한 이미지 형태의 문서에서 글자 및 정보를 추출해 디지털 해주는 토탈 AI 솔루션이다. 수작업 처리 방식 대비 82%까지 비용 및 시간을 감축해 주고, 사전학습 모델로 타사 대비 4분의 1 수준의 데이터만 있어도 성능 확보가 가능하다. API 형태로 클라우드에서 손쉽게 사용할 수 있는 ‘Personal’과 기업 요구사항에 따라 도메인 맞춤형 인터페이스를 제공하는 ‘Enterprise’ 등 2가지 방식을 지원한다.
-
업스테이지 | 김근교 브랜드 커뮤니케이션 총괄이사 | keunkyo@upstage.ai
업스테이지 | 배성범 브랜드 커뮤니케이션 매니저 | sungbae@upstage.ai보도자료 다운받기
-
업스테이지는 2020년 10월에 설립된 국내 대표 AI 스타트업이다. 업스테이지는 허깅페이스 리더보드에서 오픈LLM 역사상 최초로 챗GPT의 벤치마크 점수를 뛰어넘는 성능으로 1위를 차지하며 거대 언어 모델(LLM) 업계에서 두각을 나타내고 있다. 이런 기술력을 기반으로 데이터 보안을 극대화하고 할루시네이션을 해결한 신뢰할 수 있는 프라이빗 LLM의 표준을 제시, 최첨단 기술을 기업이 편리하게 사용할 수 있도록 돕는다. 또한, 업스테이지의 Chat AI ‘AskUp’은 140만 명이 넘는 사용자를 보유, 국내 최대 AI 서비스로 자리매김했다. 또다른 업스테이지 대표 솔루션인 Document AI Pack은 세계 최고 권위 OCR 대회를 석권한 AI OCR 기술을 활용, 효율성과 정확성을 높여 문서 자동화 실현한다. 최소한의 데이터로 사전 학습된 모델을 통해 문서 처리를 최적화함으로써 수작업 방식에 비해 비용과 시간을 획기적으로 최소화한다. 마지막으로, 교육프로그램 ‘에듀스테이지’를 통해 AI 비즈니스 경험을 녹여낸 실습 위주의 교육과 탄탄한 AI 기초 교육을 통해 AI 비즈니스에 즉각 투입될 수 있는 차별화된 전문 인재를 육성하는 교육 콘텐츠 사업에도 적극 나서고 있다.
업스테이지는 구글, 애플, 아마존, 엔비디아, 메타, 네이버 등 글로벌 빅테크 출신의 멤버를 중심으로 NeurlPS를 비롯, ICLR, CVPR, ECCV, WWW, CHI, WSDM, DMLR 등 세계적 권위의 AI 학회에 다수의 우수 논문을 발표하고, 온라인 AI 경진대회 캐글(Kaggle)에서 국내 기업 중 유일하게 두 자릿수 금메달을 획득하는 등 독보적인 AI 기술 리더십을 다지고 있다. 업스테이지 김성훈 대표는 홍콩과학기술대학교 교수로 재직하면서 소프트웨어공학과 머신러닝을 융합한 버그 예측, 소스코드 자동생성 등의 연구로 최고의 논문상인 ACM Sigsoft Distinguished Paper Award 4회 수상, International Conference on Software Maintenance에서 10년 동안 가장 영향력 있는 논문상을 받은 세계적인 AI 구루로 꼽히며, 총 700만뷰 이상을 기록한 ‘모두를 위한 딥러닝’ 강사로도 널리 알려져 있다. 또한, 업스테이지의 공동창업자로는 네이버 Visual AI / OCR 을 리드하며 세계적인 성과를 냈던 이활석 CTO와 세계 최고의 번역기 파파고의 모델팀을 리드했던 박은정 CSO가 참여하고 있다.