서비스 향 AI 모델 개발하기 EP.1 AI 모델 개발 환경에서 오는 차이
2022/03/04
⏱ 5mins
EP.1 들어가며
안녕하세요. 이번 에피소드의 주제는 ‘서비스 향 AI 모델 개발하기’입니다.
최근 혼자서, 커뮤니티 등을 통해 삼삼오오 모여 취미, 연구와 공부 목적으로 AI 모델 개발을 하는 분들을 점차 늘어나고 있죠. 그만큼 AI에 대한 관심이 나날이 증가하고, AI 기업으로의 커리어를 그리고 계신 분들이 늘어간다는 하나의 사인 같습니다. 그래서 첫 번째 ‘UP Tech’를 통해 ‘실제 현장에서 고객지향적인 AI 모델을 개발하는 방법’을 소개하고 합니다.
이번 주제는 총 네 편의 에피소드로 구성되었습니다.
본격적으로 주제에 들어가기에 앞서, EP. 1에서는 간략하게 💡‘학교/연구 환경 등의 통제된 상황에서의 AI 모델 개발’과 ‘실제 현장에서의 AI 모델 개발’이 어떤 차이를 가졌는지 소개하겠습니다. 그 후 세 편에 걸쳐 AI 모델 개발 프로세스와 AI 조직 구성 방법에 대해 자세히 다뤄보겠습니다.
연구 환경과 실제 현장에서의 AI 모델 개발
📍AI 개발 프로세스에서 모델링(모델 개발)은 무엇인가요?
👉 AI 모델 학습을 위한 주어진 학습 데이터셋을 활용, 정해진 테스트 데이터셋을 여러 테스트 단계에 거쳐 검증함으로써 최고 성능의 AI 모델을 확보하는 일입니다. 아래의 [그림 1]을 참고해 보세요.
✔️ 데이터셋이란? ‘특정 작업을 위해 데이터를 관련 구성단위로 모아 놓은 것’이며, 데이터 파일 또는 데이터베이스로 부르기도 합니다.
📍AI 모델 개발 시, 연구 환경과 실제 현장에서의 차이는 무엇인가요?
👉 결론부터 이야기하면, 통제된 상황과 비 통제된 상황에서 발생하는 차이입니다.
연구 환경에서의 AI 모델 개발은 통제된 상황에서 학습 데이터셋와 정해진 테스트 데이터셋, 테스트 방법이 주어집니다. 즉, AI 모델을 실서비스에 적용 시 발생할 수 있는 예기치 못한 돌발 상황으로부터 다소 자유롭습니다.
그러나 실제 현장에서는 데이터셋이 주어지지 않는 경우가 다수입니다. 모델 개발을 위해선 직접 데이터셋 구축부터 시작해야 하며, 통제되지 않은 상황 속 예기치 못한 돌발 상황들을 마주하게 됩니다. 또한, AI 모델 개발을 의뢰한 고객사의 요구사항을 세세히 반영해야 하기 때문에 AI 모델 개발 과정이 더욱 복잡하고 까다로워집니다.
예를 들어, 엔지니어는 고객사로부터 이런 ‘서비스 요구사항'을 받게 됩니다. “우리의 유저에게 XXX 경험을 전달하는 서비스를 만들고 싶습니다. AI로 이런 서비스가 구현 가능하나요?” 그럼 엔지니어는 이런 추상적인 요구사항을 개발 가능한 수준으로 구체화하여 AI 모델 개발에 착수해야합니다.
EP.1 나가며
간략하게 연구 환경과 실제 현장에서 AI 모델링 프로세스가 다른 이유를 알아보았습니다.
✔️ 연구 환경에서의 모델링 : 주어진 학습 데이터셋, 정해진 데이터셋과 테스트 방법을 통해 더 좋은 성능의 AI 모델을 제작하는 일
✔️ 실제 현장에서의 모델링 : 고객사의 서비스 요구사항에 부합하는 AI 모델을 만들어 내는 일, 이때 학습 데이터셋, 테스트 데이터셋, 테스트 방법은 상황에 따라 주어질 수 있고 없을 수도 있습니다.
다음 편에는 고객사의 추상적인 요구사항을 토대로 엔지니어들이 학습 데이터셋을 준비하는 법을 자세히 소개하겠습니다. 주어진 학습 데이터셋이 없을 경우, 어떤 조건과 과정을 통해 학습 데이터셋을 확보해서 AI 모델 학습을 할까요? 생생한 현장의 목소리를 듣고 싶으시다면 다음 화를 놓치지 마세요!