현대모비스가 원가계산서를 AI에 맡긴 이유

현대모비스는 4,000개 협력사에서 오는 원가계산서를 수작업으로 처리해 왔습니다. 기존 문자 인식 기술이 복잡한 표 구조 앞에서 한계를 보인 이유와, AI가 정확도 95%, 오류율 0%를 달성한 과정을 정리했습니다.

Jun 12, 2026

Contents

원가계산서가 어려운 이유 기존 문자 인식 기술이 안 통한 이유 문서를 이미지처럼 읽는 AI 정확도 95%, 오류율 0%가 의미하는 것 문서 자동화, 결국 구조를 읽는 능력에서 갈린다

현대모비스는 약 4,000개 협력사로부터 부품을 공급받는 자동차 부품 제조사입니다. 그러다보니 협력사마다 양식이 다른 원가계산서가 들어오는데 이 문서를 읽고 항목을 분류한 뒤 시스템에 입력하는 작업은 담당자의 숙련도에 크게 의존해 왔습니다.

현대모비스가 이 작업에 AI를 도입한 건, 속도를 높이려는 게 아니었습니다. 원가계산서의 복잡한 표 구조를 사람이 아닌 시스템이 정확하게 읽어낼 수 있느냐가 핵심 질문이었고, 텍스트 인식 정확도 95% 이상, 시스템 저장 오류율 0%라는 결과가 그 답이 되고 있습니다.

원가계산서가 어려운 이유

원가계산서는 숫자가 많다는 것만이 문제가 아닙니다. 진짜 어려운 건 숫자들의 관계를 읽어내는 일이에요.

제조업 원가계산서에는 대분류, 중분류, 소분류가 계층적으로 나뉘어 있고, 여러 칸이 합쳐진 셀과 중간합계, 최종합계가 뒤섞여 있습니다. 사람은 원가계산서의 표를 보면 "이 숫자는 저 항목의 합계구나"라는 관계를 자연스럽게 파악하지만, 컴퓨터는 그렇지 않거든요. 셀이 합쳐져 있으면 어떤 숫자가 어떤 항목에 속하는지 자체를 판단하지 못합니다.

여기에 4,000개가 넘는 협력사가 각자 다른 양식을 쓴다는 조건이 겹칩니다. 같은 항목이라도 협력사에 따라 위치와 이름이 다르고, 표의 구조 자체가 다른 경우도 많죠. 이런 원가계산서를 정확하게 읽고 항목별로 분류해서 시스템에 넣는 작업은, 담당자의 경험과 숙련도에 크게 의존할 수밖에 없는 구조였습니다.

기존 문자 인식 기술이 안 통한 이유

기존의 문자 인식 기술은 글자를 읽는 데까지는 괜찮습니다. 하지만 원가계산서처럼 표 구조가 복잡한 문서에서는 한계가 뚜렷해지죠.

원가계산서는 항목 간의 관계가 핵심인 문서인데, 기존 방식은 이 관계를 읽지 못하는 게 근본적인 문제였습니다.

기존 방식은 문서에서 텍스트만 뽑아냅니다. "재료비", "가공비", "1,250,000" 같은 글자는 인식하지만, 1,250,000이 재료비인지 가공비인지, 소계인지 합계인지를 구분하지 못해요. 표의 칸이 합쳐져 있으면 어느 행에 어느 열이 대응하는지 파악하는 것 자체가 어려워지거든요.

양식이 바뀔 때마다 "이 위치에 이 항목이 온다"는 규칙을 새로 만들어야 하는 것도 문제였습니다. 협력사가 양식을 조금만 바꿔도 기존 규칙이 무용지물이 되고, 그때마다 다시 설정해야 하는 유지보수 부담이 컸죠.

결국 글자를 읽는 기술만으로는, 표의 구조와 항목 간의 관계까지 이해하는 것이 불가능했습니다.

문서를 이미지처럼 읽는 AI

현대모비스가 원가계산서 자동화를 위해 AI 기업 한국딥러닝과 함께 구축한 시스템은 접근 방식 자체가 다릅니다. 문서에서 글자만 뽑아내는 게 아니라, 문서 전체를 하나의 이미지처럼 보면서 구조까지 함께 파악하거든요.

사람이 표를 볼 때를 떠올려 보면 이해가 쉽습니다. 우리는 표를 읽을 때 글자만 보는 게 아니라, 선의 위치, 칸의 배치, 숫자의 정렬 방향 같은 시각적 단서를 동시에 활용합니다. "이 칸은 합쳐져 있으니까 위의 항목들을 묶는 소계겠구나"라는 판단을 무의식적으로 하고 있는 거죠.

이 AI도 같은 원리로 작동합니다. 문서의 시각적 구조와 텍스트의 의미를 동시에 처리해서, 병합된 셀의 경계를 인식하고, 소계와 합계 행의 계층 관계를 파악하고, 항목과 값을 정확하게 연결하는 거죠.

협력사마다 양식이 달라도 별도 규칙을 만들 필요가 없는 이유가 여기에 있어요. AI가 양식의 패턴이 아니라 문서의 구조와 의미를 읽기 때문에, 처음 보는 양식이라도 표의 논리를 파악할 수 있는 거으니까요.

한국딥러닝이 이 기술을 학습시킨 데이터는 4억 장 이상입니다. 글로벌 문서 인식 성능 평가에서 구글, 오픈AI를 포함한 주요 AI 모델을 제치고 1위를 기록한 배경이기도 하고요.

정확도 95%, 오류율 0%가 의미하는 것

현재까지의 성과를 보면, 텍스트 인식 정확도 95% 이상, 항목 분류 정확도 90% 이상, 표 구조 복원 정확도 90% 이상, 그리고 시스템 저장 오류율 0%를 기록하고 있습니다.

여기서 주목할 숫자는 시스템 저장 오류율 0%입니다. 문서에서 데이터를 추출한 뒤 시스템에 넣는 과정에서 오류가 없다는 뜻이에요. 이 단계에서 오류가 생기면 후속 업무 전체의 신뢰가 무너지기 때문에, 문서 자동화에서 가장 까다로운 기준이기도 합니다.

원가계산서 자동화가 의미하는 건 속도만이 아닙니다. 담당자의 역할이 "입력"에서 "판단"으로 바뀌고 있다는 점이 더 중요해요. 문서를 읽고 분류하고 입력하는 반복 작업에서 벗어나, AI가 처리한 결과를 검토하고 의사결정에 집중할 수 있는 구조로 옮겨 가고 있는 거죠.

또한 원가계산서가 단순 정산 문서에서 데이터 자산으로 전환되면, 항목별 변동 추이를 추적하거나 프로젝트별 원가 패턴을 분석하는 것도 가능해집니다. 이전에는 문서에 갇혀 있던 숫자들이, 의사결정에 쓸 수 있는 형태로 바뀌는 셈이에요.

문서 자동화, 결국 구조를 읽는 능력에서 갈린다

현대모비스 사례가 보여주는 건, AI 문서 자동화의 성패가 글자를 정확하게 읽느냐가 아니라 문서의 구조와 맥락을 이해하느냐에서 갈린다는 점입니다. 기존 문자 인식 기술이 한계를 보인 이유도, 원가계산서의 복잡한 표 구조에서 항목 간의 관계를 파악하지 못했기 때문이었고요.