나라지식정보, 율곡국학진흥원과 ‘지능형 초서 판독 AI 모델’ 공동 개발 협약 체결

약 20만 자의 고도로 정제된 초서 학습 데이터 제공

‘하이브리드 판독 AI 모델’ 도입

전후 문맥과 역사적 용어를 근거로 AI가 정확하게 판별해낼 수 있도록 설계

서울--(뉴스와이어)--나라지식정보(대표 손영호)는 율곡국학진흥원(원장 박원재)과 ‘지능형 초서 판독 AI 모델 구축’을 위한 업무협약(MOU)을 체결했다고 18일 밝혔다. 협약식은 율곡국학진흥원 본관 세미나실에서 열렸다.

이번 협약은 고전문화 자산의 디지털화와 학문적 접근성 향상을 위해 이뤄졌다. 기존에 공개된 초서 학습 데이터는 약 1만 자 정도지만 협약에 따라 진흥원은 약 20만 자의 고도로 정제된 학습 데이터를 제공하며, 나라지식정보는 이를 기반으로 한 AI 모델 구축과 성능 고도화를 담당하게 된다.

그동안 초서 판독은 AI 기반 문서 이미지 분석 및 인식(DIAR) 분야에서 가장 도전적인 과제로 꼽혀왔다. 국내에서도 두 차례 시도가 있었으나 데이터 부족과 기술 이해도의 한계로 실용화에 이르지 못했다.

나라지식정보와 율곡국학진흥원은 이번 프로젝트에서 ‘하이브리드 판독 모델’을 도입한다. 단순히 글자 모양(자형)만 인식하는 방식에서 탈피해 고문헌 특화 용어 사전 학습과 문서 유형별 글자 등장 빈도를 확률적으로 결합하는 방식을 채택했다. 이 방식은 흐릿하게 흘려 쓴 글자도 AI가 전후 문맥과 역사적 용어를 기반으로 정확히 판별할 수 있도록 설계된 독자적인 아키텍처다.

율곡국학진흥원 박원재 원장은 “초서 판독 모델은 AI 시대에 강원도의 역사 자산을 디지털화하기 위한 핵심 엔진”이라며 “이번 협약을 통해 세계적으로도 보고된 바 없는 고난도 판독 모델을 성공시켜 강원도형 스마트 아카이브의 초석을 다지고, 미래를 선도하는 강원도 구현에 이바지하겠다”고 밝혔다.

나라지식정보 손영호 대표는 “초서 디지털화는 학술 가치뿐 아니라 국민 누구나 고전 정보에 접근할 수 있도록 돕는 기반이 된다”며 “AI 기술을 공공성과 연결해가는 데 노력하고, 지금까지 이어온 기업 정신을 바탕으로 미래의 청사진을 만들어가겠다”고 의지를 전했다.

나라지식정보 소개

나라지식정보는 2008년 설립된 이래 한국의 언어·역사·문화 데이터를 중심으로 국립국어원, 국가기록원, NIA 등 180여 기관에 약 600건의 공공 데이터·AI 사업을 수행해 온 지식정보화 전문 기업이다. 자체 개발한 고문헌, 비정형 모두 정확성과 신뢰도 높은 AI OCR 엔진 ‘NARA OCR’과 XAI로서의 RAG LLM ‘NA-LLM’, AI Agent ‘주춧돌LM’ 등의 기술력을 보유했다. 수작업이 필요한 아날로그 기록물을 AI로 디지털 전환해 지식 콘텐츠로 활용하는 디지털 혁신 서비스를 다수 제공하고 있으며, 이를 통해 E2E 원스톱 토탈솔루션과 시각장애인용 READ VOICE에 이르기까지 사업을 확장해 나가고 있다. 다양한 산업 분야에서 AI 데이터 구축 및 활용 사업을 전개하며 공공과 민간의 AI 경쟁력 강화에 이바지하고 있다.

웹사이트: http://www.narainformation.com

연락처

나라지식정보
경영기획실
신난타 부장
02-3141-7644
이메일 보내기

국내 최대 배포망으로 소식을 널리 알리세요