UPDATED. 2024-03-29 20:15 (금)
한문고전 번역자 위한 ‘AI번역지원플랫폼’ 공동개발 나섰다
한문고전 번역자 위한 ‘AI번역지원플랫폼’ 공동개발 나섰다
  • 김봉억
  • 승인 2023.02.15 10:22
  • 댓글 0
이 기사를 공유합니다

전통문화연구회·에버트란·윤즈정보개발, 14일 업무협약 체결
인공지능과 빅데이터를 활용한 한문고전 번역지원 시스템 개발을 위해, 전통문화연구회, 윤즈정보개발, 에버트란 3곳이 지난 14일 업무 협약을 체결했다. 

한문고전 번역자를 위한 맞춤형 ‘AI번역지원플랫폼’을 개발하기 위해 관련 전문기관 3곳이 힘을 모으기로 했다. 

인공지능(AI)과 빅데이터를 활용한 한문고전 번역지원 시스템 개발을 위해, 동양고전번역 단체인 전통문화연구회(회장 박홍식)와 지식정보 구축 전문기업 윤즈정보개발(대표 고윤희), 인공지능 기반 기계번역 기술력을 갖춘 에버트란(이사 이청호)은 지난 14일 전통문화연구회에서 업무협약을 맺었다. 

이들은 한문번역을 위한 새로운 AI번역 도우미를 개발한다는 목표를 세웠다. 현실적인 해결책으로 인공지능을 활용한 기계 번역을 도입한다. 기계 번역을 위해 몇 가지 전제 조건이 필요하다. 

먼저 방대한 ‘한한(漢韓)병렬말뭉치’가 필요하다. 이 병렬 말뭉치를 생산하는 데 막대한 예산이 든다. 한 예로 한국고전번역원의 ‘승정원일기’ 기계 번역 학습 모델을 개발하는데 40억 원이 넘는 예산이 들었다. 그래서 AI용 학습 데이터 생산은 근본적인 접근 방법부터 바꾸기로 했다. 번역된 결과를 병렬 말뭉치로 구축하는 게 아니라 번역지원시스템에서 처음부터 병렬 말뭉치 형태로 번역을 해야 한다는 것이다. 이를 위해 번역지원시스템 도입이 필요하다. 

두 번째는 번역지원시스템 도입은 초벌 번역부터 프로젝트를 관리할 수 있는 기능과 최종 출판까지 전 과정을 지원할 수 있어야 한다. 이번 업무 협약을 맺은 전문기관 관계자들은 “한문고전 번역가를 AI기반 번역시스템으로 자연스럽게 유입시키기 위해 번역지원시스템에서 번역가들이 실감할 수 있도록 도움을 주어야 한다. 그렇지 않으면 아무리 강요를 하더라도 번역지원시스템이 정착되기는 쉽지 않을 것”이라고 말했다. 

한문을 우리말로 번역할 때, 다양한 기능이 요구된다. 특히 전문용어가 많이 사용되며 이를 풀이하는 각주가 있고, 각종 전고(典故)가 필요하다. 정확한 맥락을 이해하기 위해 각종 고전을 수시로 확인할 수 있어야 하고, 수천 년간 축적된 지식을 이해하기 위해 많은 대형 사전도 필요하다. 번역지원시스템은 이런 요구를 충족시킬 수 있어야 한다는 게 전통문화연구회의 생각이다. 번역지원시스템은 최초 번역부터 출판 단계까지 원스톱으로 진행할 수 있도록 구축할 계획이다. 

세 번째는 AI기반 번역지원시스템은 누구나 쉽고 비용 부담 없이 사용할 수 있도록 할 예정이다. 번역지원시스템이 한문 번역에 활용돼 한한병렬말뭉치를 생산하기 위해서는 많은 번역가를 유입시켜야 한다. 초기에는 모든 사용자가 무료로 사용하면서 많은 병렬말뭉치를 생산해야 한다. 축적된 말뭉치를 지속적으로 학습시켜 번역 모델의 품질을 높이고, 다시 번역 품질을 향상시키는 선순환 구조로 완성할 계획이다. 

전통문화연구회는 데이터의 중요성을 인식하고 2016년부터 한한병렬 말뭉치를 구축해 오고 있다. 현재 만들어진 1억 어절, 170만 문장 용례가 기계 번역과 번역 메모리 데이터로 활용돼 번역지원플랫폼의 기초를 이룬다. 

이번 업무협약의 첫 결실로 현재 특허까지 진행 중인 개인용 ‘한문고전 AI번역도우미’ 소프트웨어를 올해 말에 출시한다. 자신만의 번역 자료를 축적하고 개량할 수 있도록 상당 기간 무료로 사용할 수 있도록 할 예정이다.

전통문화연구회가 웹서비스 중인 '동양고전 번역용례' 메인 화면이다.
위 동양고전 번역용례 사이트에서 '시습'을 넣어 검색한 결과 화면이다.

전통문화연구회는 34년 역사의 동양고전번역 전문기관이다. 번역과 교육, 정보화 3대 사업을 추진하고 있으며, 동양학과 한국학의 연구 기반을 제공하고 있다. 현재 동양고전 번역서 341책을 출간했으며, 1천500책의 번역을 계획해 추진 중이다. 또한 번역서는 웹서비스인 ‘동양고전종합DB’를 통해 무료로 제공하고 있다.

AI번역과 번역지원시스템의 기반이 되는 한한병렬말뭉치는 170만 문장이 구축돼 국내 최대를 자랑한다. 이를 활용한 동양고전번역용례 웹서비스 또한 공개돼 있다. 이 웹서비스는 국내 최초 동양 한문고전 번역용례 사전으로, 원로 한학자들의 전통 지식과 번역 노하우가 녹아 있는 한문고전 번역서를 연구자와 번역가들이 쉽게 활용할 수 있도록 문장, 구절 단위의 원문과 번역문을 함께 제공한다. 

㈜윤즈정보개발은 국내 첫 인문학 데이터베이스인 ‘CD-ROM 국역 조선왕조실록’ 데이터베이스 개발 사업에 참여한 연구 인력을 중심으로 각종 국가 DB사업을 수행해 왔다. 한한병렬말뭉치를 구축하는데 필요한 각종 도구를 개발해 왔으며, 최근에는 한문 텍스트를 정확률 90% 이상 문장 단위 자동 병렬 말뭉치 구축 기술을 개발하고 있다. 2022년에 정부가 지원하는 AI바우처 사업을 통해 AI기반 번역지원시스템을 확보했다. 

㈜에버트란은 빅데이터와 인공지능 기술, 번역 지원 기술을 이용해 개발한 번역서비스 플랫폼 환경에서 번역 전문가에 의해 최상의 번역물을 만들 수 있도록 ‘기술과 인간의 융합 번역 서비스’를 제공하고 있다. 

김봉억 기자 bong@kyosu.net


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.