AI 영상 번역 서비스 ‘딥세임(deepSAME)’ 로고
서울--(뉴스와이어)--인공지능(AI) 기계번역·음성인식 전문기업 엘솔루는 영상 속 화자의 음성을 복제하고 입 모양까지 자연스럽게 다국어로 변환하는 AI 기반 영상 번역 서비스 ‘딥세임(deepSAME, https://deepsame.ai)’의 베타 서비스를 8월 5일부터 시작한다고 밝혔다.
‘딥세임’은 엘솔루가 20여 년 이상 축적해 온 대규모 언어 데이터와 자사의 고도화된 AI 기계번역·음성인식 기술을 융합해 개발한 차세대 AI 영상 번역 서비스다. 기존 다국어 자막 자동 생성 솔루션인 ‘서브에디터(SubEditor)’가 제공하던 편의성과 정확도는 유지하되 자막 시청에 따른 몰입도 저하와 피로도 문제를 극복하기 위해 더빙 기반으로 진화한 형태다. 이를 위해 엘솔루는 세계 최고 수준의 보이스 클로닝(Voice Cloning)과 립싱크(Lip-Sync) 기술을 통합해 원어민처럼 자연스러운 다국어 더빙 영상을 구현했다.
‘딥세임’은 업로드된 영상에서 배경음과 화자의 음성을 자동으로 분리한 뒤 화자의 어조와 음색을 보존해 음성을 복제하고, 다국어로 실시간 AI 더빙을 수행한다. 이후 해당 언어의 발음에 맞춰 입 모양까지 정밀하게 립싱크 처리함으로써 사용자는 원본 콘텐츠의 감정과 분위기를 그대로 유지한 상태로 다양한 언어로 된 영상 콘텐츠를 경험할 수 있다.
특히 기존 더빙 작업이 통상 수백만 원의 제작비와 하루 이상 소요되는 수작업 기반이었다면, ‘딥세임’은 단 몇 분 내에 낮은 비용으로 영상 전체를 더빙 및 립싱크 처리할 수 있어 시간과 비용 측면에서 압도적인 효율성을 제공한다. 현재 한국어, 영어, 일본어, 중국어, 베트남어 등 33개 언어를 지원하며, 글로벌 콘텐츠 제작 환경에서 유연하게 활용 가능하다.
또한 ‘딥세임’은 경쟁 서비스와 차별화된 기능으로 후편집 전용 에디터 툴을 함께 제공함으로써 자동 번역 결과물에서 발생할 수 있는 오타, 오인식, 오번역 등의 오류도 사용자가 직접 손쉽게 보정할 수 있도록 했다. 이를 통해 완성도 높은 결과물 제작은 물론, 사용자 편의성까지 확보했다.
영상 업로드 외에도 유튜브 영상 URL 입력만으로 자동 변환과 다운로드가 가능해 콘텐츠 활용 범위를 대폭 확장한 점도 특징이다. 실제 해외 주요 콘텐츠 제작사와의 테스트에서는 기존 수작업 대비 최대 90%의 제작 시간 단축 효과를 입증했으며, 번역·더빙·편집의 개별 작업 단계를 통합해 전반적인 제작 워크플로를 혁신했다.
엘솔루 문종욱 대표이사는 “딥세임은 단순한 영상 번역 서비스가 아닌 AI 기반 화자 변환 및 립싱크 생성까지 포함된 몰입형 다국어 콘텐츠 생성 플랫폼”이라며 “자막을 넘어서는 몰입감, 제작 효율성 그리고 콘텐츠 품질을 모두 갖춘 서비스로 글로벌 시장 내 경쟁력을 더욱 강화해 나갈 것”이라고 말했다.
‘딥세임’ 베타 서비스는 8월 5일부터 11월 30일까지 진행되며, 회원가입만 하면 누구나 최대 5분 길이의 영상 10개까지 33개 다국어 AI 더빙 및 립싱크 기능을 무료로 체험할 수 있다.
엘솔루 소개
엘솔루(옛 시스트란인터내셔널)는 빅데이터 기반 인공지능(AI) 기술로 다양한 산업에 융합돼 업무 효율을 높이고 생산성을 극대화시키는 대한민국 대표 AI 기술 전문기업이다. 대표 기술로는 △AI 기계번역 △AI 음성처리 △AI 음성합성이 있다. 주요 제품·서비스로는 △ezNTS(기계번역기) △ezDAS(음성인식기) △AI Transcribe(E2E 음성인식기) △ezTTS(음성합성기) △AI EGC(영문법교정기) △ezTALKY(실시간통역기) △AI SubEditor(영상자막번역기) 등이 있으며, 국내외 정부·공공기관·군수국방·금융·유통·제조·IT 분야 등에 AI 기술을 공급 중이다. 회사는 서울 서초구 마방로에 위치해 있다.