• 페이스북
  • 트위터
  • 유튜브

"3초면 끝"…엔씨, 캐릭터 음성 자동 제작 AI 공개

등록 2024.10.08 15:14:07

  • 이메일 보내기
  • 프린터
  • PDF

다국어 음성 제작 등 가능한 멀티버스 TTS 공개

단일 모델로 구동…기존 음성 작업 시간·비용 절감

[서울=뉴시스] 엔씨소프트가 게임 음성 제작 과정 전반에 활용할 수 있는 인공지능(AI) 모델 '제로샷 멀티버스 TTS(이하 멀티버스 TTS)'를 공개했다고 8일 밝혔다. 엔씨소프트 판교 R&D센터 (사진=엔씨소프트 제공)

[서울=뉴시스] 엔씨소프트가 게임 음성 제작 과정 전반에 활용할 수 있는 인공지능(AI) 모델 '제로샷 멀티버스 TTS(이하 멀티버스 TTS)'를 공개했다고 8일 밝혔다. 엔씨소프트 판교 R&D센터 (사진=엔씨소프트 제공)


[서울=뉴시스]윤정민 기자 = 엔씨소프트가 게임 음성 제작 과정 전반에 활용할 수 있는 인공지능(AI) 모델 '제로샷 멀티버스 TTS(이하 멀티버스 TTS)'를 공개했다고 8일 밝혔다.

TTS는 자연어를 입력해 캐릭터 목소리 같은 음성 콘텐츠를 제작하는 음성 합성 기술이다. 엔씨가 공개한 '멀티버스 TTS'는 3초 분량의 프롬프트 음성만으로도 다양한 발화 스타일 변환, 화자 음색 일치도가 높은 교차 언어 생성, 다국어 음성 제작이 가능하다.

엔씨는 '멀티버스 TTS' 기술을 게임 음성 제작 과정 전반에 활용할 계획이다. 해당 모델을 활용하면 제한된 음성 리소스를 활용해 고품질의 풍부한 AI 캐릭터 보이스 제작이 가능해 기존 음성 작업에 소요되던 시간과 비용을 크게 절감할 수 있다고 설명했다.

단일 모델로 구동이 가능한 점도 특징이다. 멀티버스 TTS는 여러 가지 언어와 기능을 가진 TTS를 하나의 모델로 제공해 다국어 음성 콘텐츠를 제작한다. 엔씨는 최적화된 하나의 모델을 활용하는 만큼 경쟁 TTS 모델보다 상대적으로 적은 운용 비용으로 고품질의 음성 생성 서비스를 제공한다고 말했다.

엔씨는 이 멀티버스 TTS 모델 논문을 AI 관련 기술 학회 'EMNLP'에도 게재했다.

한편 엔씨는 글로벌 게임 출시를 위해 다국어 음성 AI 연구 개발에 매진하고 있다. 멀티버스 TTS를 시작으로 연내 100종의 게임 캐릭터 음성을 제작하고 비플레이어 캐릭터(NPC) 성격과 상황에 맞춰 음성을 제작하는 조절 기능을 지속 개발하는 것이 목표라고 전했다.


◎공감언론 뉴시스 [email protected]

많이 본 기사