tvN 화면 해설 방송에 ‘AI 보이스 클로닝’ 기술 제공 인공지능 알고리즘으로 수천가지 목소리 재현도 가능해 토일 드라마 화면 해설 방송에 배우 전미도 내레이션
CJ올리브네트웍스가 tvN과 함께 시각 장애인을 위한 화면 해설 방송에 인공지능(AI) 기술을 도입한다고 5일 밝혔다.
화면 해설 방송은 시각 장애인을 위해 해설자가 등장인물의 표정이나 몸짓, 장면전환 등 화면의 전체적인 내용을 음성으로 설명해 주는 방송을 말한다.
일반적으로 화면 해설 방송은 화면을 음성으로 해설해주는 음원을 녹음해 주음성과 혼합해 부음성에 실어서 음성다중으로 송출하는 방식이다. 최종 편집 후에 다시 음성 작업을 하기 때문에 제작 시간이 길다.
CJ올리브네트웍스는 시각 장애인에게 친숙한 유명인의 목소리를 통해 보다 특별하게 콘텐츠를 즐길 수 있도록 업계 최초로 AI 보이스 클로닝(AI Voice Cloning) 기술을 화면 해설 방송에 지원했다.
AI 보이스 클로닝은 AI 알고리즘에 의한 개인별 음성 분석 및 자동 생성이 가능한 음성합성 기술이다. 음성을 학습한 뒤 글자를 입력하면 원하는 목소리를 자동으로 생성할 수 있다. 이를 통해 프로그램마다 일정 시간 녹음해 둔 목소리를 기반으로 AI가 여러 프로그램의 화면 해설 음성을 자동으로 생성할 수 있다.
이를 활용한 배우 전미도의 목소리로 tvN 토일드라마 ‘환혼’을 해설 방송으로 만나볼 수 있다. 그는 AI 보이스 클로닝기술이 적용된 화면 해설 방송에 내레이션으로 참여했다.
이현기 CJ올리브네트웍스 가상 인간 랩(LAB) 팀장은 “시각 장애인들이 AI 보이스 클로닝을 통해 색다른 화면 해설 방송을 경험할 수 있게 되어 매우 뜻 깊게 생각한다”며 ”시청 소외 계층을 포함한 모든 시청자들이 보이스 클로닝, 가상 인간 등을 활용해 차별화된 콘텐츠 경험과 높은 몰입으로 감동을 느낄 수 있도록 할 것”이라고 말했다.