프로그램 TRACK
DAY 2 09.30 (화) ⁄ TRACK 4 ⁄ 세션 2 11:00 ~ 11:45
다국어 음성 합성 시스템(NVOICE) 개발
기차역에서의 안내 방송이나 은행의 자동 응답 시스템과 같이 우리가 일상생활에서 접하는 소리들이 실제로는 음성합성 기술에 의하여 만들어진 합성음이라는 사실에 대하여 인식하는 사람들은 그다지 많지 않습니다. 이는 합성음을 사람의 음성과 구별할 수 없도록 만들어 내는 음성합성 기술의 발달에 기인합니다. 네이버의 경우에도 음성인식와 음성합성을 통합하는 음성 기반, 혹은 음성 합성만을 기반으로 한 서비스들을 실제로 제공하고 있으며 앞으로도 상당 수의 서비스에 이러한 기술이 적용되어 그 부가가치를 향상시킬 수 있을 것으로 전망하고 있습니다. 본 세션에서는 네이버 랩스에서 개발하고 있는 음성합성시스템인 NVOICE에 대하여 소개하는 세션으로서 NVOICE의 개발 방식과 개발 과정, 네이버에서 개발한 음성합성엔진이 어떤 서비스에 적용이 되고 있는지, 그리고 음성합성 시스템으로는 NVOICE가 어떤 특징을 가지는지에 대하여 설명합니다.
- 발표자 소개 김선희 NAVER LABS
- 연세대학교에서 프랑스어를 전공하였고 프랑스 파리 7대학에서 언어학 석사, 그리고 고등사회과학대학원(Ecole Des Hautes Etudes En Scieces Sociales)에서 언어학으로 박사학위를 받았습니다. 미국 인디애나대학(1995)과 UCLA(2008~2010)에서 두 차례 방문교수를 역임하였으며,, 2000년에 당시 세계적인 음성처리시스템 개발 회사인 Lernout & Hauspie의 음성합성(TTS)팀에서 일을 시작한 것을 계기로 하여 본격적으로 음성언어처리 분야에서 일하게 되었습니다. 이후 광운대학교 정보통신연구원(2002~2004), KAIST 전기전자공학과(2004~2005), 그리고 서울대학교 인문정보연구소(2005~2013)에서 연구교수로 재직하면서 음성합성 및 음성인식을 위한 발음모델링과 운율모델링을 연구해 왔습니다. 네이버 랩스에는 2013년에 합류하여 현재 수석연구원으로 다국어 음성합성시스템 개발에 참여하고 있습니다.
- 강연 대상
- 다국어 음성언어처리(Spoken Language Processing)에 관심이 있는 모든 개발자
- 발표 자료
- 동영상