셀바스AI, 대화형 음성합성 오픈소스 플랫폼 구축

[의학신문·일간보사=오인규 기자] 인공지능 전문기업 셀바스AI는 로봇의 감정 및 개성을 표현할 수 있는 대화형 음성합성 오픈소스 플랫폼을 구축했다고 7일 밝혔다.

이번 오픈소스 플랫폼은 산업통상자원부 산업기술혁신사업의 일환으로 한국과학기술원 주관하에 진행된 음원 다양화를 통해 로봇의 감정 및 개성을 표현할 수 있는 대화음성합성 원천기술 개발 국책연구과제의 일환이다.

개발된 오픈소스 플랫폼은 소스코드 공유사이트 깃허브(GitHub)에 구축됐으며, DNN 음성합성기 제작에 필요한 음성코퍼스를 비롯해 로봇에 감정과 개성을 부여하기 위한 Emotional SSML 해석기, 딥러닝 기반 한국어 G2P 변환기, 딥러닝 훈련이 가능한 End-to-End 한국어 음성합성기 및 음색과 감정을 표현할 수 있는 음성합성기가 공개돼 있다.

또한 가창 기반 음성합성기 연구를 위해 수집한 한국어와 영어 각각 50개로 구성된 어린이 노래 코퍼스도 공개했다. 해당 오픈소스 플랫폼은 한국과학기술원, 성신여대, 대전대, 서강대 그리고 셀바스AI에서 공동연구한 결과물이다.

셀바스AI는 연구과제 중 DNN 음성합성기 제작에 필요한 음성코퍼스 설계 및 구축을 담당해 총 40명의 목소리로 이뤄진 2만 4247개 문장, 34시간 분량의 음성 데이터베이스를 구축했으며, 감정과 개성 표현을 위한 음성 데이터가 포함됐다. 공개된 음성 데이터베이스는 한국어로는 세계에서 가장 많은 양의 음성합성용 데이터를 제공하고 있다.

오인규 기자 529@bosa.co.kr

다른기사 보기

상단영역

본문영역

셀바스AI, 대화형 음성합성 오픈소스 플랫폼 구축

개의 댓글

댓글 정렬

내 댓글 모음