- 요약 본 발명은, 제1 텍스트와 상기 제1 텍스트에 대한 제1 음성 및 제2 텍스트와 상기 제2 텍스트에 대한 제2 음성이 입력되는 단계, 상기 제1, 2 텍스트 및 상기 제1, 2 음성을 커리큘럼 러닝(Curriculum learning)에 적용하여 학습한 음성 함성 모델을 생성하는 단계 및 음성 출력을 위한 대상 텍스트 입력 시, 상기 음성 합성 모델을 기반으로 상기 대상 텍스트에 대응하는 대상 합성 음성을 출력하는 단계를 포함하고, 상기 음성 합성 모델을 생성하는 단계는, 상기 제1, 2 텍스트를 결합한 결합 텍스트 및 상기 제1, 2 음성을 결합한 결합 음성을 생성하는 단계 및 상기 결합 텍스트 및 상기 결합 음성의 학습 결합 시 에러 레이트(error rate)가 설정된 기준 레이트(reference rate)보다 작으면 상기 결합 텍스트 및 상기 결합 음성을 상기 음성 합성 모델에 추가하는 단계를 포함하는 음성 합성 시스템의 동작방법을 제공한다.
- 대표 청구항 제1 텍스트와 상기 제1 텍스트에 대한 제1 음성 및 제2 텍스트와 상기 제2 텍스트에 대한 제2 음성이 입력되는 단계;상기 제1, 2 텍스트 및 상기 제1, 2 음성을 커리큘럼 러닝(Curriculum learning)에 적용하여 학습한 음성 합성 모델을 생성하는 단계; 및음성 출력을 위한 대상 텍스트 입력 시, 상기 음성 합성 모델을 기반으로 상기 대상 텍스트에 대응하는 대상 합성 음성을 출력하는 단계를 포함하고,상기 음성 합성 모델을 생성하는 단계는,상기 제1, 2 텍스트를 결합한 결합 텍스트 및 상기 제1, 2 음성을 결합한 결합 음성을 생성하는 단계; 상기 결합 텍스트 및 상기 결합 음성의 학습 결합 시 배치 사이즈(batch size)가 설정된 기준 배치 사이즈보다 작으면 상기 결합 텍스트 및 상기 결합 음성을 초기화하는 단계; 및상기 결합 텍스트 및 상기 결합 음성의 학습 결합 시 에러 레이트(error rate)가 설정된 기준 레이트(reference rate)보다 작으면 상기 결합 텍스트 및 상기 결합 음성을 상기 음성 합성 모델에 추가하는 단계를 포함하고,상기 음성 합성 모델에 추가하는 단계는,상기 에러 레이트가 상기 기준 레이트보다 크면 상기 결합 텍스트 및 상기 결합 음성을 초기화하는 단계를 더 포함하고,상기 배치 사이즈는 장문의 문장을 합성하기 위해 n개의 문장을 합쳐서 학습될 경우 1/n의 크기로 줄어드는음성 합성 시스템의 동작방법.
-
대표 도면
-
전략기술 분류
인공지능
첨단 AI 모델링, 의사결정(인지,판단,추론) - 출원번호 10-2023-0060960 KIPRIS
- 출원일 2023-05-11
- 공개번호 10-2023-0070423
- 공개일 2023-05-23
- 등록번호 10-2649028
- 등록일 2024-03-14
- 우선권 번호
- 우선권 국가
- 우선권 주장일
- 현재 상태 등록
- 현재 권리자 한양대학교 산학협력단
- IPC 코드 G10L-025/18, G10L-013/08, G10L-013/02

































































Copyright ⓒ 한국연구재단 기술사업화센터 (NRF-TCC) All rights reserved.