NRF-TCC : 한국연구재단 기술사업화센터

요약 본 발명은, 제1 텍스트와 상기 제1 텍스트에 대한 제1 음성 및 제2 텍스트와 상기 제2 텍스트에 대한 제2 음성이 입력되는 단계, 상기 제1, 2 텍스트 및 상기 제1, 2 음성을 커리큘럼 러닝(Curriculum learning)에 적용하여 학습한 음성 함성 모델을 생성하는 단계 및 음성 출력을 위한 대상 텍스트 입력 시, 상기 음성 합성 모델을 기반으로 상기 대상 텍스트에 대응하는 대상 합성 음성을 출력하는 단계를 포함하고, 상기 음성 합성 모델을 생성하는 단계는, 상기 제1, 2 텍스트를 결합한 결합 텍스트 및 상기 제1, 2 음성을 결합한 결합 음성을 생성하는 단계 및 상기 결합 텍스트 및 상기 결합 음성의 학습 결합 시 에러 레이트(error rate)가 설정된 기준 레이트(reference rate)보다 작으면 상기 결합 텍스트 및 상기 결합 음성을 상기 음성 합성 모델에 추가하는 단계를 포함하는 음성 합성 시스템의 동작방법을 제공한다.

대표 청구항 제1 텍스트와 상기 제1 텍스트에 대한 제1 음성 및 제2 텍스트와 상기 제2 텍스트에 대한 제2 음성이 입력되는 단계;상기 제1, 2 텍스트 및 상기 제1, 2 음성을 커리큘럼 러닝(Curriculum learning)에 적용하여 학습한 음성 합성 모델을 생성하는 단계; 및음성 출력을 위한 대상 텍스트 입력 시, 상기 음성 합성 모델을 기반으로 상기 대상 텍스트에 대응하는 대상 합성 음성을 출력하는 단계를 포함하고,상기 음성 합성 모델을 생성하는 단계는,상기 제1, 2 텍스트를 결합한 결합 텍스트 및 상기 제1, 2 음성을 결합한 결합 음성을 생성하는 단계; 상기 결합 텍스트 및 상기 결합 음성의 학습 결합 시 배치 사이즈(batch size)가 설정된 기준 배치 사이즈보다 작으면 상기 결합 텍스트 및 상기 결합 음성을 초기화하는 단계; 및상기 결합 텍스트 및 상기 결합 음성의 학습 결합 시 에러 레이트(error rate)가 설정된 기준 레이트(reference rate)보다 작으면 상기 결합 텍스트 및 상기 결합 음성을 상기 음성 합성 모델에 추가하는 단계를 포함하고,상기 음성 합성 모델에 추가하는 단계는,상기 에러 레이트가 상기 기준 레이트보다 크면 상기 결합 텍스트 및 상기 결합 음성을 초기화하는 단계를 더 포함하고,상기 배치 사이즈는 장문의 문장을 합성하기 위해 n개의 문장을 합쳐서 학습될 경우 1/n의 크기로 줄어드는음성 합성 시스템의 동작방법.

대표 도면

전략기술 분류 인공지능
첨단 AI 모델링, 의사결정(인지,판단,추론)
출원번호 10-2023-0060960 KIPRIS
출원일 2023-05-11
공개번호 10-2023-0070423
공개일 2023-05-23
등록번호 10-2649028
등록일 2024-03-14
우선권 번호
우선권 국가
우선권 주장일
현재 상태 등록
현재 권리자 한양대학교 산학협력단
IPC 코드 G10L-025/18, G10L-013/08, G10L-013/02

플랫폼 소개

기술이전·사업화 기술 정보

대학 국가전략기술 정보

IP 수익화 프로그램 정보

공지·알림

대학 정보 서비스

음성 합성 시스템의 동작방법