- 요약 감정적 얼굴 표현을 위한 오디오 관점의 감정적 말하는 얼굴 생성 방법 및 시스템이 제시된다. 본 발명에서 제안하는 감정적 얼굴 표현을 위한 오디오 관점의 감정적 말하는 얼굴 생성 시스템은 참조 이미지에서 신원 정보만 전달하기 위해 참조 이미지 및 오디오를 입력 받아 상기 참조 이미지에 대한 중립적 말하는 얼굴 영상을 생성하는 중립 변환부 및 오디오 입력으로부터 감정적 정보를 인코딩하고 상기 생성된 중립적 말하는 얼굴 영상에 반영하기 위해 감정 표현 및 감정 강도의 분리된 표현 학습을 이용하여 감정적 말하는 얼굴을 생성하는 감정 표현부를 포함한다.
- 대표 청구항
-
대표 도면
-
전략기술 분류
인공지능
산업활용, 혁신 AI - 출원번호 10-2024-0143427 KIPRIS
- 출원일 2024-10-18
- 공개번호
- 공개일 2025-10-21
- 등록번호
- 등록일 2025-10-02
- 우선권 번호 1028705870000
- 우선권 국가
- 우선권 주장일
- 현재 상태 등록
- 현재 권리자
- IPC 코드 G10L 21/10|G06T 13/40|G06T 13/20|G10L 25/63|G10L 25/30|G06V 40/16
NRF-TCC AI 요약 뉴스레터 구독
NRF-TCC AI가 요약해주는 최신 기술이전 동향, 특허 정보, 수익화 프로그램 소식을
매주 월요일 10시에 이메일로 받아보세요.
Copyright ⓒ 한국연구재단 기술사업화센터 (NRF-TCC) All rights reserved.