NRF-TCC : 한국연구재단 기술사업화센터

요약 감정적 얼굴 표현을 위한 오디오 관점의 감정적 말하는 얼굴 생성 방법 및 시스템이 제시된다. 본 발명에서 제안하는 감정적 얼굴 표현을 위한 오디오 관점의 감정적 말하는 얼굴 생성 시스템은 참조 이미지에서 신원 정보만 전달하기 위해 참조 이미지 및 오디오를 입력 받아 상기 참조 이미지에 대한 중립적 말하는 얼굴 영상을 생성하는 중립 변환부 및 오디오 입력으로부터 감정적 정보를 인코딩하고 상기 생성된 중립적 말하는 얼굴 영상에 반영하기 위해 감정 표현 및 감정 강도의 분리된 표현 학습을 이용하여 감정적 말하는 얼굴을 생성하는 감정 표현부를 포함한다.

대표 청구항

대표 도면

전략기술 분류 인공지능
산업활용, 혁신 AI
출원번호 10-2024-0143427 KIPRIS
출원일 2024-10-18
공개번호
공개일 2025-10-21
등록번호
등록일 2025-10-02
우선권 번호 1028705870000
우선권 국가
우선권 주장일
현재 상태 등록
현재 권리자
IPC 코드 G10L 21/10|G06T 13/40|G06T 13/20|G10L 25/63|G10L 25/30|G06V 40/16