• 요약 감정적 얼굴 표현을 위한 오디오 관점의 감정적 말하는 얼굴 생성 방법 및 시스템이 제시된다. 본 발명에서 제안하는 감정적 얼굴 표현을 위한 오디오 관점의 감정적 말하는 얼굴 생성 시스템은 참조 이미지에서 신원 정보만 전달하기 위해 참조 이미지 및 오디오를 입력 받아 상기 참조 이미지에 대한 중립적 말하는 얼굴 영상을 생성하는 중립 변환부 및 오디오 입력으로부터 감정적 정보를 인코딩하고 상기 생성된 중립적 말하는 얼굴 영상에 반영하기 위해 감정 표현 및 감정 강도의 분리된 표현 학습을 이용하여 감정적 말하는 얼굴을 생성하는 감정 표현부를 포함한다.
  • 대표 청구항
  • 대표 도면
  • 전략기술 분류 인공지능
    산업활용, 혁신 AI

  • 출원번호 10-2024-0143427 KIPRIS
  • 출원일 2024-10-18
  • 공개번호
  • 공개일 2025-10-21
  • 등록번호
  • 등록일 2025-10-02
  • 우선권 번호 1028705870000
  • 우선권 국가
  • 우선권 주장일

  • 현재 상태 등록
  • 현재 권리자
  • IPC 코드 G10L 21/10|G06T 13/40|G06T 13/20|G10L 25/63|G10L 25/30|G06V 40/16