NRF-TCC : 한국연구재단 기술사업화센터

요약 개시된 발명의 일 실시예에 따른 발화 음성 기반 얼굴 합성 시스템은, 발화를 하고 있는 발화 객체의 얼굴 이미지인 제1 발화자 이미지, 제2 발화자 이미지 및 오디오 음성 데이터를 기초로, 제1 기계 학습 모델을 이용하여 상기 오디오 음성 데이터에 대응되는 얼굴을 하는 상기 발화 객체의 이미지인 음성 대응 출력 이미지 및 상기 발화 객체의 이미지에서 상기 발화 객체가 발화할 때 움직이는 얼굴 영역인 마스크 영역을 생성하도록 구성되는 중간 출력 데이터 생성 모듈을 포함하고, 상기 제2 발화자 이미지는, 상기 제1 발화자 이미지의 하단 절반 영역이 제거되고 남은 상단 절반 영역의 이미지일 수 있다.

대표 청구항 발화를 하고 있는 발화 객체의 얼굴 이미지인 제1 발화자 이미지, 제2 발화자 이미지 및 오디오 음성 데이터를 기초로, 제1 기계 학습 모델을 이용하여 상기 오디오 음성 데이터에 대응되는 얼굴을 하는 상기 발화 객체의 이미지인 음성 대응 출력 이미지 및 상기 발화 객체의 이미지에서 상기 발화 객체가 발화할 때 움직이는 얼굴 영역인 마스크 영역을 생성하도록 구성되는 중간 출력 데이터 생성 모듈을 포함하고,상기 제2 발화자 이미지는, 상기 제1 발화자 이미지의 하단 절반 영역이 제거되고 남은 상단 절반 영역의 이미지인, 발화 음성 기반 얼굴 합성 시스템.

대표 도면

전략기술 분류 인공지능
안전, 신뢰 AI
출원번호 10-2023-0076484 KIPRIS
출원일 2023-06-15
공개번호 10-2023-0172427
공개일 2023-12-22
등록번호
등록일
우선권 번호 10-2022-0072834
우선권 국가 KR
우선권 주장일 2022-06-15
현재 상태 심사중
현재 권리자
IPC 코드 G06T-005/50, G06V-040/16, G06N-020/00, G10L-021/10, G06T-013/20, G06T-019/20, G10L-015/04, G06T-017/20