- 요약 본 발명의 일 실시예에 따른 본 발명의 일 실시예에 따른 오디오 신호 처리 방법은, 부호화 전의 입력 신호와 양자화 및 복호화를 거친 출력 신호를 획득하는 단계; 입력 신호와 출력 신호의 프레임에 대한 지각적 전역 손실(perceptual global loss)을 계산하는 단계; 입력 신호와 출력 신호에 윈도윙 함수(windowing function)를 적용하여 입력 신호와 출력 신호의 복수 개의 서브 프레임(subframe)을 획득하는 단계; 입력 신호와 출력 신호의 복수 개의 서브 프레임에 대한 지각적 지역 손실(perceptual local loss)을 계산하는 단계; 및 상기 지각적 전역 손실과 상기 지각적 지역 손실에 기반하여, 다중 시간 스케일 지각적 손실을 획득하는 단계를 포함한다.
- 대표 청구항 심층 신경망 모델과 전자적으로 통신하는 프로세서(processor)를 포함하는 컴퓨팅 시스템 내의 상기 프로세서에 의하여 실행되는 오디오 신호 처리 방법으로서, 상기 프로세서가, 부호화 전의 입력 신호와 양자화 및 복호화를 거친 출력 신호를 획득하는 단계; 상기 프로세서가, 상기 입력 신호와 상기 출력 신호의 프레임에 대한 지각적 전역 손실(perceptual global loss)을 계산하는 단계; 상기 프로세서가, 상기 입력 신호와 상기 출력 신호의 상기 프레임에 윈도윙 함수(windowing function)를 적용하여 상기 입력 신호와 상기 출력 신호의 복수 개의 서브 프레임(subframe)을 획득하는 단계; 상기 프로세서가, 상기 입력 신호와 상기 출력 신호의 상기 복수 개의 서브 프레임에 대한 지각적 지역 손실(perceptual local loss)을 계산하는 단계; 및 상기 프로세서가, 상기 지각적 전역 손실과 상기 지각적 지역 손실에 기반하여, 다중 시간 스케일 지각적 손실을 획득하는 단계; 를 포함하는 오디오 신호 처리 방법.
-
대표 도면
-
전략기술 분류
양자
양자컴퓨팅 - 출원번호 10-2022-0149392 KIPRIS
- 출원일 2022-11-10
- 공개번호 10-2024-0068229
- 공개일 2024-05-17
- 등록번호
- 등록일
- 우선권 번호
- 우선권 국가
- 우선권 주장일
- 현재 상태 심사중
- 현재 권리자
- IPC 코드 G06N-003/02, G10L-019/032, G10L-019/00

































































Copyright ⓒ 한국연구재단 기술사업화센터 (NRF-TCC) All rights reserved.