• 요약 본 발명의 일 실시예에 따른 본 발명의 일 실시예에 따른 오디오 신호 처리 방법은, 부호화 전의 입력 신호와 양자화 및 복호화를 거친 출력 신호를 획득하는 단계; 입력 신호와 출력 신호의 프레임에 대한 지각적 전역 손실(perceptual global loss)을 계산하는 단계; 입력 신호와 출력 신호에 윈도윙 함수(windowing function)를 적용하여 입력 신호와 출력 신호의 복수 개의 서브 프레임(subframe)을 획득하는 단계; 입력 신호와 출력 신호의 복수 개의 서브 프레임에 대한 지각적 지역 손실(perceptual local loss)을 계산하는 단계; 및 상기 지각적 전역 손실과 상기 지각적 지역 손실에 기반하여, 다중 시간 스케일 지각적 손실을 획득하는 단계를 포함한다.
  • 대표 청구항 심층 신경망 모델과 전자적으로 통신하는 프로세서(processor)를 포함하는 컴퓨팅 시스템 내의 상기 프로세서에 의하여 실행되는 오디오 신호 처리 방법으로서, 상기 프로세서가, 부호화 전의 입력 신호와 양자화 및 복호화를 거친 출력 신호를 획득하는 단계; 상기 프로세서가, 상기 입력 신호와 상기 출력 신호의 프레임에 대한 지각적 전역 손실(perceptual global loss)을 계산하는 단계; 상기 프로세서가, 상기 입력 신호와 상기 출력 신호의 상기 프레임에 윈도윙 함수(windowing function)를 적용하여 상기 입력 신호와 상기 출력 신호의 복수 개의 서브 프레임(subframe)을 획득하는 단계; 상기 프로세서가, 상기 입력 신호와 상기 출력 신호의 상기 복수 개의 서브 프레임에 대한 지각적 지역 손실(perceptual local loss)을 계산하는 단계; 및 상기 프로세서가, 상기 지각적 전역 손실과 상기 지각적 지역 손실에 기반하여, 다중 시간 스케일 지각적 손실을 획득하는 단계; 를 포함하는 오디오 신호 처리 방법.
  • 대표 도면
  • 전략기술 분류 양자
    양자컴퓨팅

  • 출원번호 10-2022-0149392 KIPRIS
  • 출원일 2022-11-10
  • 공개번호 10-2024-0068229
  • 공개일 2024-05-17
  • 등록번호
  • 등록일
  • 우선권 번호
  • 우선권 국가
  • 우선권 주장일

  • 현재 상태 심사중
  • 현재 권리자
  • IPC 코드 G06N-003/02, G10L-019/032, G10L-019/00