- 요약 개시된 실시예는 인공 신경망을 이용하여 학습 대상인 신경망 모델의 다수의 레이어 포함된 가중치의 비트수를 인가받아 신경망 연산하여 양자화 비트수를 추정하고, 추정된 양자화 비트수에 따라 신경망 모델의 가중치를 양자화하며, 가중치와 주기 함수의 합으로 변형된 변형 양자화 함수를 연속 함수로 근사화한 근사 함수를 이용하여, 신경망 모델의 학습 시에 계산되는 손실을 인공 신경망으로 역전파하여, 신경망의 가중치 학습 시에 양자화 비트수를 학습 가능한 파라미터로서 함께 학습시키고 각 레이어별 최적화된 양자화 비트수를 획득함으로써, 제한된 하드웨어 자원에서 구현되는 신경망의 성능을 향상시킬 수 있는 양자화 정밀도 조절 장치 및 방법을 제공한다.
- 대표 청구항 하나 이상의 프로세서; 및 상기 하나 이상의 프로세서에 의해 실행되는 하나 이상의 프로그램들을 저장하는 메모리를 구비한 장치로서, 상기 프로세서는 인공 신경망을 이용하여 학습 대상인 신경망 모델의 다수의 레이어 포함된 가중치의 비트수를 인가받아 신경망 연산하여 양자화 비트수를 추정하고, 추정된 양자화 비트수에 따라 상기 신경망 모델의 가중치를 양자화하며, 상기 가중치와 주기 함수의 합으로 변형된 변형 양자화 함수를 연속 함수로 근사화한 근사 함수를 이용하여, 상기 신경망 모델의 학습 시에 계산되는 손실을 상기 인공 신경망으로 역전파하는 양자화 정밀도 조절 장치.
-
대표 도면
-
전략기술 분류
양자
양자통신 - 출원번호 10-2022-0130236 KIPRIS
- 출원일 2022-10-12
- 공개번호 10-2024-0050628
- 공개일 2024-04-19
- 등록번호
- 등록일
- 우선권 번호
- 우선권 국가
- 우선권 주장일
- 현재 상태 심사중
- 현재 권리자
- IPC 코드 G06N-003/08, G06N-003/063, G06N-003/04


































































Copyright ⓒ 한국연구재단 기술사업화센터 (NRF-TCC) All rights reserved.