학술논문

Home

자료검색

학술논문

검색결과 돌아가기

검색화면

내보내기 프린트

A 28nm 1.07TFLOPS/mm2 Dynamic-Precision Training Processor with Online Dynamic Execution and Multi- Level-Aligned Block-FP Processing

Resource Type: Conference
Authors: Yang, Yixiong; Liu, Ruoyang; Wei, Chenhan; Wang, Wenxun; Sun, Wenyu; Yue, Jinshan; Yang, Huazhong; Liu, Yongpan
Source: 2023 IEEE Custom Integrated Circuits Conference (CICC) Custom Integrated Circuits Conference (CICC), 2023 IEEE. :1-2 Apr, 2023
Subject: Components, Circuits, Devices and Systems
Training
Deep learning
Application specific integrated circuits
Program processors
Manuals
Servers
Artificial intelligence
Language
ISSN: 2152-3630

Online Access

Full Text (IEEE)

초록

Training deep learning (DL) models consumes a huge amount of time and energy in cloud servers and edge devices, requiring energy- efficient processors [1 –5] to meet the rapid-growing demand for AI. Training processors either utilize a high-precision floating-point (FP) format to provide robust training results, or a low-precision format to increase efficiency but fail in accuracy. Mixed precision training (MPT) is promising to achieve both high accuracy and high efficiency. Manual mixed precision [5] is usually a coarse-grained mapping (per layer), which limits training accuracy. Automatic precision search [6] provides accurate and fine-grained precision mapping, but the high search latency slowdown the overall training process.

공지

DAU Library

학술논문

요약정보

A 28nm 1.07TFLOPS/mm2 Dynamic-Precision Training Processor with Online Dynamic Execution and Multi- Level-Aligned Block-FP Processing

Online Access

초록