Download as pdf or txt
Download as pdf or txt
You are on page 1of 46

Machine Translated by Google

Một nghiên cứu so sánh gần đúng


Bộ cộng và bộ nhân

Honglan Jiang*, Cong Liu*, Naman Maheshwari#,


Fabrizio Lombardi§và Jie Han*
*
Khoa Kỹ thuật Điện và Máy tính
Đại học Alberta, Edmonton, AB, Canada, # Khoa Kỹ thuật Điện và Điện tử, Viện Khoa
học và Công nghệ Birla, Pilani, Rajasthan, Ấn Độ và §Khoa Kỹ thuật Điện và Máy
tính, Đại học Đông Bắc, Boston, Hoa Kỳ.
Machine Translated by Google

1
Đề cương

Động cơ và giới thiệu

Xem xét và phân loại các chất cộng gần đúng

So sánh các bộ cộng gần đúng

Đặc điểm lỗi

Đặc tính mạch điện

Xem xét và phân loại các số nhân gần đúng

So sánh các số nhân gần đúng

Đặc điểm lỗi

Đặc tính mạch điện

Kết luận
Machine Translated by Google

Động lực 2

Kích thước vật lý của thiết bị CMOS đã được mở rộng


và tiến gần tới vài nanomet.
o Cải thiện hiệu suất mạch của mạch kỹ thuật số ngày càng trở nên khó khăn. o Hiệu quả

năng lượng là mối quan tâm hàng đầu trong thiết kế hệ thống kỹ thuật số.

Máy tính ngày càng trở nên nặng nề với việc xử lý đa phương
tiện (âm thanh, video, đồ họa và hình
ảnh), nhận dạng, tìm kiếm, học máy
và khai thác dữ liệu.

Đặc điểm chung: không cần kết quả hoàn


hảo và chỉ cần kết quả gần đúng
hoặc kém tối ưu là đủ
o Nhận thức của con người không nhạy cảm với những thay đổi tần

số cao. o Tầng nhiễu tự nhiên do nhiễu lượng tử hóa.


Machine Translated by Google

3
Mô hình chống lỗi

Làm thế nào chúng ta có thể khai thác khả năng không chính xác của hệ thống

dung nạp và giảm năng lượng?

Tính toán gần đúng


o Không liên quan đến các giả định về tính chất ngẫu nhiên của bất kỳ quy trình cơ bản nào triển khai

hệ thống. Sử dụng các thuộc tính thống kê của dữ liệu và thuật toán để đánh đổi chất lượng lấy

việc giảm năng lượng.

Tính toán ngẫu nhiên


o Các số thực được biểu diễn bằng các luồng bit nhị phân ngẫu nhiên thường được thực hiện theo
chuỗi (hoặc song song) và theo thời gian (hoặc không gian). Thông tin được thực hiện trên
số liệu thống kê của các luồng nhị phân.

Tính toán xác suất


o Khai thác hành vi xác suất nội tại của kết cấu mạch cơ bản, rõ ràng nhất là hành vi ngẫu nhiên của

một công tắc nhị phân dưới ảnh hưởng của nhiễu nhiệt.

J. Han và M. Orshansky. Máy tính gần đúng: Một mô hình mới nổi cho thiết kế tiết kiệm năng
lượng. Trong ETS, trang 1-6, Avignon, Pháp, 2013.
Machine Translated by Google

Bộ cộng và bộ nhân được thiết kế gần đúng 4

Nỗ lực trong tính toán gần đúng bao gồm nhiều nghiên cứu,
từ những vấn đề giải quyết ở cấp độ mạch và hệ thống, cho
đến những vấn đề ở cấp độ phần mềm và ứng dụng,

Chúng tôi tập trung vào thiết kế phần cứng gần đúng và đặc
biệt là các mạch số học gần đúng của bộ cộng và bộ nhân
hoặc bộ cộng và bộ nhân được thiết kế gần đúng.
Machine Translated by Google

5
Bộ cộng mang gợn sóng (RCA)

Bộ cộng mang gợn sóng n-bit.

ℎ: ( )
: ( )

Sơ đồ của một bộ cộng đầy đủ (FA).


Machine Translated by Google

6
Bộ bổ sung Lookahead mang theo (CLA)

Một bộ cộng tra cứu mang theo n-bit.

ℎ: (log( ))
C : ( nhật ký( ))

Sơ đồ tổng, truyền và tạo tín hiệu


(SPG).
Machine Translated by Google

7
Chất cộng gần đúng: Phân loại A

Chúng tôi phân loại các bộ cộng gần đúng thành bốn loại:

Các chất cộng suy đoán

o Đối với bộ cộng 128 bit, xác suất chuỗi lan truyền mang dài hơn
12 và 18 lần lượt là 1% và 0,01%.*

o Do đó, k bit được sử dụng để suy đoán giá trị mang cho mỗi bit tổng (k < n).

Bộ cộng được phân đoạn

o Một bộ cộng n-bit được chia thành nhiều bộ cộng phụ k-bit nhỏ hơn.

o Việc mang theo có thể được tạo ra bằng cách sử dụng các phương pháp khác nhau.

Bộ cộng chọn lọc mang theo

o Nhiều mạch phụ được sử dụng để tính tổng cho các giá trị mang khác nhau và
kết quả được chọn bằng cách mang một mạch phụ.

Bộ cộng đầy đủ gần đúng

*AK Verma, P. Brisk và P. Ienne. Bổ sung suy đoán có độ trễ thay đổi: Một mô hình mới cho
thiết kế mạch số học. Vào NGÀY, trang 1250 - 1255, 2008.
Machine Translated by Google

Bộ cộng suy đoán


số 8

Bộ cộng gần đúng (ACA):


Đường dẫn quan trọng

Bộ cộng gần đúng n-bit (ACA).

ℎ: (log( )) : (( ) log( ))

AK Verma, P. Brisk và P. Ienne. Bổ sung suy đoán có độ trễ thay đổi: Một mô hình mới cho thiết
kế mạch số học. Vào NGÀY, trang 1250 - 1255, 2008.
Machine Translated by Google

9
Bộ cộng phân đoạn (1)

Bộ cộng phân đoạn bằng nhau (ESA):

Đường dẫn quan trọng

Bộ cộng phân đoạn bằng nhau n-bit (ESA) (l ≤ k).

ℎ: (log( )) : ( ôi( ))

D. Mohapatra, V. Chippa, A. Raghunathan và K. Roy. Thiết kế các hàm meta có khả năng mở rộng điện áp để tính

toán gần đúng. Trong DATE, trang 1-6, 2011.


Machine Translated by Google

10
Bộ cộng được phân đoạn (2)

Bộ cộng chịu lỗi loại II (ETAII):


Đường dẫn quan trọng

bn-1:nk an-1:nk bn-k-1:n-2k an-k-1:n-2k bk-1:0 ak-1:0

...

Mang Mang Mang


Máy phát điện Máy phát điện Máy phát điện

...

Tổng Tổng Tổng

Máy phát điện Máy phát điện Máy phát điện

...

sn-1:nk sn-k-1:n-2k sk-1:0

Bộ cộng chịu lỗi n-bit loại II (ETAII).

ℎ: (log( )) : ( nhật ký( ))

N. Zhu, WL Goh và KS Yeo. Bộ cộng tốc độ cao tiêu thụ điện năng thấp được cải tiến dành cho ứng dụng có

khả năng chịu lỗi. Trong ISIC 2009, trang 69-72, 2009.
Machine Translated by Google

11
Mang theo bộ bổ sung chọn lọc

Bộ cộng lựa chọn mang theo suy đoán (SCSA):

Đường dẫn quan trọng

Bộ cộng lựa chọn mang suy đoán n-bit (SCSA).

ℎ: + Mạch : +
MỘT : ( nhật ký( ))
: (log( ))
: ℎ : ℎ

K. Du, P. Varman và K. Mohanram. Hiệu suất cao, độ trễ thay đổi đáng tin cậy mang theo lựa chọn bổ
sung. Vào DATE, trang 1257-1262, 2012.
Machine Translated by Google

12
Bộ cộng đầy đủ gần đúng

Một sơ đồ chung:
bn-1:l an-1:l bl-1:0 al-1:0
gần đúng
Adder đầy đủ

al-1 bl-1 al-2 bl-2 a0 b0

Cin Cl-1 C1
cout MỘT FA MỘT FA ... MỘT FA
(nl)-bit Chính xác
Trình bổ sung phụ

sl-1 sl-2 ... s0

Bộ cộng phụ gần đúng l-bit

sn-1:l sl-1:0

Bộ cộng gần đúng n-bit sử dụng bộ cộng gần đúng đầy đủ

ℎ: :

_
+ _ _
+ _
Machine Translated by Google

13
Bộ cộng gương gần đúng (AMA)

Bộ cộng gương xấp xỉ 1 (AMA1).

Bảng chân lý của AMA1.

AB Cin Sum' Cout1


0 0 0 0 0 0 1 1 0 1 0
0
0 0 1
Bộ cộng gương thông thường (MA).
0 0 1
1 1 0 0
0 0 1
1 1 1 0 1 0 0 1

1 1 1 0 1 1 1

V. Gupta, D. Mohapatra, A. Raghunathan và K. Roy. Xử lý tín hiệu số công suất thấp bằng cách sử dụng
các bộ cộng gần đúng. IEEE Trans. CAD, 32(1):124-137, 2013.
Machine Translated by Google

14
Phần dưới HOẶC Bộ cộng (LOA)

Bộ cộng OR phần dưới n-bit (LOA).

ℎ: :
(log( - )) + ( × )
HOẶC

: (( ) ( ) ) ℎ .

HR Mahdiani, A. Ahmadi, SM Fakhraie và C. Lucas. Các khối tính toán không chính xác lấy cảm
hứng từ sinh học để triển khai VLSI hiệu quả cho các ứng dụng điện toán mềm. IEEE Trans. Hệ thống
mạch, 57(4):850-862, 2010.
Machine Translated by Google

15
Một bản tóm tắt ngắn gọn
Phân tích độ trễ và độ phức tạp của mạch cộng gần đúng.

Loại bộ cộng Tên người bổ sung Trì hoãn Diện tích mạch

RCA ( ) ( )
Bộ cộng thông thường
CLA ( ( )) ( ( ))

Bộ cộng suy đoán ACA [3] (log( )) (( ) log( ))

ESA [6] ( ( )) ( ( ))

Bộ cộng được phân đoạn ETAII [4] ( ( )) ( ( ))

ACAA [5] (log( )) (( )log( ))

SCSA [7] + +
Bộ cộng gần
đúng CSA [8] (log( )) +

Mang theo bộ bổ sung chọn lọc CSPA [10] + + +

CCA [11] + +

GCSA [12] (log( )) ( nhật ký( ))

Gần đầy đủ
LOA [13] (log( - )) Aloa+( × HOẶC )
Trình bổ sung

: mạch là mạch dự
: (log( )) MỘT : ( nhật ký( )) A : (( )log( ))
đoán mang
• ESA có độ trễ và diện tích mạch nhỏ nhất.
• ETAII, ACAA và SCSA có độ chính xác như nhau; ETAII là nhất
thiết kế hiệu quả trong số đó.
Machine Translated by Google

16
Số liệu lỗi

Tỷ lệ lỗi (ER) là xác suất tạo ra một lỗi


kết quả sai.

Khoảng cách lỗi (ED) là khoảng cách số học giữa


kết quả gần đúng và kết quả chính xác.

Nếu M' và M là kết quả gần đúng và chính xác, = ' .

Khoảng cách lỗi tương đối (RED) được sử dụng để đánh giá
sự khác biệt tương đối giữa kết quả gần đúng và kết quả
kết quả chính xác.

Đối với M' và M, = .


Machine Translated by Google

17
Chỉ số lỗi (tiếp theo)

Khoảng cách lỗi trung bình (MED) xem xét khoảng cách lỗi
trung bình cho nhiều đầu vào.

MED tăng theo cấp số nhân với số lượng xấp xỉ


bit trong một bộ cộng.

Khoảng cách lỗi trung bình chuẩn hóa (NMED) là chuẩn hóa
MED theo giá trị đầu ra tối đa.

NMED là một thước đo gần như bất biến, độc lập với kích thước của
một bộ cộng

Khoảng cách lỗi tương đối trung bình (MRED) đánh giá
khoảng cách lỗi tương đối trung bình cho nhiều đầu vào.

J. Liang, J. Han và F. Lombardi. Số liệu mới về độ tin cậy của các bộ cộng gần
đúng và xác suất. IEEE Trans. Máy tính, 62(9):1760-1771, 2013.
Machine Translated by Google

18
Kết quả mô phỏng của các bộ cộng gần đúng

• Bộ cộng 16-bit được mô phỏng cho tất

cả các thiết kế gần đúng.

• Sau tên của mỗi bộ cộng là giá trị của

tham số k.
• k là kích thước của bộ cộng phụ cho ACA,
ETAII, ESA, CSA, CSPA, CCA và GCSA.

• k là kích thước của bộ cộng ít quan trọng

hơn đối với LOA.

• 100.000.000 kết hợp đầu vào ngẫu nhiên

được mô phỏng bằng MATLAB.

MRED và NMED của các bộ cộng gần đúng, được sắp xếp theo MRED.

• NMED và MRED cũng có xu hướng tương tự. • ETAII, SCSA

và ACAA có cùng đặc điểm lỗi (ER, NMED và MRED) do có cùng chuỗi lan truyền mang cho mỗi bit tổng.
Machine Translated by Google

19
Đặc điểm lỗi của các bộ cộng gần đúng

• LOA có MRED khá nhỏ

nhưng ER rất lớn.


• CSA-5 và CSA-4 là nhiều nhất
chính xác.

• GCSA-5 và GCSA-4 là
chính xác thứ hai.

• Thông tin được sử dụng để dự đoán mỗi giá

trị trong ESA, CSPA và ACA khá hạn chế,

do đó MRED và ER của ESA là lớn nhất, tiếp


theo là CSPA và ACA khi xem xét cùng một

giá trị của k.

• CCA, ETAII, SCSA và ACAA cho thấy MRED và


ER ở mức vừa phải.
MRED và ER của các bộ cộng gần đúng, được sắp xếp theo ER.

H. Jiang, J. Han và F. Lombardi, Đánh giá so sánh và đánh giá các chất bổ sung gần đúng,
trong GLSVLSI'15, Pittsburgh, PA, Hoa Kỳ, 2015.
Machine Translated by Google

20
Đặc điểm mạch của các bộ cộng gần đúng

• Tất cả các bộ cộng và bộ cộng phụ trong

thiết kế gần đúng đều được triển khai

dưới dạng CLA.

• Được tổng hợp bởi Synopsys Design

Compiler dựa trên quy trình STM 28nm

với điện áp nguồn 1,0V ở nhiệt độ 25

oC.

Công suất và diện tích của các bộ cộng gần đúng, được sắp xếp theo công suất.

• Mạch có diện tích lớn hơn sẽ tiêu thụ nhiều điện năng hơn ngoại trừ CSA
với tản điện thấp nhưng diện tích lớn.

• Điều này là do đường tới hạn ngắn và sơ đồ lựa chọn mang nâng cao và do đó, hệ thống dây điện

phức tạp.
Machine Translated by Google

21
Đặc điểm mạch của các bộ cộng gần đúng
• Trong số ETAII, SCSA và ACAA (có cùng độ chính

xác), SCSA mặc dù nhanh nhất nhưng có diện

tích và công suất tiêu tán lớn nhất , còn

ACAA là chậm nhất vì đường tới hạn dài


(2k). ETAII có độ trễ ngắn hơn ACAA và tiêu

thụ ít năng lượng hơn cũng như yêu cầu

diện tích nhỏ hơn SCSA.

• CLA chính xác có độ trễ dài nhất nhưng không

có công suất tiêu tán cao nhất.

Sức mạnh và độ trễ của các bộ cộng gần đúng, được sắp xếp theo độ trễ. • LOA rất chậm nhưng lại tiết kiệm điện năng

và diện tích nhất.

• Ngoại trừ LOA và cùng k, ACA là nhanh nhất và gây lãng phí điện năng, ESA khá nhanh và tiết kiệm điện

năng cũng như diện tích, ACAA là chậm nhất và CCA là sơ đồ tiêu thụ điện năng và diện tích nhiều

nhất . • Cả CSPA và GCSA đều có mức tiêu

thụ điện năng vừa phải, nhưng CSPA nhanh hơn và


GCSA hiệu quả hơn về mặt diện tích.
Machine Translated by Google

Xem xét cả độ chính xác và phần cứng 22

ER và PDP của các bộ cộng gần đúng. MRED và PDP của các bộ cộng gần đúng.

• Đối với các bộ cộng có độ chính xác như nhau là ETAII, SCSA và ACAA thì ETAII có
PDP thấp nhất (trừ ETAII-6), trong khi SCSA có PDP cao

nhất. • CSA cho hiệu suất tốt nhất với PDP, ER và MRED rất nhỏ. • ESA

có PDP khá nhỏ nhưng ER và MRED lại lớn. • ACA có PDP rất nhỏ và ER

và MRED thấp hơn một chút so với ESA. • CCA có PDP lớn nhất và ER

và MRED vừa phải. • LOA cho thấy PDP nhỏ và MRED của nó

ở mức vừa phải nhưng có ER cao nhất.


Machine Translated by Google

23
Kết luận về các chất cộng gần đúng

Nói chung, các bộ cộng suy đoán gần đúng cho thấy độ chính
xác vừa phải và PDP tương đối nhỏ.

Các bộ cộng gần đúng sử dụng bộ cộng gần đúng đầy đủ trong
LSB chậm nhưng chúng tiết kiệm điện với ER cao (do LSB gần
đúng) và các giá trị NMED và MRED vừa phải do MSB chính
xác).
Lỗi và đặc tính mạch của bộ cộng chọn lọc phân đoạn và mang
thay đổi tùy theo dự đoán của tín hiệu mang.
Machine Translated by Google

Đề cương

Động cơ và giới thiệu

Xem xét và phân loại các chất cộng gần đúng

So sánh các bộ cộng gần đúng

Đặc điểm lỗi

Đặc tính mạch điện

Xem xét và phân loại các số nhân gần đúng

So sánh các số nhân gần đúng

Đặc điểm lỗi

Đặc tính mạch điện

Kết luận
Machine Translated by Google

24
Hệ số nhân: Cây Wallace

ℎ: (log( ))

Phép toán số học cơ bản của số nhân không dấu 4 x 4 bit


Machine Translated by Google

25
Hệ số nhân: Mảng cộng lưu trữ

ℎ: ( )

Cấu trúc tích lũy tích từng phần cho số nhân không dấu 4 x
4 bit sử dụng mảng bộ cộng nhớ mang
Machine Translated by Google

26
Số nhân gần đúng: Phân loại A

Chúng tôi phân loại các số nhân gần đúng thành bốn loại:

Xấp xỉ trong việc tạo ra các sản phẩm từng phần

Sử dụng cấu trúc đơn giản hơn để tạo ra các sản phẩm một phần.

Xấp xỉ trong cây tích từng phần

Bỏ qua một số tích một phần.


Chia tích từng phần thành nhiều phần và áp dụng phép tính gần đúng cho những
phần ít quan trọng hơn.

Sử dụng bộ đếm hoặc bộ nén gần đúng trong


Cây sản phẩm một phần

Bộ cộng, bộ đếm hoặc bộ nén gần đúng

Hệ số gian hàng gần đúng


Machine Translated by Google

27
Xấp xỉ trong việc tạo ra các sản phẩm một phần

Hệ số nhân được thiết kế không đầy đủ (UDM):

K-Map cho khối nhân 2 x 2 bit được thiết kế kém

1001

Bộ nhân 4 x 4 bit được xây dựng trên khối 2 x 2 bit.

P. Kulkarni, P. Gupta và M. Ercegovac, “Đánh đổi độ chính xác để lấy sức mạnh với một thiết bị được thiết kế kém

kiến trúc số nhân,” trong Kỷ yếu của Hội nghị Quốc tế IEEE lần thứ 24 về Thiết kế VLSI, 2011, trang 346–351.
Machine Translated by Google

28
Xấp xỉ trong cây tích từng phần (1)

Hệ số mảng bị hỏng (BAM):

Cấu trúc của hệ số Broken-Array.

HR Mahdiani, A. Ahmadi, SM Fakhraie và C. Lucas, “Các khối tính toán không chính xác lấy cảm hứng
từ sinh học để triển khai VLSI hiệu quả cho các ứng dụng máy tính mềm,” Giao dịch IEEE trên mạch
và hệ thống, tập. 57, không. 4, trang 850–862, tháng 4 năm 2010.
Machine Translated by Google

29
Xấp xỉ trong cây tích từng phần (2)

Hệ số chịu lỗi (ETM):

A0-A7 B0-B7

Khối điều khiển


P0-P15
Hệ số nhân 8 bit tiêu chuẩn
A8-A15 :
A0-A7 B0-B7

MUX
B8-B15 : Khối không nhân LSB P0-P15

P16-P31
Hệ số nhân 8 bit tiêu chuẩn

A8-A15 B8-B15

Kiến trúc của Hệ số nhân chịu lỗi 16 x 16 bit.

KY Kyaw, WL Goh và KS Yeo, “Bộ nhân tốc độ cao công suất thấp cho ứng dụng có khả năng
chịu lỗi,” trong Kỷ yếu của Hội nghị quốc tế về thiết bị điện tử và mạch thể rắn của IEEE
2010 (EDSSC), 2010, trang 1 -4.
Machine Translated by Google

30
Xấp xỉ trong cây tích từng phần (3)

Hệ số nhân cây Wallace gần đúng (AWTM):

Chính xác một phần

Sản phẩm

2b bit

AH BH AL BL

AH BH

Chính xác đến một


AH BL
Mức độ lớn

b bit

Sản phẩm cuối cùng (4b bit)

Kiến trúc của hệ số nhân cây Wallace gần đúng.

K. Bhardwaj, PS Mane và J. Henkel, “Hệ số nhân cây Wallace gần đúng hiệu quả về năng lượng và diện
tích cho các hệ thống chống lỗi,” trong Kỷ yếu của Hội nghị chuyên đề quốc tế lần thứ 15 về thiết kế điện
tử chất lượng. IEEE, tháng 3 năm 2014, trang 263–269.
Machine Translated by Google

31
Bộ đếm hoặc máy nén gần đúng (1)

Hệ số nhân dựa trên bộ đếm không chính xác (ICM):

K-Map cho bộ đếm 4:2 không chính xác cho hệ số nhân Wallace 4 x 4 bit

X1X2

CS 00 01 11 10

X3X4 00 00 01 10 01

01 01 10 11 10

11 10 11 100 10
11

10 01 10 11 10

Hệ số nhân lớn hơn được thực hiện bởi


hệ số nhân 4 x 4 bit không chính xác.

C.-H. Lin và I.-C. Lin, “Hệ số nhân gần đúng có độ chính xác cao với sửa lỗi,” trong Kỷ yếu của
Hội nghị Quốc tế IEEE lần thứ 31 về Thiết kế Máy tính (ICCD 2013). trang 33–38. Tháng 10 năm 2013.
Machine Translated by Google

32
Bộ đếm hoặc máy nén gần đúng (2)

Hệ số nhân dựa trên máy nén gần đúng (ACM):


X1 X2 X3 X4

gần đúng
cout Máy nén 4-2 Cin

X1 X2 X3 X4
Tổng cộng X1 X2 X3 X4

cout Adder đầy đủ

Thiết kế máy nén gần đúng 4-2 1


gần đúng
(AC1): thay đổi 12 trên 32 mục K-Map. Máy nén 4-2

Adder đầy đủ
Cin

Tổng cộng

Tổng cộng
Thiết kế máy nén gần đúng 4-2 2
Máy nén 4-2 chính xác.
(AC2): thay đổi 4 trong số 16 mục K-Map.

ACM-3: AC1 trong LSB và máy nén chính xác trong MSB trong hệ số nhân Dadda.
ACM-4: AC2 trong LSB và máy nén chính xác trong MSB trong hệ số nhân Dadda.

A. Momeni, J. Han, P. Montuschi và F. Lombardi, “Thiết kế và phân tích các máy nén gần
đúng để nhân,” Giao dịch IEEE trên máy tính, tập. 64, không. 4, trang 984–994, 2015.
Machine Translated by Google

33
Bộ đếm hoặc máy nén gần đúng (3)

Hệ số nhân gần đúng (AM) với hệ số một phần có thể định cấu hình
Phục hồi lỗi và cắt ngắn AM (TAM):

Ô cộng gần đúng.

• Hai cây tích lũy lỗi là

được thiết kế cho AM1 và AM2.


• Thu được TAM1 và TAM2

bằng cách cắt bớt một số LSB.

Hệ số nhân gần đúng với khả năng phục hồi lỗi 4 bit.

C. Liu, J. Han và F. Lombardi, “Hệ số nhân gần đúng công suất thấp, hiệu suất cao với khả năng
phục hồi lỗi một phần có thể định cấu hình,” DATE, 2014.
Machine Translated by Google

Kết quả mô phỏng của số nhân gần đúng 34

• Bộ nhân 16 x 16 bit được mô phỏng Tỷ lệ lỗi (%) NMED (log)

0
cho tất cả các thiết kế 200
-1
gần đúng. • Sau tên của mỗi số nhân
-2
là giá trị của tham số k.
150 -3

• k là số lượng MSB được sử dụng để giảm lỗi trong AM1,


-4
AM2, TAM1 và TAM2.
-5

(nhật
NMED
ký)
100

(%)
lỗi
lệ
Tỷ
• k là số LSB ở phần không chính xác của ETM. • k là -6

số chế độ trong AWTM và -7

50

ACM.
-số 8

• Đó là chiều dài gãy dọc của BAM. • -9

100.000.000 kết hợp đầu vào ngẫu nhiên được mô 0 -10

phỏng bằng MATLAB.

ER và NMED của các số nhân gần đúng, được sắp xếp theo NMED.

• ICM có ER rất thấp là 5,45%, vì nó chỉ sử dụng một bộ nén gần đúng trong
hệ số nhân phụ 4 × 4 bit với tỷ lệ lỗi chỉ 1/256. • Hầu hết các
thiết kế, đặc biệt là những thiết kế cắt cụt, đều có ER lớn (gần
100%).
Machine Translated by Google

Đặc điểm lỗi của số nhân gần đúng 35

MRED (log) NMED (log)

• ICM, AM2-15 và TAM2-16 có giá trị NMED

gần nhau, tuy nhiên ICM có MRED nhỏ


0 6
nhất trong khi MRED của TAM2-16 là lớn
-1
nhất. • Các số nhân bị cắt ngắn (TAM2-16
4
-2
và BAM-18) có xu hướng có
-3
2 MRED lớn hơn khi NMED tương tự nhau. •
-4
ACM-4, ACM-3 và AWTM-4 đạt được NMED
-5 0
rất thấp vì chỉ có LSB là gần đúng
(nhật

(nhật
MRED

NMED
ký)

ký)
-6 trong chúng. • ETM và
-2
-7
BAM có MRED tương đối lớn do bị cắt bớt.
-số 8

-4

-9

-10 -6

MRED và NMED của các số nhân gần đúng, được sắp xếp theo MRED.
Machine Translated by Google

Đặc tính mạch của các số nhân gần đúng (1)36

Công suất (uW) Diện tích (um²)

1000,0 0,0

• Các bộ nhân 16 x 16 bit được triển


900,0

khai trong VHDL cho tất cả các


800,0
500,0
thiết kế gần đúng.
700,0

600,0

1000,0

500,0

(um2 )
tích
Diện
(uW)
suất
Công
• Được tổng hợp bởi Synopsys Design
400,0
Compiler dựa trên quy trình STM
1500,0
300,0
28nm với điện áp nguồn 1,0V ở
200,0
nhiệt độ 25 oC.
100,0 2000,0

0,0

lũy thừa và diện tích của các số nhân gần đúng, được sắp xếp theo lũy thừa.

• Bộ nhân có diện tích lớn hơn sẽ tiêu thụ nhiều điện năng hơn.
Machine Translated by Google

Đặc điểm mạch của số nhân gần đúng (2) 37

Độ trễ (ns) Công suất (uW) • ArrayM là chậm nhất. • WallaceM


0,0
là thiết bị tiêu thụ điện năng nhiều nhất.
7 giờ 00

6 giờ 00
100,0 • AM1,TAM1,

AM2 và TAM2 có độ trễ nhỏ hơn ngay cả khi


200,0
5 giờ 00

giảm lỗi 16 bit. • BAM chậm đáng kể do


300,0
cấu trúc mảng của nó. • AWTM,
4 giờ 00

400,0
UDM, ICM và ACM có độ trễ lớn hơn các hệ
(ns)
trễ
Độ

(uW)
suất
Công
3,00

500,0 số nhân khác. • BAM tiêu

2,00 thụ điện năng rất thấp , mức tiêu thụ điện
600,0

năng của AWTM và ACM ở mức trung bình,


1,00
700,0
trong khi UDM và ICM lại

0,00 800,0 tiêu thụ điện năng tương đối cao .

Độ trễ và lũy thừa của các số nhân gần đúng, được sắp xếp theo độ trễ.

• ETM, TAM1/TAM2 và BAM nằm trong số


thiết kế tiết kiệm điện nhất .
• Cắt bớt là một phương pháp hữu ích để giảm sức mạnh
và khu vực.
Machine Translated by Google

Xem xét cả độ chính xác và phần cứng 38

• TAM1-13, TAM-16, TAM2-13 và BAM-18 có cả


PDP và MRED nhỏ • ICM và ACM có sai số

rất thấp nhưng PDP của chúng

rất cao. • BAM-22 có PDP nhỏ nhất nhưng

MRED lớn nhất. • ETM-8 có PDP nhỏ nhất

nhưng MRED
lớn đáng kể. • UDM cho thấy hiệu suất kém ở

cả PDP và MRED. • ETM có


PDP nhỏ và MRED tương đối lớn. • Hầu hết

các cấu hình BAM đều có PDP nhỏ, độ

trễ của chúng thường lớn.

MRED và PDP của các số nhân gần đúng.


Machine Translated by Google

39
Kết luận về số nhân gần đúng

Cắt bớt một phần sản phẩm từng phần là một phương pháp hiệu quả để tiết kiệm phần

cứng. Tuy nhiên, nó phát sinh ER lớn nhưng NMED và MRED vừa phải.

Các số nhân gần đúng được thực hiện bởi các số nhân phụ gần đúng
nhỏ hơn có thể có ER rất thấp (ví dụ: UDM và AWTM-3), nhưng
NMED và MRED của chúng thường lớn do sai số lớn có thể xảy ra
ở phần quan trọng hơn của số nhân. Hơn nữa, họ thường có PDP
khá cao.
Machine Translated by Google

Người giới thiệu


40

[1] Jie Han và Michael Orshansky. Máy tính gần đúng: Một mô hình mới nổi cho thiết kế tiết kiệm năng lượng.
Tại ETS, Avignon, Pháp, tháng 5 năm 2013.

[2] Thạch Liên Lữ. Tăng tốc độ xử lý với các mạch gần đúng. Máy tính, 37(3):67–73, 2004.

[3] Ajay K Verma, Philip Brisk và Paolo Ienne. Bổ sung suy đoán có độ trễ thay đổi: Một mô hình mới cho thiết
kế mạch số học. DỮ LIỆU, trang 1250–1255, 2008.

[4] D. Mohapatra, VK Chippa, A Raghunathan và K. Roy. Thiết kế các hàm meta có khả năng mở rộng điện áp để tính
toán gần đúng. Trong DATE, trang 1–6, tháng 3 năm 2011.

[5] Ning Zhu, Wang Ling Goh và Kiat Seng Yeo. Bộ cộng tốc độ cao công suất thấp được cải tiến dành cho ứng
dụng có khả năng chịu lỗi. Trong ISIC, trang 69–72, 2009.

[6] Andrew B Kahng và Seokhyeong Kang. Bộ cộng có thể định cấu hình chính xác cho các thiết kế số học gần đúng. Trong Kỷ yếu của

Hội nghị Tự động hóa Thiết kế Thường niên ACM lần thứ 49, trang 820–825, 2012.

[7] Kai Du, P. Varman và K. Mohanram. Hiệu suất cao, độ trễ thay đổi đáng tin cậy mang theo lựa chọn bổ sung.
Trong DATE, trang 1257–1262, tháng 3 năm 2012.

[8] Yongtae Kim, Yong Zhang và Peng Li. Một bộ cộng gần đúng tiết kiệm năng lượng với tính năng bỏ qua cho các
hệ thống vlsi thần kinh có khả năng phục hồi lỗi. Trong ICCAD, trang 130–137, 2013.

[9] Rong Ye, Ting Wang, Feng Yuan, Rakesh Kumar và Qiang Xu. Về thiết kế bộ cộng gần đúng định hướng cấu hình
lại và ứng dụng của nó. Trong ICCAD, trang 48–54, 2013.

[10] IngChao Lin, YiMing Yang và ChengChian Lin. Hiệu suất cao, công suất thấp mang theo sự bổ sung mang tính
suy đoán với độ trễ thay đổi. IEEE Trans. Hệ thống VLSI, trên báo chí, 2014.

[11] Lý Lệ và Hải Châu. Về mô hình lỗi và phân tích các bộ cộng gần đúng. Trong ICCAD, trang 511–518, 2014.
Machine Translated by Google

Người giới thiệu


41

[12] Junjun Hu và Weikang Qian. Một bộ cộng gần đúng mới có sai số tương đối thấp và phép tính dấu đúng.
Vào NGÀY, 2015.

[13] Jin Miao, Ku He, Andreas Gerstlauer và Michael Orshansky. Mô hình hóa và tổng hợp các bộ cộng gần
đúng tối ưu chất lượng-năng lượng. Trong Kỷ yếu của Hội nghị Quốc tế ACM về Thiết kế có sự hỗ trợ của
Máy tính, trang 728–735, 2012.

[14] HR Mahdiani, A Ahmadi, SM Fakhraie và C Lucas. Các khối tính toán không chính xác lấy cảm hứng từ
sinh học để triển khai VLSI hiệu quả cho các ứng dụng điện toán mềm. IEEE Trans. Mạch và Hệ thống,
57(4):850–862, tháng 4 năm 2010.

[15] V. Gupta, D. Mohapatra, A. Raghunathan, và K. Roy. Xử lý tín hiệu số công suất thấp bằng cách sử
dụng các bộ cộng gần đúng. Giao dịch của IEEE về thiết kế hệ thống và mạch tích hợp có sự hỗ trợ của máy
tính, 32(1):124–137, tháng 1 năm 2013.

[16] Zhixi Yang, Ajaypat Jain, Jinghang Liang, Jie Han và Fabrizio Lombardi. Các bộ cộng dựa trên XOR/XNOR
gần đúng để tính toán không chính xác. Trong Kỷ yếu của Hội nghị Quốc tế về Công nghệ Nano của IEEE, Bắc
Kinh, Trung Quốc, tháng 8 năm 2013.

[17] Honglan Jiang, Jie Han, và Fabrizio Lombardi. Một đánh giá so sánh và đánh giá các bộ cộng gần đúng.
Trong Kỷ yếu Hội nghị chuyên đề ACM Great Lakes về VLSI, 2015.

[18] Parag Kulkarni, Puneet Gupta và Milos Ercegovac. Trao đổi độ chính xác để lấy sức mạnh với kiến trúc
hệ số nhân được thiết kế kém. Trong Kỷ yếu của Hội nghị Quốc tế IEEE lần thứ 24 về Thiết kế VLSI, trang
346–351, 2011.

[19] Khaing Yin Kyaw, Wang Ling Goh và Kiat Seng Yeo. Bộ nhân tốc độ cao, công suất thấp dành cho ứng
dụng có khả năng chịu lỗi. Trong EDSSC, trang 1–4, 2010.
Machine Translated by Google

Người giới thiệu


42

[20] Kartikeya Bhardwaj, Pravin S. Mane và Jorg Henkel. Hệ số nhân cây Wallace gần đúng tiết kiệm năng lượng và
tiết kiệm diện tích cho các hệ thống có khả năng phục hồi lỗi. Trong Kỷ yếu của Hội nghị chuyên đề quốc tế lần thứ
15 về thiết kế điện tử chất lượng, trang 263–269. IEEE, tháng 3 năm 2014.

[21] Chia-Hao Lin và Ing-Chao Lin. Hệ số nhân gần đúng có độ chính xác cao với khả năng sửa lỗi. Trong ICCD, trang
33–38. IEEE, tháng 10 năm 2013.

[22] Jieming Ma, Ka Lok Man, Nan Zhang, Sheng-Uei Guan và Taikyeong Ted Jeong. Thiết kế hệ số nhân nhận biết năng
lượng và tiết kiệm diện tích tốc độ cao bằng cách sử dụng máy nén gần đúng cùng với cấu trúc liên kết cây từ
dưới lên. Trong ICMV. Hiệp hội Quang học và Quang tử Quốc tế, 2013.

[23] Amir Momeni, Jie Han, Paolo Montuschi và Fabrizio Lombardi. Thiết kế và phân tích các máy nén gần đúng cho
phép nhân. IEEE Trans. Máy tính, PP(99):1–1, 2014.

[24] Cong Liu, Jie Han, và Fabrizio Lombardi. Hệ số nhân gần đúng công suất thấp, hiệu suất cao với khả năng phục
hồi lỗi một phần có thể định cấu hình. Vào NGÀY, 2014.

[25] Cho Kyung-Ju, Kwang-Chul Lee, Jin-Gyun Chung và Keshab K Parhi. Thiết kế hệ số gian hàng sửa đổi chiều rộng cố
định có sai số thấp . IEEE Trans. Hệ thống VLSI, 12(5):522–531, 2004.

[26] SONG Min-An, VAN Lan-Da, và KUO Sy-Yen. Hệ số nhân gian hàng có chiều rộng cố định thích ứng với sai số thấp.
Giao dịch IEICE về Nguyên tắc cơ bản của Điện tử, Truyền thông và Khoa học Máy tính, 90(6):1180–1187, 2007.

[27] Jiun-Ping Wang, Shiann-Rong Kuang, và Shish-Chang Liang. Hệ số nhân gian hàng được sửa đổi có chiều rộng cố
định có độ chính xác cao dành cho các ứng dụng có tổn thất. IEEE Trans. Hệ thống VLSI, 19(1):52–60, 2011.

[28] Yuan-Ho Chen và Tsin-Yuan Chang. Công cụ ước tính xác suất có điều kiện thích ứng có độ chính xác cao cho hệ số nhân

gian hàng có chiều rộng cố định. IEEE Trans. Mạch và Hệ thống I: Bài báo thường xuyên, 59(3):594–603, 2012.
Machine Translated by Google

Người giới thiệu


43

[29] Honglan Jiang, Jie Han, và Fabrizio Lombardi. Hệ số nhân cơ số gần đúng-8 cho hoạt động ở mức
năng lượng thấp. Để xuất hiện trong IEEE Trans. Máy tính.

[30] Farzad Farshchi, Muhammad Saeed Abrishami, và Sied Mehdi Fakhraie. Ước tính mới
hệ số nhân để xử lý tín hiệu số công suất thấp. Trong CADS, trang 25–30. IEEE, tháng 10 năm 2013.

[31] Jinghang Liang, Jie Han, và F. Lombardi. Số liệu mới về độ tin cậy của ước lượng và
các phép cộng xác suất. IEEE Trans. Máy tính, 62(9):1760–1771, 2013.
Machine Translated by Google

Cảm ơn đã quan tâm.


Câu hỏi?

You might also like