Professional Documents
Culture Documents
บทที่ 5 การออกแบบหน่วยประมวลผล (Processor Design)
บทที่ 5 การออกแบบหน่วยประมวลผล (Processor Design)
การออกแบบหนวยประมวลผล
(Processor Design)
อ.สรพรรค ภักดีศรี
คพ320:โครงสรางและสถาปตยกรรมคอมพิวเตอร บทที่ 5 การออกแบบหน่ วยประมวลผล (Processor Design)
1
วัตถุประสงค
5.1. เพื่อใหเขาใจความหมายของหน-วยประมวลผล
5.2. เพื่อใหเขาใจองคประกอบของหน-วยประมวลผล
5.3. เพื่อใหเขาใจสถาปตยกรรมของหน-วยประมวลผล
5.4. ตัวอย-างสถาปตยกรรมของหน-วยประมวลผล
5.5. เพื่อใหเขาใจการวัดสมรรถนะหน-วยประมวลผล
Memory Unit
Memory Unit
1 ตัว
– รีจิสเตอรแสดงสถานะหรือผลลัพธการประมวลผล (Status register) ขนาด
ที่มา: https://en.wikipedia.org/wiki/Intel_Core_(microarchitecture)
อินเทล ไฮเปอรเทรดดิ้ง (Hyper Threading(Video))
Thread2 Thread1 R2
R3
R1
R2
Without HT
R3
หน-วยความจํา
หน-วยประมวลผล
VM VM VM VM
Application OS Application OS Application OS Application OS
Driver A Buffer Driver A Buffer Driver A Buffer Driver A Buffer
VMM VMM
Virtual Device Emulation
Intel SSE (1999) Intel SSE 2(2000) Intel SSE3 (2004) Intel SSSE (2006) Intel SSE 4(2007)
Core0
Core1
Core2
Core3
Core0
Core1
Core2
Core3
Core0
Core1
Core2
Core3
ทุกคอร์ ทํางานทีความถีเท่ากัน ทุกคอร์ ทํางานทีความถีเท่ากันแบบเทอร์ โบเมือ บางคอร์ ทํางานทีความถีสูงเมือต้ องการพลังใน
ต้ องการพลังในการประมวลผลสูง การประมวลผลสูง
Intel Core i7-980x (Gulftown 6c/12t) 3.33 GHz (Turbo 3.6 GHz), DDR3-1066, 1.5 MB L2, 12
MB L3 108
Intel Core i7-4790 (Haswell 4c/8t) 3.6 GHz (Turbo 4 GHz), DDR3-1600, 1 MB L2, 8 MB L3
102
AMD FX-8350 (Vishera 8c/8t) 4 GHz (Turbo 4.2 GHz), DDR3-1866, 8 MB L2, 8 MB L3
คพ320:โครงสรางและสถาปตยกรรมคอมพิวเตอร บทที่ 5 การออกแบบหน่ วยประมวลผล (Processor Design) 72.73
ที่มา: http://www.tomshardware.com/charts/cpu-charts-2015/-04-SiSoftware-Sandra-2015,3696.html
5.5. การวัดสมรรถนะของหน-วยประมวลผล
ผลการวัดสมรรถนะดาน จํานวนคําสั่งทศนิยมที่ประมวลผลไดต-อหนึ่งวินาที (GLOPS) ดวย
โปรแกรม Linpack ของซูเปอรคอมพิวเตอร (มิถุนายน 2558)
RMAX RPEAK
RANK SITE SYSTEM CORES (TFLOP/S) (TFLOP/S)
1
National Super Computer Center in Tianhe-2 (MilkyWay-2) - TH-IVB-FEP Cluster, Intel Xeon E5-2692 12C
Guangzhou 2.200GHz, TH Express-2, Intel Xeon Phi 31S1P 3,120,000 33,862.70 54,902.40
China NUDT
2 DOE/SC/Oak Ridge National Titan - Cray XK7 , Opteron 6274 16C 2.200GHz, Cray Gemini
Laboratory interconnect, NVIDIA K20x 560,640 17,590.00 27,112.50
United States Cray Inc.
3
DOE/NNSA/LLNL Sequoia - BlueGene/Q, Power BQC 16C 1.60 GHz, Custom
1,572,864 17,173.20 20,132.70
United States IBM
4 RIKEN Advanced Institute for
K computer, SPARC64 VIIIfx 2.0GHz, Tofu interconnect
Computational Science (AICS) 705,024 10,510.00 11,280.40
Japan Fujitsu
5 DOE/SC/Argonne National
Mira - BlueGene/Q, Power BQC 16C 1.60GHz, Custom
Laboratory 786,432 8,586.60 10,066.30
United States IBM
6 Swiss National Supercomputing Piz Daint - Cray XC30, Xeon E5-2670 8C 2.600GHz, Aries interconnect ,
Centre (CSCS) NVIDIA K20x 115,984 6,271.00 7,788.90
คพ320:โครงสรางและสถาปตยกรรมคอมพิวเตอร บทที่ 5 การออกแบบหน่ วยประมวลผล (Processor Design)
Switzerland Cray Inc.
ที่มา:http://top500.org/lists/2015/06/
5.5. การวัดสมรรถนะของหน-วยประมวลผล
• โปรแกรมวัดสมรรถนะ (Software Benchmark) (Video Intel vs AMD Benchmarking)
ตัวอย-างเช-น
Sisoft Sandra, PC Marks, 3D Marks, XVid, DivX, Microsoft Office, Linpack เป;นตน