Download as pdf or txt
Download as pdf or txt
You are on page 1of 53

Reliable and Energy Efficient Streaming

Multiprocessor Systems 1st Edition


Anup Kumar Das
Visit to download the full and correct content document:
https://textbookfull.com/product/reliable-and-energy-efficient-streaming-multiprocesso
r-systems-1st-edition-anup-kumar-das/
More products digital (pdf, epub, mobi) instant
download maybe you interests ...

Energy Efficient Computing Electronics Devices to


Systems Devices Circuits and Systems 1st Edition
Santosh K. Kurinec

https://textbookfull.com/product/energy-efficient-computing-
electronics-devices-to-systems-devices-circuits-and-systems-1st-
edition-santosh-k-kurinec/

Intelligent Paradigms for Smart Grid and Renewable


Energy Systems B. Vinoth Kumar

https://textbookfull.com/product/intelligent-paradigms-for-smart-
grid-and-renewable-energy-systems-b-vinoth-kumar/

Energy-efficient wireless sensor networks 1st Edition


Vidushi Sharma

https://textbookfull.com/product/energy-efficient-wireless-
sensor-networks-1st-edition-vidushi-sharma/

Machine Learning Algorithms for Industrial Applications


Santosh Kumar Das

https://textbookfull.com/product/machine-learning-algorithms-for-
industrial-applications-santosh-kumar-das/
Power Devices for Efficient Energy Conversion 1st
Edition Gourab Majumdar

https://textbookfull.com/product/power-devices-for-efficient-
energy-conversion-1st-edition-gourab-majumdar/

Introduction to energy technologies for efficient power


generation 1st Edition Dimitrov

https://textbookfull.com/product/introduction-to-energy-
technologies-for-efficient-power-generation-1st-edition-dimitrov/

Nanomagnetic and spintronic devices for energy-


efficient memory and computing 1st Edition Jayasimha
Atulasimha

https://textbookfull.com/product/nanomagnetic-and-spintronic-
devices-for-energy-efficient-memory-and-computing-1st-edition-
jayasimha-atulasimha/

Energy-Efficient Smart Temperature Sensors in CMOS


Technology 1st Edition Kamran Souri

https://textbookfull.com/product/energy-efficient-smart-
temperature-sensors-in-cmos-technology-1st-edition-kamran-souri/

Sustainable and Energy Efficient Computing Paradigms


for Society Mohd Abdul Ahad

https://textbookfull.com/product/sustainable-and-energy-
efficient-computing-paradigms-for-society-mohd-abdul-ahad/
Embedded Systems

Anup Kumar Das


Akash Kumar
Bharadwaj Veeravalli
Francky Catthoor

Reliable and
Energy Efficient
Streaming
Multiprocessor
Systems
Embedded Systems

Series editors
Nikil D. Dutt, Irvine, CA, USA
Grant Martin, Santa Clara, CA, USA
Peter Marwedel, Dortmund, Germany
This Series addresses current and future challenges pertaining to embedded
hardware, software, specifications and techniques. Titles in the Series cover a
focused set of embedded topics relating to traditional computing devices as well
as high-tech appliances used in newer, personal devices, and related topics. The
material will vary by topic but in general most volumes will include fundamental
material (when appropriate), methods, designs and techniques.

More information about this series at http://www.springer.com/series/8563


Anup Kumar Das • Akash Kumar
Bharadwaj Veeravalli • Francky Catthoor

Reliable and Energy Efficient


Streaming Multiprocessor
Systems

123
Anup Kumar Das Akash Kumar
Electrical and Computer Chair for Processor Design
Engineering Department Dresden University of Technology
Drexel University, Bossone Research Dresden, Germany
Enterprise Center
Philadelphia, PA, USA Francky Catthoor
IMEC
Bharadwaj Veeravalli Heverlee, Belgium
Department of ECE
National University of Singapore
Singapore, Singapore

ISSN 2193-0155 ISSN 2193-0163 (electronic)


Embedded Systems
ISBN 978-3-319-69373-6 ISBN 978-3-319-69374-3 (eBook)
https://doi.org/10.1007/978-3-319-69374-3

Library of Congress Control Number: 2017956340

© Springer International Publishing AG 2018


This work is subject to copyright. All rights are reserved by the Publisher, whether the whole or part of
the material is concerned, specifically the rights of translation, reprinting, reuse of illustrations, recitation,
broadcasting, reproduction on microfilms or in any other physical way, and transmission or information
storage and retrieval, electronic adaptation, computer software, or by similar or dissimilar methodology
now known or hereafter developed.
The use of general descriptive names, registered names, trademarks, service marks, etc. in this publication
does not imply, even in the absence of a specific statement, that such names are exempt from the relevant
protective laws and regulations and therefore free for general use.
The publisher, the authors and the editors are safe to assume that the advice and information in this book
are believed to be true and accurate at the date of publication. Neither the publisher nor the authors or
the editors give a warranty, express or implied, with respect to the material contained herein or for any
errors or omissions that may have been made. The publisher remains neutral with regard to jurisdictional
claims in published maps and institutional affiliations.

Printed on acid-free paper

This Springer imprint is published by Springer Nature


The registered company is Springer International Publishing AG
The registered company address is: Gewerbestrasse 11, 6330 Cham, Switzerland
This book is dedicated to those who continue
the pursuit of knowledge, despite the
obstacles life presents. You hold the key to
our future. May God bless you with
determination on your journey. Never let
those doubts or negativity ruin your spirit.
Be steadfast in your quest for knowledge.
God Bless.
Preface

As the performance demands of applications (e.g., multimedia) are growing,


multiple processing cores are integrated together to form multiprocessor systems.
Energy minimization is a primary optimization objective for these systems. An
emerging concern for designs at deep-submicron technology nodes (65 nm and
below) is the lifetime reliability, as escalating power density and hence temperature
variation continues to accelerate wear-out leading to a growing prominence of
device defects. As such, reliability and energy need to be incorporated in the
multiprocessor design methodology, addressing two key aspects:
• lifetime amelioration, i.e., improving the lifetime reliability through energy- and
performance-aware intelligent task mapping
• graceful degradation, i.e., determining the task mapping for different fault-
scenarios while minimizing the energy consumption and providing a graceful
performance degradation
In this book, a platform-based design methodology is first proposed to minimize
temperature-related wear-outs. Fundamental to this methodology is a temperature
model that predicts the temperature of a core incorporating not only its dependency
on the voltage and frequency of operation (temporal effect), but also its dependency
on the temperature of the surrounding cores (spatial effect). The proposed temper-
ature model is integrated in a gradient-based fast heuristic that controls the voltage
and frequency of the cores to limit the average and peak temperature leading to a
longer lifetime, simultaneously minimizing the energy consumption.
A design flow is then proposed as a part of the hardware-software co-design
methodology to determine the minimum number of cores and the size of the FPGA
fabric of a reconfigurable multiprocessor system. The objective is to maximize the
lifetime reliability of the cores while satisfying a given area, performance, and
energy budget. The proposed flow incorporates individual as well as concurrent
applications with different performance requirements and thermal behaviors. While
the existing studies determine platform architecture for energy and area minimiza-
tion, this is the first approach for reconfigurable multiprocessor system design
considering lifetime reliability together with multi-application use-cases.

vii
viii Preface

To provide graceful performance degradation in the presence of faults, a reactive


fault-tolerance technique is also proposed that explores different task mapping
alternatives to minimize energy consumption while guaranteeing throughput for
all processor fault-scenarios. Directed acyclic graphs (DAGs) and synchronous
data flow graphs (SDFGs) are used to model applications making the proposed
methodology applicable to streaming multimedia and non-multimedia applications.
Fundamental to this approach is a novel scheduling algorithm based on self-
timed execution, which minimizes both the schedule storage overhead and run-time
schedule construction overhead. Unlike the existing approaches which consider task
mapping only, the proposed technique considers task mapping and scheduling in an
integrated manner, achieving significant improvement with respect to these state-of-
the-art approaches.
Finally, an adaptive run-time manager is designed for lifetime amelioration
of multiprocessor systems by managing thermal variations, both within (intra)
and across (inter) applications. Core to this approach is a reinforcement learning
algorithm, which interfaces with the on-board thermal sensors and controls the
voltage and frequency of operation and the thread-to-core affinity over time. This
approach is built on top of the design-time analysis to minimize learning time,
address run-time variability, and support new applications, making the overall book
objective to provide a complete and systematic design solution for reliable and
energy-efficient multiprocessor systems.

Texas, United States Anup Kumar Das


Dresden, Germany Akash Kumar
Singapore, Singapore Bharadwaj Veeravalli
Heverlee, Belgium Francky Catthoor
Contents

1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1 Trends in Multiprocessor Systems Design . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1.1 Trends in Transistor Scaling. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1.2 Trends in Microprocessor Design . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.1.3 Trends in Multiprocessor Systems . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2 Multiprocessor System Classification . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.2.1 Memory-Based Classification . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.2.2 Processor-Based Classification . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.3 Multiprocessor System Design Flow . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.3.1 Platform-Based Design . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.3.2 Hardware–Software Co-design . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.4 Design Challenges for Multiprocessor Systems . . . . . . . . . . . . . . . . . . . . . . . 11
1.4.1 Energy Concern for Multiprocessor Systems . . . . . . . . . . . . . . . . . 11
1.4.2 Reliability Concern for Multiprocessor Systems . . . . . . . . . . . . . . 12
1.5 Reliable and Energy Efficient Multiprocessor Design . . . . . . . . . . . . . . . . 13
1.5.1 Design-Time Methodology . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.5.2 Run-Time Methodology . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.6 Key Highlights of This Book . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
References . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2 Operational Semantics of Application and Reliability Model . . . . . . . . . . 23
2.1 Application Model as Synchronous Data Flow Graphs . . . . . . . . . . . . . . . 23
2.2 Wear-Out Related Reliability Model . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.2.1 Device-Level Reliability Modeling . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.2.2 Core-Level Reliability Modeling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.2.3 System-Level Reliability Modeling . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
References . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

ix
x Contents

3 Literature Survey on System-Level Optimizations Techniques . . . . . . . . . 33


3.1 Design-Time Based Reliability and Energy Optimization . . . . . . . . . . . . 33
3.1.1 Task Mapping Approaches for Platform-Based Design. . . . . . . 33
3.1.2 Existing Approaches on Hardware–Software Co-design . . . . . 36
3.1.3 Existing Approaches on Reactive Fault-Tolerance . . . . . . . . . . . . 36
3.2 Run-Time Based Reliability and Energy Optimization . . . . . . . . . . . . . . . 38
References . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
4 Reliability and Energy-Aware Platform-Based Multiprocessor
Design . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
4.2 Problem Formulation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
4.2.1 Application Model . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
4.2.2 Architecture Model . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
4.2.3 Mapping Representation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
4.2.4 MTTF Computation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
4.2.5 Energy Computation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
4.2.6 Reliability-Energy Joint Metric . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
4.3 Proposed Temperature Model . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
4.4 Computing Temperature from a Schedule . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
4.5 Design Methodology . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
4.5.1 Reliability Optimization for Individual Application . . . . . . . . . . 59
4.5.2 Reliability Optimization for Use-Cases. . . . . . . . . . . . . . . . . . . . . . . . 60
4.6 Experiments and Discussions. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
4.6.1 Time Complexity . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
4.6.2 Validation of the Temperature Model . . . . . . . . . . . . . . . . . . . . . . . . . . 64
4.6.3 Comparison with Accurate Temperature Model . . . . . . . . . . . . . . 65
4.6.4 Impact of Temperature Misprediction . . . . . . . . . . . . . . . . . . . . . . . . . 66
4.6.5 MTTF Improvement Considering Task Remapping . . . . . . . . . . 67
4.6.6 Reliability and Energy Improvement . . . . . . . . . . . . . . . . . . . . . . . . . . 70
4.6.7 Use-Case Optimization Results . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
4.7 Remarks . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
References . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
5 Reliability and Energy-Aware Co-design of Multiprocessor Systems . . 75
5.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
5.2 Reliability-Aware Hardware–Software Task Partitioning . . . . . . . . . . . . . 77
5.2.1 Application and Architecture Model. . . . . . . . . . . . . . . . . . . . . . . . . . . 78
5.2.2 Reliability Modeling Considering Single Actor . . . . . . . . . . . . . . . 80
5.2.3 Reliability Modeling with Multiple Interconnected Actors. . . 82
5.2.4 Lifetime Reliability and Transient Fault Reliability
Trade-Off . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
5.2.5 Hardware–Software Partitioning Flow. . . . . . . . . . . . . . . . . . . . . . . . . 85
Contents xi

5.3 Reliability-Aware Co-design . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87


5.3.1 Design Metrics . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
5.3.2 Reliability-Resource Usage Trade-Off. . . . . . . . . . . . . . . . . . . . . . . . . 89
5.3.3 ILP-Based Pareto Merging . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
5.4 Results and Discussions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
5.4.1 Algorithm Complexity. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
5.4.2 Reliability Trade-Off Results. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
5.4.3 MTTF Results with Varying MTBF Constraint . . . . . . . . . . . . . . . 95
5.4.4 Reliability and Reconfigurable Area Trade-Off . . . . . . . . . . . . . . . 96
5.4.5 Hardware–Software Co-design Results . . . . . . . . . . . . . . . . . . . . . . . . 97
5.5 Remarks . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
References . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
6 Design-Time Analysis for Fault-Tolerance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
6.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
6.2 Problem Formulation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
6.2.1 Application and Architecture Model. . . . . . . . . . . . . . . . . . . . . . . . . . . 104
6.2.2 Mapping Representation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
6.2.3 Mapping Encoding. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
6.2.4 Energy Modeling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
6.3 Design Methodology . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
6.4 Fault-Tolerant Mapping Generation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
6.4.1 Minimum Energy Mapping Generation . . . . . . . . . . . . . . . . . . . . . . . 108
6.4.2 Minimum Energy Actor Remapping. . . . . . . . . . . . . . . . . . . . . . . . . . . 109
6.4.3 Initial Mapping Generation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
6.5 Fault-Tolerant Scheduling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
6.6 Results . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
6.6.1 Algorithmic Complexity Analysis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
6.6.2 Performance of Initial Mapping Selection Algorithm . . . . . . . . 116
6.6.3 Improvement of Energy Consumption . . . . . . . . . . . . . . . . . . . . . . . . . 117
6.6.4 Improvement of Migration Overhead . . . . . . . . . . . . . . . . . . . . . . . . . . 119
6.6.5 Improvement of Throughput . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
6.6.6 Performance of Our Proposed Scheduling Technique . . . . . . . . 121
6.7 Remarks . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
References . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
7 Run-Time Adaptations for Lifetime Improvement . . . . . . . . . . . . . . . . . . . . . . 127
7.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
7.2 Proposed Thermal Management Approach . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
7.3 Q-Learning Implementation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
7.3.1 General Overview. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
7.3.2 Determine State . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
7.3.3 Action Space of the Q-Learning Algorithm . . . . . . . . . . . . . . . . . . . 132
xii Contents

7.3.4
Q-Learning Algorithm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
7.3.5
Detection of Intra- and Inter-Application Thermal
Variations. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
7.4 Results . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
7.4.1 Intra-Application. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
7.4.2 Inter-Application . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
7.4.3 Convergence of Q-Learning Algorithm. . . . . . . . . . . . . . . . . . . . . . . . 138
7.4.4 Execution Time of the Proposed Approach . . . . . . . . . . . . . . . . . . . 139
7.4.5 Power Consumption of the Proposed Approach . . . . . . . . . . . . . . 140
7.5 Remarks . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
References . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
8 Conclusions and Future Directions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
8.1 Near and Far Future Challenges . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144
8.1.1 Future Challenges for Design-Time Analysis . . . . . . . . . . . . . . . . . 145
8.1.2 Future Challenges for Run-Time Analysis . . . . . . . . . . . . . . . . . . . . 146
Acronyms

ALU Arithmetic logic unit


ASIC Application-specific integrated circuit
CMOS Complementary metal-oxide-semiconductor
DAG Directed acyclic graph
DMR Double modular redundancy
DSE Design space exploration
DVFS Dynamic voltage and frequency scaling
EM Electromigration
FET Field effect transistor
FFT Fast Fourier transform
FPGA Field programmable gate array
HCI Hot carrier injection
HSDFG Homogeneous synchronous data flow graph
ILP Integer linear programming
ISA Instruction set architecture
ITRS International technology roadmap for semiconductors
JPEG Joint photographic experts group
MOSFET Metal-oxide-semiconductor field-effect transistor
MP3 MPEG-1 or MPEG-2 audio layer III
MPSoC Multiprocessor system-on-chip
MPEG Moving picture experts group
MTBF Mean-time-between-failures
MTTF Mean-time-to-failure
NBTI Negative-bias temperature instability
NMOS n-channel MOSFET
NoC Network-on-chip
NRE Non-recurrent engineering
NUMA Non-uniform memory access
PMOS p-channel MOSFET
PVT Process, voltage, temperature
QPI Quick-path interconnect

xiii
xiv Acronyms

RTL Register transfer language


SDFG Synchronous data flow graph
SoC System-on-chip
TDDB Time-dependent gate oxide breakdown
TMR Triple modular redundancy
TTFF Time-to-first-failure
Chapter 1
Introduction

1.1 Trends in Multiprocessor Systems Design

Multiprocessor systems have evolved over the past decades, triggered by inno-
vations in transistor scaling and integration, multiprocessor design and system
integration. This section summarizes these trends.

1.1.1 Trends in Transistor Scaling

Technology scaling principles introduced in 1974 [21] have revolutionized the semi-
conductor industry, providing a roadmap for systematic and predictable improve-
ment in transistor density, switching speed, and power dissipation, with scaled
transistor feature size.p
Ever since these principles were introduced, transistor feature
size has reduced by 2 approximately every 18 months, starting from a CMOS
gate length of 1 mm in 1974 [21] to commercial 22 nm designs available as early
as in 2012 [32]. Current technological breakthroughs have resulted in successful
test designs being synthesized even at 7 nm [48]. Many technology barriers were
perceived along this path and scientists responded with innovations to circumvent,
surmount, and tunnel through these challenges. Some of these innovations include
the use of Strained-Silicon for 90 nm CMOS [23], High-/Metal Gate for 32 nm
CMOS [43], and the Tri-Gate technology for 22 nm CMOS [32]. However, post
22 nm CMOS gate length offered severe challenges to the designers due to
pronounced transistor short-channel effects, threatening the decline of Denned’s
Scaling principles and confounding the International Technology Roadmap for
Semiconductors (ITRS) [30]. New research directions were sought and FinFET
technology was adopted due to its superior short channel effects, achieving a gate

© Springer International Publishing AG 2018 1


A.K. Das et al., Reliable and Energy Efficient Streaming Multiprocessor Systems,
Embedded Systems, https://doi.org/10.1007/978-3-319-69374-3_1
2 1 Introduction

length as low as 7 nm in 2013 [26, 48]. Alongside technology scaling, transistor


integration capacity doubled during this time, enabling semiconductor vendors to
pack millions of logic gates per chip.

1.1.2 Trends in Microprocessor Design

Transistor scaling has also led to the evolution of microprocessor technology since
the first microprocessor was introduced in 1971 by Intel. This microprocessor used
2300 transistors and was based on 4-bit computations. Shortly afterwards, Intel
developed the 8-bit microprocessor family—8008 and 8080 in 1972 and 1974,
respectively. Thereafter, the microprocessor technology advanced to 16-bit (Intel
8086 in 1978), 32-bit (Intel 80386 in 1985), and finally to the Pentium series
starting from 1993. Although microprocessor technology was pioneered by Intel, the
journey saw several other key players such as Apple, AMD, and ARM among others,
entering into the microprocessor market. Each generation of processor grew smaller
and faster. This growth was guided mainly by the observation of Gordon Moore
(co-founder of Intel), also known as Moore’s Law, that computer performance will
double every 18 months. Moore’s Law together with Dennard’s scaling principles
enabled building faster and sophisticated microprocessors.
Figure 1.1 shows the trend in microprocessor development (source: Intel [63]).
Throughout the 1990s and early 2000, microprocessor performance was synony-
mous with its operating frequency; higher frequency implied higher performance.
This notion of performance was soon challenged and expanded to consider other
key aspects, such as temperature, power dissipation, and energy consumption. In
perspective of these new metrics, performance was predicted to deviate signif-

Fig. 1.1 Trend in 10000 100


frequency
microprocessor development
gate delay / clock
(source: Intel [63]) Pentium 4
®
Gate delays per clock

®
Pentium III
Frequency [MHz]

1000
®
Pentium II
10
®
Pentium Pro
100
486 ®
386 Pentium

10 1
1987 1991 1995 1999 2003
Year of introduction
1.1 Trends in Multiprocessor Systems Design 3

Register File Register File Register File

ALU ALU ALU

BUS
BUS Interface
Interface
System Bus System Bus

Single Core Dual Core

Fig. 1.2 Multi-core processor

icantly from the trend set by Moore’s observation. This is because, with every
new microprocessor generation, physical dimensions of chips decreased while the
number of transistors per chip increased; the maximum clock frequency was thus
bounded by a power envelop, crossing which could potentially burn the chip. Many
techniques were sought to improve performance of microprocessor without further
upscaling the frequency. One major breakthrough is that of multi-core processor—
pioneered by research teams from IBM and Intel. A multi-core processor refers
to a single computing unit with two or more microprocessor components (such as
arithmetic and logic unit, ALU) such that multiple instructions can be read and
executed in parallel. These parallel components are referred to as cores of a multi-
core processor. Figure 1.2 shows a simplified representation of a single-core and a
dual-core processor. The register file and the ALU of the single-core (shown in the
red box) are replicated to form the dual-core processor. Other components such as
the bus interface and the system bus are shared across the two cores.
Multi-core processors addressed thermal, power, and energy concerns. A proces-
sor with two cores running at a clock speed of f , can process the same number of
instructions as that processed by a single-core processor running at 2f within the
same time interval; yet the dual-core processor would still consume less energy.
Furthermore, the power dissipation is distributed and so do thermal hotspots. This
has motivated researchers over these years to integrate more cores in a single
processor—2-cores (Intel Core 2 Duo, 2006), 4-cores (Intel Core i5, 2009), 6-
cores (Intel Core i7, 2010), and 8-cores (Intel Xeon 2820, 2011). As the technology
continued to scale further, the processor architecture started shifting from multi-core
to many-core. Although there is no clear consensus among researchers to classify
a processor as multi- or many-core, based on the number of comprising cores, we
adopt one of the popular beliefs, classifying a processor with more than 8 cores
as many-core processor. Table 1.1 reports the state-of-the-art multi- and many-core
processors from some of the common microprocessor manufacturers.
4 1 Introduction

Table 1.1 State-of-the-art multi- and many-core processors


Release Technology Max.
Manufacturer # Cores year node (nm) power (W) Max. frequency (GHz)
Multi-core processors
IBM POWER7 8 2010 45 – 4.25
AMD Bulldozer 4 2011 32 125 3.9
Intel i7 Haswell 4 2013 22 84 3.5
Many-core processors
Cell BE 9 2005 65 100 3.2
Oracle SPARC M6 12 2013 28 – 3.6
Intel Xeon Phi 60 2012 22 225 1.05

1.1.3 Trends in Multiprocessor Systems

As the semiconductor fabrication technology matured, there emerged a strong


demand for single chip computing or System-on-Chip (SoC). An SoC is often
defined as a single chip complex integrated circuit, incorporating the major pro-
cessing elements of a complete end-product. Usually, an SoC comprises of a
single full-fledged processor (acting as the master) to coordinate the operation of
the other processing elements of the system. The SheevaPlug SoC [53] with one
Kirkwood 6281 processor from Marvell Semiconductors is an example of a single-
core SoC. As the processor technology shifted from single-core towards multi-core,
SoC designers started integrating multi-core processors for faster coordination and
processing. Intel’s Cloverview [7] (based on dual-core Intel Atom) and Apple’s A7
(based on dual-core ARM) are examples of multi-core SoCs. Finally, there are also
commercially available SoCs featuring many-core processors. Examples are Sony’s
PlayStation 3 with IBM Cell processor with 9 cores (2006) and Texas Advanced
Computing Center’s Stampede SoC with 60-core Intel Xeon Phi processor (2013).
As the performance demand kept increasing, single processor SoCs soon became
the performance bottleneck, even with up-scaled frequency and multi-core variants.
Research took a new direction and thoughts were directed towards integrating
multiple full-fledged processors (masters), to manage the application processes,
alongside other hardware subsystems. Such platforms are commonly referred to
as multiprocessor systems-on-chip (MPSoCs). The Lucent’s Daytona chip [1],
introduced in 2000, is the first known MPSoC, integrating multiple homogeneous
processors. Figure 1.3 shows the Daytona MPSoC architecture. Following this
breakthrough, there has been a significant drive towards MPSoC development
especially in the early half of 2000. Examples included Nexperia [20] from
Philips Semiconductor, OMAP [8] from Texas Instruments and Nomadik [3] from
STMicroelectronics. Since then, the MPSoC technology has matured to a great
extent, growing in complexity and size. Some of the current day MPSoCs are Uni-
Phier [41] from Panasonic Semiconductor, Platform 2012 aka STHORM [40] from
STMicroelectronics, and Tilera Gx8072 [58] from Tilera Corporation.
1.1 Trends in Multiprocessor Systems Design 5

Fig. 1.3 Lucent’s Daytona


architecture [1] RISC + SIMD DSP RISC + SIMD DSP

I/O + Memory BUS


Interface

RISC + SIMD DSP RISC + SIMD DSP

BJT JFET MOSFET CMOS FinFET


Transistor
Technology

SingleCore Multi-Core Many-Core


Microprocessor
Technology

1mm
SoC
Technology
Technology
Scaling

MPSoC
Technology

5nm
1920 1930 1940 1950 1960 1970 1980 1990 2000 2010 2020
2014

Fig. 1.4 Summary of the technology trend

Developments in MPSoC have also triggered developments in the communi-


cation infrastructure, which interconnects the processing elements of these SoCs.
Traditionally, MPSoCs integrated a shared bus, such as QuickPath Interconnect
(QPI) from Intel, STBus from STMicrolelectronics, and the AMBA from ARM,
to communicate among processing elements. However, the bottleneck soon shifted
from computation capability to large communication delays, severely threatening
the integration of additional processing elements. To circumvent this communica-
tion problem, a group of researchers from the Stanford University pioneered the
implementation of networking concepts for data communication in multiprocessor
system in 2002. This concept is known as network-on-chip (NoC) [4]. Since then,
several commercial NoCs are developed across different research teams. Examples
include Æthereal [24] and Hermes [39].
Summary of Trends Figure 1.4 shows the summary of the four technology
trends—transistor technology, microprocessor technology, SoC technology and
MPSoC technology. Shown in the same figure is the technology scaling following
Dennards’ Principles, starting with a gate length of 1 mm in 1974 to 5 nm in 2014.
6 1 Introduction

Scope of This Book Throughout the remainder of this chapter (and the book),
the term multiprocessor system is used to represent systems-on-chip with multiple
processing cores—single processor with multi-/many-cores or multiple processors.

1.2 Multiprocessor System Classification

Multiprocessor systems can be classified according to memory distribution, proces-


sor type, and interconnect network.

1.2.1 Memory-Based Classification

Multiprocessor systems can be classified into shared memory distributed memory


and distributed shared memory systems (Fig. 1.5).

1.2.1.1 Shared Memory Multiprocessor Systems

In this class of multiprocessor systems, every processing core has its own private
L1 and L2 caches, but all the cores share a common main memory. This is shown
in Fig. 1.5a. All cores in this architecture share a unique memory addressing space,
which leads to significant simplification of the programming. Data communication
across the cores takes place via the shared memory, accessed using a communication
medium, typically a shared bus. Until recently, this was the dominating memory
organization for multiprocessor systems with few cores (typically 2–4). However,
as the gap between processor speed and the memory speed increases, and as more
interacting parallel tasks are mapped to these cores, the memory bandwidth becomes
a bottleneck for this class of systems.

core core core core core core core core core


cache cache cache cache cache cache cache cache cache

Interconnect Memory Memory Memory


Memory Memory Memory
Interconnect
Memory
Interconnect Address Space

(a) (b) (c)

Fig. 1.5 Memory-based multiprocessor classification. (a) Shared memory. (b) Distributed mem-
ory. (c) Distributed shared memory
1.2 Multiprocessor System Classification 7

1.2.1.2 Distributed Memory Multiprocessor Systems

In this class of multiprocessor systems, every processing core has its own L1 and
L2 caches and a private memory space. This is shown in Fig. 1.5b. This class
of multiprocessor systems allows integration of any number of cores and offers
a distinctive advantage over shared memory architecture in terms of scalability.
However, programming is complex as compared to the shared memory counterpart.
In this architecture, computational tasks mapped on a processing core can operate
only on the local data; if remote data is required, the core communicates with other
cores. Data communication takes place using a message passing interface through
the interconnection network. One of the key characteristics of distributed memory
architecture is its non-uniform memory access (NUMA) time. This is dependent on
the interconnect network topology, such as Mesh, Tree, Star–Torus.

1.2.1.3 Distributed Shared Memory Multiprocessor Systems

Distributed shared memory architecture implements the shared memory abstraction


on a multiprocessor system. Memories are physically separate and attached to
individual core; however, the memory address space is shared across processing
cores. This architecture combines the scalability of distributed architecture with the
convenience of shared-memory programming. This architecture provides a virtual
address space, shared among the cores. This is shown in Fig. 1.5c.

1.2.2 Processor-Based Classification

Multiprocessor systems can be classified into homogeneous and heterogeneous


systems, based on the type of processing cores.

1.2.2.1 Homogeneous Multiprocessor Systems

A homogeneous multiprocessor system is a class of SoC where processing cores


are of the same type. Examples of homogeneous multiprocessor systems are Philips
Wasabi [57] and Lucent Daytona [1]. Homogeneous multiprocessor systems has low
design replication effort, leading to high scalability and faster time-to-market.

1.2.2.2 Heterogeneous Multiprocessor Systems

Homogeneous architectures are often associated with high area and power require-
ments [34]; the current trend is, therefore, to integrate heterogeneous processing
cores on the same SoC. Such architectures are referred to as heterogeneous
8 1 Introduction

Table 1.2 Summary of homogeneous and heterogeneous architectures


Homogeneous Heterogeneous
Advantages Less replication effort, highly Application specific, high
scalable, faster time-to-market computation efficiency, low power
consumption
Limitations Moderate computation efficiency, Less flexible, less scalable
high power consumption
Compatibility Data parallelism, shared memory Task parallelism, message passing
architecture, static and dynamic task interface, static task mapping
mapping
Examples Lucent Daytona [1], Texas Instrument OMAP [8],
Philip Wasabi [57] Samsung Exynos 5 [49]

multiprocessor systems. This class of systems includes heterogeneity within and


across processors. Texas Instrument OMAP [8] is an example of a heterogeneous
multiprocessor system that integrates a traditional uni-core processor and a dig-
ital signal processor (DSP) core. Here the heterogeneity is across the different
processors. On the other hand, Samsung Exynos 5 [49] is an example of an SoC
that integrates a processor with heterogeneous cores (quad-core ARM big.LITTLE
architecture [25] i.e., four ARM Cortex A7 cores and four Cortex A15 cores). One
of the major limitations of heterogeneous multiprocessor systems is the overhead of
integration. Table 1.2 reports the summary of these architectures.
An emerging trend in multiprocessor design is to integrate reconfigurable
logic such as field programmable gate arrays (FPGAs) alongside homogeneous or
heterogeneous cores [59]. This class of systems also belong to the heterogeneous
category and are referred in literature as reconfigurable multiprocessor systems.
These systems allow implementation of custom instructions [6] or custom logic [31]
specific to an application. Examples include Xilinx Zynq [50].
Scope of This Book This book focuses on multiprocessor systems with distributed
memory, using message passing interface for data communication between the
processing cores. Both homogeneous and heterogeneous architectures (including
the reconfigurable systems) are studied in this work.

1.3 Multiprocessor System Design Flow

A key concept in system design is the orthogonalization of concerns [33], i.e., the
process of separating different aspects of the design in order to explore design spaces
of individual aspects more efficiently. Figure 1.6 shows a typical multiprocessor
design flow. The first stage of the design flow is the analysis stage. Input to this stage
are a set of applications targeted for the platform and the platform’s architectural
specifications. Applications are represented as task graphs with nodes representing
computation tasks of the application and edges representing dependency between
1.3 Multiprocessor System Design Flow 9

Application N
Application B Architecture
Model
Application A
c c c
a0 n2
b2

a1 a2
c c c

a3

Analysis Stage

Architecture Stage

Micro-architecture Stage

Fig. 1.6 Multiprocessor design flow

these tasks as shown in the figure. Application modeling is discussed further in


Chap. 3. The system architecture is also represented as a connected graph, with
nodes representing processing cores of the platform and edges representing the
communication medium. Analysis stage of the design flow considers both, hardware
and software aspects. An example hardware aspect is the number of processing
cores needed for the platform to guarantee performances of the targeted applications
while satisfying design budgets specified in terms of area, power, and reliability,
among others. An example software aspect is the resource allocation, i.e., mapping
of different tasks of each application on the processing cores.
The architecture stage determines architectural details of the resources selected
in the analysis stage. For a general purpose processor, example architectural
details include determining the instruction set. Architectural details for memory
organization include size of the main memory for shared memory architecture
or size of the private memories for the distributed memory architecture. Finally,
the micro-architecture stage deals with the hardware of different components.
The output of this stage is the register transfer logic (RTL) representation of the
multiprocessor system, which can be synthesized on FPGA or ASIC.
Scope of This Book The scope of this book is limited to the analysis stage of the
design flow, which can be further classified into two types—platform-based design
and hardware–software co-design.
10 1 Introduction

HW Pruning

HW Platform
Application Application
Application Application
Design Space
DSE DSE Space
Design
Application
Design Space
HW & SW
Pruning
SW
HW Platform
Pruning
+
Application Application
Allocation Allocation

(a) (b)

Fig. 1.7 Multiprocessor system design methodology. (a) Platform-based design. (b) Hardware–
software co-design

1.3.1 Platform-Based Design

A platform-based design [44, 45] separates the hardware–software exploration pro-


cess into two sequential processes—hardware exploration followed by the software
exploration. This is shown in Fig. 1.7a. The hardware exploration is typically guided
by design constraints such as chip area, power and reliability targets together with
non-recurring engineering (NRE) costs. Once the target hardware platform is fixed,
an application-level design space exploration is performed to allocate available
resources of the hardware. The objective is to optimize metrics such as performance,
energy, and reliability. Finally the application space is pruned to obtain resource
allocation for every target application of the platform.

1.3.2 Hardware–Software Co-design

The hardware–software co-design [60, 61] performs hardware and software pruning
steps simultaneously to obtain the target platform and targeted application’s allo-
cation on the platform. This is shown in Fig. 1.7b. The NRE design cost is usually
considered as a constraint or is integrated with other optimization objectives such
as performance, energy, and reliability. In its simplest form, the approach starts
with a set of hardware design alternatives, each satisfying the NRE economics; the
software goal is to explore the design space of allocating the resources for every
design alternatives to optimize the required objectives. The hardware–software co-
design achieves better optimization objectives than platform-based designs, at the
price of higher exploration time and larger time-to-market.
1.4 Design Challenges for Multiprocessor Systems 11

1.4 Design Challenges for Multiprocessor Systems

Multiprocessor systems are widely used in embedded devices which are constrained
in terms of battery life and thermal safety. This section highlights key concerns of
modern multiprocessor systems, from embedded device perspective.

1.4.1 Energy Concern for Multiprocessor Systems

Traditionally, multiprocessor system designers have focused on improving perfor-


mance. With increasing use of multiprocessor systems in embedded devices, energy
optimization is becoming a primary objective. This is because by reducing the
energy, it is possible to prolong the battery life embedded devices. Energy reduction
can be achieved by (1) scaling the operating voltage and frequencies of the cores
and (2) reducing data communication between dependent tasks.
Dynamic power consumption of a circuit can be expressed as P D ˛  F  C  V 2 ,
where ˛ is the switching factor, F is the frequency, C is the capacitance, and V is the
voltage. Reducing both the voltage and the frequency by half reduces the total power
dissipation by 87.5%. On the other hand, computation time of a job is inversely
proportional to the frequency of operation and therefore, reducing the frequency
by half increases the computation time two fold. The overall effect is that energy
dissipation, measured as the product of power dissipation and computation time,
reduces by 75% when both voltage and frequency are scaled by half. The process
of scaling down voltage and frequency of operation dynamically during application
execution is termed dynamic voltage and frequency scaling (DVFS) [19, 52, 55].
When dependent tasks of an application are mapped to different cores, energy is
consumed to transfer data through the interconnect network. This energy is referred
to as the communication energy, which can be as high as up to 40% of the total
energy consumption for some applications [27]. One technique to mitigate this is to
allocate communicating tasks on the same core. However, this impacts performance
as tasks compete for shared compute and storage resources. To demonstrate this, a
simple example is provided in Fig. 1.8. There are three tasks with their execution
times (in ms) labeled as numbers inside the circle. Tasks B and C can execute after

A
Allocation Data Completion
50 A B C Communication Time
90 60 c0 c0 c0 0 160
c0 c0 c1 60 120
B 40 70 C c0 c1 c0 90 120
c0 c1 c1 150 160

Fig. 1.8 Demonstration of the importance of communication energy


12 1 Introduction

task A completes. The size of the data (in KB) required by tasks B and C from
the output of task A is marked in the figure on arrows from A to B and A to C,
respectively. The table shows different allocation of these tasks on a two-core system
(identified as c0 and c1 ). Data communicated on the interconnect and completion
time of the application are shown in columns 4 and 5, respectively. As can be clearly
seen from this table, task allocations have impact on communication energy and
computation time, requiring a trade-off analysis [54].

1.4.2 Reliability Concern for Multiprocessor Systems

Multiprocessor systems are expected to perform error-free operations. In this


respect, an error of a system is defined as a malfunction, i.e., deviation from
an expected behavior of the system. Errors are caused by faults. However, not
every system fault leads to erroneous behavior. This book considers malignant
faults, i.e., faults that are manifested as errors in the system. Such faults can be
classified into three categories—transient, intermittent, and permanent. Transient
faults are point failures, i.e., these faults occur once and then disappear. Primary
causes for these faults are alpha or neutron emissions.1 Several techniques have
been proposed in literature for transient fault-tolerance. Examples are the use
of error correction codes [22], checkpointing [51], rollback-recovery [46], and
duplication with comparison [5], among others. Intermittent faults are a class
of hardware defects, occurring frequently but irregularly over a period of time,
due to process, voltage, and temperature (PVT) variations. There are techniques
that optimize for intermittent faults by analyzing the steady-state availability [13].
Finally, permanent faults are damages to a circuit caused by such phenomena
like electromigration, dielectric breakdowns, thermal fatigues etc. These faults, are
caused during manufacturing or during a product’s lifetime due to component wear-
outs.
Permanent fault rate in an integrated circuit is described by the bathtub curve
shown in Fig. 1.9. A high fault-rate is observed post manufacturing process due to
non-ideal yield (<100%) of the technology node. Most of these faulty components
are identified and separated (for further analysis) during testing phase. After this
phase, probability of a hardware fault decreases. This time duration is known as the
infant mortality period. This phase is followed by a period of constant failure rates,
often referred as useful life. The last phase is known as the wear-out phase and is
characterized by increasing fault rate. Recent studies reveal that if wear-out is not
addressed early during useful life of a device, circuits can age faster than anticipated
with the wear-out phase settling earlier in life (red dashed line in the figure).
Reliability optimization can also be performed at different stages of the design
flow, with techniques adopted at each stage being orthogonal to one another.

1
Transient faults in the look-up table of FPGA manifest as permanent faults until reprogrammed.
1.5 Reliable and Energy Efficient Multiprocessor Design 13

Infant Useful Life Wear-out


Mortality

Fault Rate

Time

Fig. 1.9 Bathtub curve for permanent faults

Some examples of micro-architectural stage optimization techniques include the


use of adaptive body biasing technique [36], use of 22 nm tri-gate transistor [47],
and device-geometry aware design rule [37]. A summary of micro-architecture
stage techniques is provided in [29]. Architecture-level techniques deal with
processor instruction adaptations and scheduling. Examples include intelligent
instruction scheduling [62], exploiting instruction timing slacks [42], and the
compiler-directed register assignment [2]. Finally, reliability optimization at the
analysis stage involves intelligent application mapping and scheduling [28].

1.5 Reliable and Energy Efficient Multiprocessor Design

This work solves the reliability and energy concerns for embedded multiprocessor
systems, during the platform design stage (design-time) and also during in-field
operation (run-time) of the final platform.

1.5.1 Design-Time Methodology

Design-time methodology of this work is highlighted in Fig. 1.10. In order to


analyze temperature-related wear-outs of different mapping alternatives, a fast
and accurate temperature model is developed. This model is characterized using
temperature data obtained from industry-standard HotSpot [56] tool using the
floorplan information of a given multiprocessor system. This thermal model is
used in the platform-based design methodology along with target application
and architecture models. Applications are represented as Synchronous Data Flow
Graphs (SDFGs) [38] that allow modeling cyclic dependency, multi-input tasks,
14 1 Introduction

Architecture model, set of single applications and use-cases

Use-Case
Use-Case
Use-Case
Application

Application ApplicationApplication
ApplicationApplicationApplication
Application
ApplicationApplication
Architecture Application Application

Platform-based Design Methodology


(Chapter 3)
Hardware-Software Co-Design Methodology
(Chapter 4)
Thermal Characterization

Thermal Model Allocate


Resources
Reliability Analysis
Reliability Performance
Model
Reliability

Check
Energy

Hw-Sw Task
Partitioning

Throughput Throughput

Fault-tolerance Methodology (Chapter 5)

Encode
Mapping
Initial Generate f-fault
start Is f = F? Yes end
Mapping tolerant mappings

f=f+1 No

Mapping Database
Fig. 1.10 Design-time methodology

multi-rate tasks, and pipelined execution. Multiprocessor systems are often designed
for multiple applications, many of which are enabled concurrently (use-case).
Formally, a use-case is defined as a collection of multiple applications that are
active simultaneously on a multiprocessor system [35]. To allow optimization
for concurrent applications, a set of use-cases is also considered in the design
1.5 Reliable and Energy Efficient Multiprocessor Design 15

methodology. The target multiprocessor platform is represented as a directed graph


with nodes representing processing cores and edges representing physical links
between cores. The platform-based design methodology analyzes every application
and use-case to determine mapping of computation tasks on the target platform such
that temperature-related wear-outs and energy consumption are jointly minimized.
For emerging reconfigurable multiprocessor system such as the Zync, a
hardware–software task partition flow is proposed, which decides computation tasks
to be executed on the processing cores (ARM cores) and those to be implemented on
the FPGA fabric. Based on this flow, a hardware–software co-design methodology
is proposed to design reconfigurable multiprocessor systems. A set of applications
and use-cases represented as SDFGs are used to determine the minimum number
of processing cores and size of the reconfigurable area required for such systems to
maximize lifetime reliability, while satisfying area and energy budgets.
The proposed platform-based design and the hardware–software co-design are
proactive fault-tolerance approaches. A second aspect of the analysis phase of the
design methodology is to ensure graceful performance degradation in the presence
of faults. This methodology forms part of the reactive fault-tolerance approach,
which is to deal with resource management post fault occurrences. To achieve
this, analysis is performed to determine minimum energy mappings with least
performance degradation for every fault-scenario. This analysis is performed for
every target application for the system. Finally, to ensure that the performance
requirement is satisfied using the pre-analyzed mappings at run-time, a self-timed
execution-based scheduling technique is proposed for multiprocessor systems.

1.5.2 Run-Time Methodology

Figure 1.11 shows a high-level view of a typical multiprocessor system. At the


top is the application layer, composed of a set of user-defined applications. At the
bottom is the hardware layer, which consists of processing cores. In between these
two layers is the operating system or the system software layer, which coordinates
application execution on the hardware. The operating system is responsible to assign
computation tasks on the hardware cores. If the application to be executed on the
hardware is already analyzed at design-time, the operating system performs task
allocation according to the pre-computed mapping. On the other hand, if a new
application (not analyzed beforehand) needs to be executed on the hardware, the
operating system needs to determine the correct mapping such that temperature-
related wear-out can be minimized. To achieve this, a machine learning-based
run-time approach is developed in this work. The machine learning framework is
integrated as a part of the operating system and interacts with the application layer,
on the one hand, to determine performance requirements and with the hardware,
on the other hand, to collect thermal statistics. Based on these information, the
operating system adjusts voltage-frequency settings and application threads to
reduce thermal emergencies.
Another random document with
no related content on Scribd:
entzündet worden, der ganze Kerl wäre in Flammen aufgegangen,
so durchtränkt war der Ärmste mit dem Leuchtmaterial des Herrn
Rockefeller.
Entweder muß man es als Beweis höchster Disziplin oder
höchsten Stumpfsinns betrachten, Tatsache ist, daß dieser Träger
sich nicht etwa gleich am ersten Tage, wo er und seine Freunde die
Undichtigkeit eines der beiden Blechgefäße entdeckt hatten, bei mir
meldete, sondern daß er in aller Seelenruhe seine fröhlich
weiterrinnende Petroleumquelle am nächsten Frühmorgen von
neuem aufgenommen und ohne Murren bis zum Halteplatz weiter
getragen hat. Auch jetzt hat er wieder förmlich in Petroleum
geschwommen; dies hätte Kasi Uleia in seiner Gemütsruhe auch
jetzt nicht gestört, hätten sich nicht bereits die ersten Anzeichen
eines Ekzems bemerkbar gemacht, das ihn doch etwas beunruhigte.
So kam er denn endlich an und sagte, was eben jeder Neger sagt,
wenn ihm etwas fehlt und er vom alles vermögenden Weißen Hilfe
erheischt: „Daua, bwana, Medizin, Herr“, und wies mit
bezeichnender, aber keineswegs entrüsteter Gebärde auf seinen
körperlichen Zustand hin. Zu allererst hielt ich hier eine tüchtige
Seifenkur für angebracht, einmal des Petroleums wegen, sodann
auch, um den Schmutzüberzug, der sich während des siebentägigen
Marsches auf dem Körper des sonst außerordentlich reinlichen
Trägers abgelagert hatte, zu entfernen. Später habe ich den Mann
mit Lanolin behandelt, von dem ich zum Glück eine ungeheuer
große Büchse mitgenommen habe. Jetzt ist der Patient allmählich
wieder von seinem Leiden befreit.
Auch die Gelegenheit, von den verheerenden Wirkungen des
Sandflohes einen schwachen Begriff zu bekommen, habe ich bereits
hier in Massassi gehabt. Einer der Askariboys, ein baumlanger
Maaraba aus dem Hinterlande von Ssudi, tritt allmorgendlich an, um
für seine stark angefressene große Zehe die übliche Daua zu
empfangen. Ich bin in der höchst merkwürdigen Lage, einstweilen
nicht einmal Sublimat und Jodoform in meiner Apotheke zu besitzen,
sondern lediglich über Borsäure in Tabletten zu verfügen. Es muß
auch mit dieser gehen, und geht auch, nur müssen sich meine
Patienten wohl oder übel an eine etwas hohe Temperatur meines
schwachen Desinfektionsmittels gewöhnen. Bei solchen
gleichgültigen Patronen wie diesem Maaraba, der den Verlust seines
Zehennagels — dieser ist gänzlich verschwunden; an seiner Stelle
breitet sich eine große, völlig vereiterte Wunde aus — lediglich
seiner negroiden Gleichgültigkeit zuzuschreiben hat, ist übrigens das
heiße Wasser gleichzeitig ein sehr verdientes Strafmittel. Der
Bursche brüllt jedesmal, als wenn er am Spieße stäke, und schwört,
er wolle von nun an aber ganz genau auf den funsa, den Sandfloh,
Obacht geben. Zur Verfestigung seiner löblichen Vorsätze bekommt
er dann von seinem Herrn und Gebieter, den das kindische Gebaren
des Riesen weidlich ärgert, ein paar derbe, aber gutgemeinte Püffe.
Über den Gesundheitszustand der hiesigen Eingeborenen will ich
mich einstweilen lieber noch nicht auslassen; das wenige, was ich in
der kurzen Zeit hier in meiner Morgensprechstunde an hygienischer
Vernachlässigung und hygienischem Unvermögen gesehen habe,
läßt in mir den Entschluß reifen, erst noch andere Bezirke in dieser
Richtung zu studieren, bevor ich mir ein Urteil bilde und es auch
ausspreche. Nur soviel sei bereits hier gesagt: so glänzend wie wir
es uns daheim in unserem überfeinerten Kulturleben gemeiniglich
vorstellen, ist die Widerstandsfähigkeit des Negers gegen die
Angriffe seines heimtückischen Erdteils durchaus nicht, und vor
allem scheint eine Kindersterblichkeit zu herrschen, von deren Höhe
wir uns gar keine Vorstellung machen können. Ach, ihr Ärmsten!
muß man angesichts dieses Elends ausrufen.
Nach der Sprechstunde hebt das eigentliche Tagewerk an; dann
ziehe ich als Diogenes durchs Land. Die ersten Tage bin ich nur mit
einer Schachtel „Schweden“ bewaffnet in die Hütten der
Eingeborenen gekrochen. Das war recht romantisch, doch nicht
zweckentsprechend. Ich habe mir nie einen Begriff von der
ägyptischen Finsternis des Alten Testaments machen können; jetzt
weiß ich, daß die Benennung eines besonders hohen Ausmaßes
von Lichtmangel nach dem Lande der Pharaonen nur ein pars pro
toto ist; sie ist dem ganzen Erdteil eigen und ist hier in der Tiefebene
im Westen des Makondeplateaus in allererster Qualität zu haben.
Die Negerhütten sind nämlich ganz fensterlos. Das mag uns
rückständig erscheinen, ist jedoch der Ausfluß einer langen, langen
Erfahrung. Der Schwarze will sein Haus kühl haben; das kann er nur
erzielen durch den Abschluß jeder Außentemperatur. Deswegen
öffnet er auch so ungern Vorder- und Hintertür seines Heims, und
aus dem gleichen Grunde reicht das schwere Strohdach weit über
die Hauswand hinaus nach außen und unten.
Meine Stallaterne, vom Knaben Moritz morgens oder
nachmittags brennend durchs Land getragen, macht den
Eingeborenen viel Spaß; es ist ja auch etwas Absonderliches, gegen
den Glast der strahlenden Tropensonne mit einem solch
kümmerlichen Beleuchtungsapparat ankämpfen zu wollen. Um so
mehr am Platz ist sie nachher im Dunkel des Hauses. Höflich habe
ich oder Herr Knudsen den Besitzer gefragt, ob er gestattet, sein
Haus zu besichtigen; ebenso höflich ist die Genehmigung erfolgt.
Das ist dann ein lustiges Suchen in den Zimmern und Verschlägen,
aus denen sich zu meiner Überraschung das Heim der hiesigen
Schwarzen zusammensetzt. Die Räume sind nicht elegant, diesen
Begriff kennt der Neger einstweilen noch nicht, aber sie geben ein
unverfälschtes Zeugnis von der Lebensführung ihrer Insassen. In der
Mitte des Hauses, zwischen den beiden Haustüren, die Küche mit
dem Herde und den zum Haushalt zunächst nötigen Gerätschaften
und Vorräten. Der Herd der Inbegriff der Einfachheit: drei kopfgroße
Steine oder wohl gar nur Kugeln von Termitenerde, im Winkel von je
120 Grad zueinander gelagert. Darauf über schwelendem Feuer der
große irdene Topf mit dem unvermeidlichen Ugali; andere Töpfe
ringsum; dazwischen Schöpflöffel, Rührlöffel, Quirle. Über dem
Herde, aber noch im Vollbereich seines Rauches, ein Gerüst von
vier oder sechs gegabelten Stangen. Auf seinen Latten liegen
Hirseähren in dichter, gleichmäßiger Lagerung; unter ihnen hängen,
wie auf der Räucherkammer unserer deutschen Bauern die
Schlack-, Blut- und Leberwürste, zahlreiche Maiskolben von
außergewöhnlicher Größe und Schönheit, die jetzt bereits von einer
glänzend schwarzen Rauchkruste überzogen sind. Wenn diese nicht
vor Insektenfraß schützt, etwas anderes tut’s sicher nicht. Das ist
denn auch der Endzweck dieses ganzen Verfahrens. Bei uns
zulande, im gemäßigten Europa, mag es eine Wissenschaft sein,
das Saatkorn keimfähig bis zur nächsten Saatperiode zu erhalten;
hier im tropischen Afrika mit seiner alles durchdringenden
Luftfeuchtigkeit, seinem alles zerstörenden Reichtum an
Schädlingen, endlich seinem Mangel an geeignetem, dauerhaftem
Baumaterial, ist dieses Hinüberretten der Aussaat eine Kunst. Es
wird nicht meine undankbarste Aufgabe sein, diese Kunst in ihren
Einzelheiten gründlich zu studieren.
Auch über die Wirtschaft meiner Neger, ihren Kampf mit der
widerstrebenden Natur Afrikas und ihre Fürsorge für den morgenden
Tag will ich mich erst später, nachdem ich mehr von Land und
Leuten gesehen habe als bis jetzt, auslassen. In der
völkerkundlichen und auch der nationalökonomischen Literatur gibt
es eine lange Reihe von Werken, die sich mit der Klassifikation der
Menschheit nach ihren Wirtschaftsformen und Wirtschaftsstufen
befassen. Selbstverständlich nehmen wir die alleroberste Stufe ein;
wir haben ja die Vollkultur auf allen Gebieten gepachtet; darin sind
alle Autoren einig. In der Unterbringung der übrigen
Menschenrassen und Völker gehen sie dafür um so weiter
auseinander; es wimmelt von Halbkulturvölkern, seßhaften und
nomadischen, von Jäger-, Hirten- und Fischervölkern, von unsteten
und Sammlervölkern; die eine Gruppe übt ihre Wirtschaftskünste auf
Grund traditioneller Überlieferung aus, eine andere kraft des
angeborenen Instinkts; schließlich erscheint sogar eine tierische
Wirtschaftsstufe auf der Bühne. Wirft man alle diese Einteilungen in
einen gemeinsamen Topf, so entsteht ein Gericht mit vielen Zutaten,
aber von geringem Wohlgeschmack. Sein Grundbestandteil läuft im
großen und ganzen darauf hinaus, gerade die Naturvölker weit zu
unterschätzen. Wenn man jene Bücher liest, so hat man das Gefühl,
daß zum Beispiel der Neger direkt von der Hand in den Mund lebe
und daß er in seinem göttlichen Leichtsinn nicht einmal für den
heutigen Tag sorge, geschweige denn für den anderen Morgen.
In Wirklichkeit ist es ganz anders, anderswo wie auch hier. Und
gerade hier. Für unsere intensive norddeutsche Landwirtschaft
charakteristisch sind die regellos über die Feldmarken verteilten
Feldscheunen und die neuerdings stets gehäuft erscheinenden
Diemen oder Mieten; beide haben seit dem Aufkommen der
freibeweglichen Dreschmaschine die alte Hofscheune stark
entlastet, ja beinahe überflüssig gemacht. Das Wirtschaftsbild
meiner hiesigen Neger unterscheidet sich von jenem deutschen nur
dem Grade nach, nicht im Prinzip; auch hier Scheunen en miniature
regellos über die Schamben, die Felder, verteilt, und andere
Vorratsbehälter in meist erstaunlicher Anzahl und Größe neben und
im Gehöft. Und leuchtet man das Innere des Hauses selbst ab: auch
dort in allen Räumen große, mittels Lehm dicht und hermetisch
geschlossene Tongefäße für Erdnüsse, Erbsen, Bohnen und
dergleichen, und sauber gearbeitete, meterhohe Zylinder aus
Baumrinde, ebenfalls lehmüberzogen und gut gedichtet, für
Maiskolben, Hirseähren und andere Getreidesorten. Alle diese
Vorratsbehälter, die draußen im Freien stehenden wie die im Hause
selbst untergebrachten, stehen zum Schutz gegen Insektenfraß,
Nagetiere und Nässe auf Pfahlrosten, Plattformen von 40 bis 60
Zentimeter Höhe, die aus Holz und Bambus gefertigt und mit Lehm
bestrichen sind. Das Ganze ruht auf gegabelten, kräftigen Pfählen.
Die freistehenden Vorratsbehälter sind oft von sehr erheblichen
Dimensionen. Sie gleichen mit ihrem weitausladenden Strohdach
riesigen Pilzen, sind entweder aus Bambus oder aus Stroh
hergestellt und innen und außen stets mit Erde ausgestrichen.
Einige besitzen in der Peripherie eine Tür, ganz in der Art unserer
Kanonenöfen; bei anderen fehlt dieser Zugang. Will der Herr von
ihrem Inhalt entnehmen, so muß er zu dem Zweck das Dach lupfen.
Dazu dient ihm eine Leiter primitivster Konstruktion. Ich habe manch
eine von ihnen skizziert, doch hat mir jede ein stilles Lächeln
entlockt: ein paar ästige, krumm und schief gewachsene Stangen als
Längsbäume; in meterweitem Abstand darangebunden ein paar
Bambusriegel — das ist das Beförderungsmittel des Negers zu
seinem Wirtschaftsfundament. Trotz seiner Ursprünglichkeit ist es
indessen doch der Beweis einer gewissen technischen
Erfindungsgabe.
Ein uns Europäer sehr anheimelnder Zug in der Wirtschaft der
hiesigen Neger ist die Taubenzucht; kaum ein Gehöft betritt der
Besucher, ohne auf einen oder mehrere Taubenschläge zu stoßen.
Sie sind anders als in Uleia, doch auch sie sind durchaus praktisch.
Im einfachsten Falle nisten die Tiere in einer einzelnen Röhre aus
Baumrinde. Diese ist der Rindenmantel eines mittelstarken Baumes,
den man ablöst, an den Enden mit Stäben oder platten Steinen
verkeilt und anderthalb bis zwei Meter über dem Boden anbringt,
nachdem man in der Mitte der Peripherie erst noch das Flugloch
ausgespart hat. Meist ruht die Röhre auf Pfählen, seltener hängt sie,
einem schwebenden Reck gleich, an einem besonderen Gestell.
Diese Anlage ist dann besonders günstig, denn das Raubzeug findet
keinen Zugang. Und mehrt sich dann der Bestand der Tierchen, so
schichtet der Hausherr Röhre auf Röhre, daß eine förmliche Wand
entsteht. Neigt sich die Sonne, so tritt er oder seine Hausgenossin
heran an die luftige Behausung; ein freundliches Gurren begrüßt den
Nahenden aus dem Innern der Zylinder; behutsam hebt der Züchter
einen bearbeiteten Klotz vom Boden auf; sacht verschließt er mit ihm
das Flugloch des untersten Rohres; der zweite folgt, dann der dritte
und so fort. Beruhigt verläßt der Mensch den Ort; so sind die
Tierchen vor allem Raubzeug gesichert.
Seit einigen Tagen weiß ich auch, warum bei meinen Rundtouren
so wenig Männer sichtbar sind. Die Negersiedelungen hierzulande
verdienen kaum den Namen Dörfer; dazu sind sie zu weitläufig
gebaut; von einem Hause aus sieht man nur ganz vereinzelt das
nächste herüberwinken, so weit liegt es abseits. Gehindert wird der
Ausblick zudem durch die zwar sehr sperrigen, aber doch saftig
grünen und darum sehr undurchsichtigen Mhogofelder, die jetzt,
nach der Einerntung von Hirse und Mais, neben den mit Basi
bestellten Schamben allein noch die Fluren bedecken. So kann es
vorkommen, daß man, um kein Haus zu übergehen, sich lediglich
der Führung der ausgetretenen Feldpfade anvertrauen muß, oder
aber, daß man den Geräuschen und Lauten nachgeht, die von jeder
menschlichen Siedelung unzertrennlich sind. Und wie bedeutend
sind diese Geräusche und Laute, denen ich hier in Massassi so
ziemlich alle Tage habe nachgehen können! Wie eine lustige
Frühschoppengesellschaft hört es sich an, wenn ich mit Nils
Knudsen durch das Gelände streiche. Lauter und lauter werdende
Stimmen, die ohne Beobachtung parlamentarischer Umgangsformen
regellos durcheinanderlärmen. Mit einemmal wendet sich der Pfad,
unversehens stehen wir in einem stattlichen Gehöft, und da haben
wir auch die Bescherung! Es ist wirklich und wahrhaftig ein
Frühschoppen, und ein recht kräftiger dazu, der Stimmung aller
Teilnehmer nach zu urteilen und nach Anzahl und Ausmaß der
bereits ganz oder halb geleerten Pombetöpfe. Wie bei einem
Steinwurf in einen Poggenpfuhl, so verstummt bei unserem
Erscheinen das Getöse. Erst auf unser: „Pombe msuri?, ist der Stoff
gut?“ schallt ein begeistertes „Msuri kabissa, bwana! Ausgezeichnet,
Herr!“ aus rauhen Kehlen zurück.

Taubenschlag und Speicher (s. S. 118).


O diese Pombe! Wie gut wir es im alten Bierlande Deutschland
haben, begreifen wir erst, wenn wir ihm einmal schnöde den Rücken
kehren. Schon in Mtua, unserem zweiten Lagerplatz nach Lindi, war
uns drei Weißen ein gewaltiger Tonkrug mit dem Nationalbräu des
östlichen Afrika als Ehrengabe kredenzt worden. Bei mir hatte die
schmutzig graugelbe Flüssigkeit damals keine Gegenliebe gefunden;
um so größere bei unseren Leuten, die mit den 25 oder 30 Litern im
Nu fertig gewesen waren. Auch hier in Massassi hat die Gattin des
Wanyassagroßen Massekera-Matola, eine nasenpflockbehaftete,
außerordentlich nette Frau von mittleren Jahren, es sich nicht
nehmen lassen, Knudsen und mir gleich an einem der ersten
Abende ebenfalls den Ehrentrunk in Gestalt eines solchen
Riesentopfes zu übersenden. Die Ehrengabe ausschlagen oder sie
vergeuden ging doch nicht, wie wir uns sagen mußten; also deshalb
mit Todesverachtung heran an das Gebräu. Ich bin der glückliche
Besitzer zweier Wassergläser; eins von ihnen senke ich energisch in
die trübe Flut. Es zeigt sich gefüllt mit einem Naß, das der Farbe
nach unserem Lichtenhainer gleicht, der Konsistenz nach aber eine
Million mal dicker ist. Eine kompakte Masse von Hirseschrot und
Hirsemalz füllt das Gefäß bis fast obenhin; nur einen Finger breit
hoch lagert darüber ein wirkliches Lichtenhainer. „Ä, das geht doch
nicht“, knurre ich. „Kibwana, ein Taschentuch,“ rufe ich meinem
„Stubenmädchen“ zu, „aber ein reines.“ Das gute, dumme Tier aus
Pangani kommt nach endlosem Suchen mit dem Wahrzeichen
unseres katarrhalischen Zeitalters heran; ich forme einen Filter aus
dem feinen, weißen Stoff und lasse die Pombe hineinschütten. Ja,
was ist denn das? Kein Tropfen rinnt in das untergestellte Gesäß.
Ich rüttele und schüttele; es nützt alles nichts. „Nun,“ sage ich, „der
Stoff wird zu dicht sein; Lete sanda, Kibwana, bring etwas von dem
Leichentuch.“ Wie? Leichentuch? Verroht denn dieser dunkle Erdteil
selbst deutsche Professoren so fürchterlich, daß sie sogar
Leichentücher zu ihrem Wirtschaftsbetriebe heranziehen? Gemach,
meine Gnädigste! Freilich, ein Leichentuch ist dieses Sanda oder
Bafta, daran läßt sich nicht drehen noch deuteln; aber erstens hat
dieser Stoff den Vorzug, noch nicht gebraucht zu sein, und zweitens
möge es das Schicksal verhüten, daß er jemals seiner eigentlichen
Bestimmung zugeführt werden wird. Wer ins Innere von Afrika geht,
der rechnet wohlweislich mit den Tücken dieses Landes und auch
mit den Sitten seiner Bewohner, indem er sich mit einem Ballen
eines stark appretierten weißen, leichten Stoffes versieht, wie ihn die
Neger bei ihren Begräbnissen gebrauchen. Sie lieben es nicht, auch
im Tode mit der bloßen Mutter Erde in Berührung zu kommen,
sondern lassen ihre Leiber in ein Stück solcher Sanda einnähen.
Und je reiner und weißer der Stoff ist, um so sicherer ist dem
Verblichenen das Paradies.
Warum sollte ich also Sanda nicht als Filter benutzen,
wohlgemerkt erst, nachdem durch Herauswaschen der Appretur nur
ein weitmaschiges Netz feiner Fäden zurückgeblieben war! Doch
auch das nützte nichts; ein paar spärliche Tropfen rannen an dem
Beutel herab, das war alles. Ich habe dann mein Teesieb versucht
und mein Kaffeesieb; auch sie waren einem solchen
Aggregatzustande nicht gewachsen. „Prosit, Herr Knudsen!“ rief ich
deshalb, das letzte Sieb dem in der Türe stehenden Koch in hohem
Bogen in die geschickt auffangende Hand werfend. Es ist auch so
gegangen; und nicht einmal schlecht schmeckt das Zeug, ein wenig
nach Mehl zwar, aber sonst doch mit einem merkbaren Anklang an
unseren Studententrank aus dem Bierdorfe von Jena. Ich glaube
sogar, ich könnte mich an ihn gewöhnen.
Diese Angewöhnung scheint bei den Männern von Massassi
leider zu sehr erfolgt zu sein. Gewiß, ich gönne den würdigen
Hausvätern nach der schweren Arbeit der Ernte ihren Bürgertrunk
von Herzen, nur will es mir nicht so recht behagen, daß meine
Studien unter dieser ewigen Fröhlichkeit leiden sollen. Eine größere
Anzahl von Erwachsenen ist überhaupt nicht zusammenzutrommeln,
um sich von mir auf ihr Volkstum, ihre Sitten und Gebräuche
auspressen zu lassen; die wenigen aber, die es mit ihrer Zeit und
ihren Neigungen vereinbaren können, sich für kurze Zeit von ihrem
ambulanten Kneipleben zu trennen, sind sehr wenig geneigt, es mit
der Wahrheit genau zu nehmen. Selbst als ich neulich eine Schar
dieser wackeren Zecher herbestellt hatte, um mir ihre Flechttechnik
anzusehen, hatte das seine Schwierigkeiten; die Männer flochten mir
zwar was vor, aber zu langen Auseinandersetzungen über die
einheimischen Namen der Materialien und des Geräts waren sie
unmöglich zu gebrauchen; ihr Morgentrunk war zu ausgiebig
gewesen.
Die Sitte afrikanischer Völker, nach reichlicher Ernte einen Teil
der Körnerfrüchte in Bier umzuwandeln und in dieser Form rasch
und in großen Massen zu vertilgen, ist bekannt; sie vor allen Dingen
hat wohl zur Stärkung jener Ansicht beigetragen, nach der der
Schwarze im Besitz des Überflusses alles vertut und verpraßt, um
nachher zu darben und zu hungern. Ein Fünkchen oder vielleicht gar
ein ziemlich großer Funken göttlichen Leichtsinns läßt sich unserem
schwarzen Freunde allerdings nicht absprechen, aber man darf ihn
doch noch nicht auf ein einziges Indizium hin verurteilen. Ich habe
vorhin schon betont, wie ungemein schwierig es für den schwarzen
Ackerbauer ist, sein Saatgut zu überwintern. Noch viel schwieriger
würde es für ihn sein, die ungleich größere Menge der zum
Lebensunterhalt der Familie bestimmten Erntevorräte über einen
großen Teil des Jahres hin genießbar aufzubewahren. Daß er es
versucht, bezeugen die zahlreichen Vorratsbehälter bei jedem
größeren Gehöft; daß es ihm nicht immer gelingt und daß er daher
vorzieht, diesen dem Verderben ausgesetzten Teil seiner Ernte in
einer Weise anzulegen, die das Nützliche mit dem Angenehmen
verbindet, indem er ihn in der Form seines ganz annehmbaren
Bieres vertilgt, beweisen dagegen die bei aller Fröhlichkeit doch
harmlosen Früh- und Abendsitzungen. Sie weichen übrigens von
unserem europäischen Schankbetrieb insofern ab, als sie reihum
gehen; es kommt jeder als Wirt an die Reihe, und jeder ist auch
Gast; im ganzen eine herrliche Einrichtung.

Marschbereit vor Massassi.


Der gelinde chronische Alkoholdusel der Männerwelt ist es nicht
allein, was mir Schwierigkeiten bereitet. Zunächst die Not mit dem
Photographieren. Im fernen Europa ist man froh, wenn die liebe
Sonne dem Amateur das Handwerk erleichtert; und meint sie es ein
wenig zu gut, nun, so hat man hohe, dichtbelaubte Bäume,
grünendes Buschwerk, hochragende schattige Häuser. Nichts von
alledem in Afrika. Zwar hat man Bäume, aber sie sind weder hoch,
noch schattig; Büsche, aber sie sind nicht grün; Häuser, aber sie
sind im besten Fall höchstens von doppelter Mannshöhe, und dann
auch nur in der Firstlinie. Dazu der unheimlich hohe Sonnenstand
schon von 9 Uhr morgens an und bis über 3 Uhr nachmittags hinaus,
und eine Lichtstärke, von der man sich am besten dann einen Begriff
machen kann, wenn man einmal versucht, die Hautfarben der Neger
an der Hand der Luschanschen Farbentafel festzustellen. Nichts als
Licht und Glast hier, nichts als schwarzer, tiefer Schatten dort. Und
dabei soll man weiche, stimmungsvolle Bilder machen! Herr, lehre
mich diese Kunst, und ich will dir danken ewiglich.

Rattenfalle.
Auch das Thema Dunkelkammer ist wenig erbaulich. Die
deutsche Regierung ist fürsorglich; sie baut, um Hungersnöten unter
den Eingeborenen vorzubeugen, wohl mehr aber noch, um in einem
etwaigen neuen Aufstande von der Landesbevölkerung unabhängig
zu sein, in der Boma von Massassi augenblicklich ein stolzes Haus.
Es ist der einzige Steinbau im ganzen Lande und bis zur Küste hin,
nur einstöckig zwar, aber mit starken, nur von engen,
schießschartenartigen Löchern durchbrochenen Mauern und festem,
flachem Lehmdach. In diesem Architekturwunder lagern schon jetzt
ungezählte Säcke mit Hirse neuer Ernte und Berge roher
Baumwolle. Ich habe mir beides zunutze gemacht: mit der
Baumwolle habe ich die Luftlöcher verstopft, auf den Säcken aber
sitze ich; auf ihnen ruht gleichzeitig mein Dunkelkammer-
Arbeitstisch. Dieser war bis jetzt der wesentliche Bestandteil einer
Baumwollpresse, die draußen auf dem Hofe einsam über ein
verfehltes Dasein dahintrauert. Den Türverschluß endlich habe ich
durch eine Kombination dicker, von meinen Trägern gefertigter
Strohwände und einiger meiner Schlafdecken hergestellt. Dergestalt
kann ich zur Not sogar am Tage entwickeln, nur herrscht schon jetzt,
nach so kurzer Tätigkeit, eine erstickende Atmosphäre in dem auch
sonst wenig anheimelnden Raum. Gerne entrinne ich ihm daher, um
mich neuen Taten zuzuwenden.
Diese sind denn auch wirklich von viel ansprechenderer Natur.
Bei einem meiner ersten Bummel bin ich inmitten einer Schambe auf
ein zierliches Etwas gestoßen, das mir als Tego ya ngunda, als
Taubenfalle bezeichnet wird; ein System von Stäbchen, Bügeln und
feinen Schnüren, von denen einer mit einem kräftigen,
starkgekrümmten Bügel verbunden ist. Mich interessiert von Jugend
auf alles Technische, um wieviel mehr hier, wo wir in frühere
Entwicklungsphasen des menschlichen Intellekts tiefe Einblicke zu
tun die beste Gelegenheit haben. Also daheim Appell aller meiner
Leute und möglichst zahlreicher Eingeborener, und Ansprache an
alles versammelte Volk des Inhalts, daß der Msungu ein großes
Gewicht darauf legt, alle Arten von Fallen für alle Arten von Tieren zu
sehen und zu besitzen. Versprechen recht annehmbarer Preise bei
Lieferung authentischer, guter Stücke und zum Schluß die höfliche,
aber bestimmte Aufforderung: „Nendeni na tengeneseni sasa, nun
geht los und baut eure Dinger zusammen.“
Wie sind sie geeilt an jenem Tage, und wie eifrig sind alle meine
Mannen seitdem Tag für Tag an der Arbeit! Ich habe meine Träger
bisher für lauter Wanyamwesi gehalten; jetzt ersehe ich an der Hand
der Kommentare, die mir jeder einzelne zu seinem Kunstwerk geben
muß, daß sich unter meinen 30 Mann eine ganze Reihe von
Völkerschaften verbirgt. Zwar das Gros sind Wanyamwesi, doch
daneben gibt es Wassukuma und Manyema und sogar einen echten
Mgoni von Runssewe, also einen Vertreter jenes tapfern
Kaffernvolkes, das vor einigen Jahrzehnten vom fernen Südafrika bis
ins heutige Deutsch-Ostafrika vorgedrungen ist und dabei eine
seiner Gruppen, eben diese Runssewe-Wangoni, bis weit oben an
die Südwestecke des Viktoria-Nyansa vorgeschickt hat. Und nun
meine Askari erst! Es sind zwar nur 13 Mann, aber sie gehören nicht
weniger als einem Dutzend verschiedener Völkerschaften an, vom
fernen Darfor im ägyptischen Sudan bis zu den Yao in Portugiesisch-
Ostafrika. Und alle diese Getreuen zermartern ihr Gehirn und üben
in Busch und Feld von neuem die Künste ihres Knaben- und
Jünglingsalters, und dann kommen sie heran und errichten auf dem
weiten, sonnigen Platz neben meinem Palais die Früchte ihrer
schweren Geistesarbeit.

Antilopenfalle.

Der typische Ackerbauer steht in der Literatur als Jäger und


Fallensteller nicht hoch im Kurse; sein bißchen Geist soll durch die
Sorge um sein Feld völlig absorbiert werden; nur Völker vom
Schlage des Buschmanns, des Pygmäen und des Australiers hält
unsere Schulweisheit für fähig, das flüchtige Wild in Wald und
Steppe mit Geschick zu erlegen und mit List und Geistesschärfe in
schlau ersonnener Falle zur Strecke zu bringen. Und doch, wie weit
schießt auch diese Lehrmeinung am Ziel vorbei! Freilich, unter den
Völkern meines Gebietes gelten die Makua sogar als gute Jäger;
dabei sind sie in der Hauptsache genau wie die anderen Völker
typische Hackbauern, d. h. Leute, die ihre mühselig urbar
gemachten Felder Jahr für Jahr unverdrossen mit der Hacke
beackern. Sind ihre Tierfallen nicht trotz alledem Beweise eines
geradezu bewunderungswürdigen Scharfsinns? Ich gebe einige
meiner Skizzen als Belege bei; die Konstruktion der Fallen und die
Art ihrer Wirksamkeit ergibt sich aus der Zeichnung von selbst. Wer
aber der Kunst technischen Sehens gänzlich ermangeln sollte, für
den füge ich bei, daß alle diese Mordinstrumente auf folgendes
Prinzip hinauslaufen: entweder die Falle ist für einen Vierfüßer
bestimmt; dann ist sie so eingerichtet, daß das Tier beim
Vorwärtsschreiten oder -laufen mit der Nase gegen ein feines Netz
oder mit dem Fuß gegen eine feine Schnur stößt. Netz und Schnur
werden dadurch vorwärts gedrückt; jenes gleitet mit seinem oberen
Rande nach unten, das Ende der Schnur hingegen bewegt sich
etwas seitwärts. In beiden Fällen wird durch diese Gleitbewegung
das Ende eines kleinen Hebels frei, eines Holzstäbchens, das in
einer in der Zeichnung klar ersichtlichen Weise die Falle bisher
gespannt erhalten hat. Es schlägt jetzt blitzschnell um sein
Widerlager herum, bewegt von der Spannkraft eines Baumes oder
eines sonstwie angebrachten Bügels. Dieser schnellt nach oben und
zieht dabei eine geschickt angebrachte Schlinge zu; das Tier ist
gefangen und stirbt eines qualvollen Erstickungstodes. Ratten und
ähnlich lieblichem Getier geht der schwarze Fallensteller zwar nach
ähnlichen Prinzipien, doch noch grausamer zu Leibe, und leider stellt
er auch den Vögeln mit gleicher Gerissenheit nach. Vielleicht finde
ich später noch einmal Gelegenheit, auf diese Seite des hiesigen
Völkerlebens zurückzukommen; verdient hat sie es, denn auf kaum
einem anderen Gebiet zeigt sich die Erfindungsgabe auch des
primitiven Geistes so schön und deutlich ausgeprägt wie in dieser
Art des Kampfes ums Dasein.
Psychologisch interessant ist das Verhalten der Eingeborenen
gegenüber meiner eigenen Tätigkeit bei der Lösung dieses Teils
meiner Forschungsaufgabe. Wenn wir beiden Europäer unser
karges Mittagsmahl verzehrt haben, Nils Knudsen sich zum
wohlverdienten Schlummer niedergelegt hat und das Geschnarch
meiner Krieger zwar rhythmisch, aber nicht harmonisch aus der
Barasa herübertönt, dann sitze ich im sengenden Sonnenbrand,
dem schattenlosen Schlemihl gleich, und nur kümmerlich geschützt
durch den größeren meiner beiden Tropenhelme draußen auf dem
Aufstellungsplatz meiner Tierfallen und zeichne. Bis in mein 30.
Lebensjahr habe ich zum Spott für alle meine in dieser Hinsicht recht
begabten Verwandten als talentlos gegolten; da „entdeckte“ ich mich
als königlich preußischer Hilfsarbeiter im Berliner Museum für
Völkerkunde eines schönen Tags selbst, und wenn einer meiner
Freunde mich dereinst einer Biographie für würdig erachten sollte,
so mag er nur ruhig betonen, daß mir in meiner wissenschaftlichen
Entwicklungszeit meine bescheidenen zeichnerischen Leistungen
eigentlich mehr Freude und Genugtuung bereitet haben als die
schriftstellerischen. Für den ethnographischen Forschungsreisenden
ist die Fähigkeit, von welchem Forschungsobjekt es auch immer sei,
eine genaue Skizze rasch und mit wenigen Strichen entwerfen zu
können, eine Zugabe, die nicht hoch genug eingeschätzt werden
kann. Die Photographie ist gewiß eine wunderbare Erfindung, im
Kleinkram der täglichen Forschungsarbeit versagt sie indessen
häufiger als man glaubt, und nicht nur im Dunkel der Negerhütte,
sondern auch bei tausend anderen Sachen in heller Luft.
Perlhuhnfalle.

Falle für Großwild.


Also ich sitze und zeichne. Kein Lüftchen regt sich; die ganze
Natur scheint zu schlafen. Auch mir wird die Feder müde, da höre
ich unmittelbar hinter meinem Rücken Geräusch. Ein flüchtiger Blick
lehrt mich, daß das Moment allgemein menschlicher Neugier selbst
die Urkraft negroider Faulheit überwunden hat. Meine Träger sind’s,
ein ganzer Haufen; auch Eingeborene dabei. Sie müssen leise
herangetreten sein, was auf dem weichen Sandboden und bei dem
Mangel an Schuhen nicht befremdlich ist. Gespannt schaut die
enggedrängte Schar über meine Schulter hinweg ins Skizzenbuch.
Ich lasse mich nicht stören; Strich folgt auf Strich; das Werk nähert
sich seinem Ende; schließlich ist es fertig. „Sawasawa?“ (wörtlich:
„gleich?“, hier etwa in dem Sinn: „Na, ist das Ding denn getroffen?“)
frage ich gespannt zurück. „Ndio, jawohl“, ertönt es mir unverzüglich
und mit einer Begeisterung in die Ohren, daß die Trommelfelle
platzen möchten. „Kisuri? Ist es schön?“ „Kisuri sana kabissa,
ausgezeichnet!“ gellt es noch stärker und begeisterter in meine
Hörorgane. „Wewe Fundi, du bist ein Meister.“ Es sind meine
Kunstverständigen, die ausübenden Künstler selbst, die hier in für
mich so schmeichelhafter Art das Richteramt üben; die paar
Schensi, die unbeleckten, von der Muse ungeküßten, die nicht zum
Kreis meiner Künstler gehören, haben nur als Herdenvieh
mitgebrüllt.
Und nun kommt der Versuch einer Nutzanwendung. Ich erhebe
mich von meinem Stühlchen, stelle mich in Positur und lege meinen
Kunstjüngern nahe, da sie nun sähen, wie ich, der Fundi, eine
solche Falle zeichne, so wäre es angezeigt, daß nun doch auch sie
sich einmal an einem solchen schwierigeren Gegenstand
versuchten; immer bloß ihre Freunde abzumalen, oder aber Bäume
und Häuser und die Tiere, das sei langweilig; außerdem seien sie
doch so kluge Kerle, daß ihnen eine solche Vogelfalle kaum
Schwierigkeiten bieten würde. Ich habe auf den Ausdruck
verschämter Verlegenheit, wie er mir beim Beginn meiner Studien in
Lindi entgegentrat, schon einmal hingewiesen; hier kam er noch
verstärkter und auch allgemeiner zum Ausdruck. Ich habe dabei das
bestimmte Gefühl gehabt, daß den Leuten jetzt zum erstenmal der
Begriff dessen klar wurde, was wir Perspektive nennen. In ihren
Gegenreden und Gebärden suchten sie sichtlich etwas Derartiges
auszudrücken, sie verfolgten mit den Fingern die merkwürdig
verkürzten Kurven, die doch in Wirklichkeit Kreisbögen waren, kurz
sie standen etwas Neuem, vorher nie Gekanntem und Geahntem
gegenüber, und das brachte ihnen einesteils das Gefühl ihrer
geistigen und künstlerischen Unterlegenheit zum Bewußtsein,
während es sie andererseits wie ein Magnet an mein Skizzenbuch
bannte. Bis jetzt hat noch keiner von ihnen sich an die Wiedergabe
einer solchen Tierfalle herangewagt.
Alle Afrikareisenden früherer Tage oder in weniger gut
erschlossenen Ländern, als Deutsch-Ostafrika es ist, haben durch
nichts mehr zu leiden gehabt als durch die Schwierigkeiten des
Tauschverkehrs. Mit wieviel Hunderten von Lasten der
verschiedenartigsten Zeugstoffe, mit wieviel Perlensorten ist noch
ein Stanley zu seinen Entdeckertaten ausgezogen; wie unsicher war
es bei alledem, ob man gerade den Geschmack der Eingeborenen
seines Forschungsgebietes getroffen hatte; und wie ungeheuer
vergrößerte diese primitive Art des Geldes den Troß jeder
Expedition. Bei uns in Deutsch-Ostafrika mit seiner sooft zu Unrecht
angefeindeten Kolonialregierung reist der Weiße heute fast ebenso
bequem wie daheim im Mutterlande. Zwar sein Kreditbrief reicht nur
bis zur Küste; trägt sein Unternehmen jedoch wie das meinige
amtlichen Charakter, so ist jede Station und jeder Posten, der über
eine Regierungskasse verfügt, angewiesen, dem Reisenden unter
Beachtung sehr einfacher Formalitäten Kredit zu gewähren und ihn
mit Barmitteln auszustatten. Des Rätsels Lösung ist sehr einfach:
unsere Rupienwährung gilt nicht nur an der Küste, sondern zwingt
auch alle Völker des Innern, sich ihr wohl oder übel anzubequemen.
Meine Operationsbasis ist auch in finanzieller Hinsicht das
Städtchen Lindi mit seinem kaiserlichen Bezirksamt; von dort habe
ich mir ein paar große Säcke mit ganzen, halben und Viertelrupien
und für den ersten Bedarf auch einige Kisten mit Hellern
mitgenommen. O dieser unglückliche Heller! Was wird er, sein echt
„afrikanischer“ Name und seine Einführung überhaupt von den
bösen, weißen Küstenmännern bespöttelt, und wie schlecht sind die
Witze, die über ihn gemacht werden! Der billigste ist noch der, daß
der gegenwärtige Zolldirektor in der Landeshauptstadt, der in der Tat
den Namen dieses bei uns längst veralteten Zahlmittels führt, bei der
ostafrikanischen Scheidemünze Gevatter gestanden habe. So viel
merke ich schon jetzt: den Eingeborenen geht es wie bei uns den
alten Leuten vor 30 Jahren; ebenso wie diese sich nicht an die Mark
gewöhnen konnten und ruhig mit dem guten, alten Taler
weiterrechneten, so zählt hier alles höchst despektierlich und illoyal
nach Pesas weiter, der alten Kupfermünze der
vierundsechzigteiligen Rupie. Dies ist auch viel einfacher und
bequemer; ein Ei kostet einen Pesa, und damit basta. Seinen Wert
in Heller umzurechnen fällt niemandem ein.
Doch der Neger müßte nicht Neger sein, wenn er sich nicht trotz
alledem der Tätigkeit des Hellereinnehmens mit Begeisterung
hingäbe. Und sein Geschäft blüht jetzt! Es paßt zu dem Bilde des
Diogenes wie die Faust aufs Auge, wenn hinter dem
laternenschwingenden Moritz der Mgonimann Mambo sasa durch
die sonnige Landschaft zieht, hoch oben auf dem krauswolligen
Haupte ein stattliches Gefäß mit gleißender Münze. Es sind frisch in
Berlin geprägte Kupferheller, mit denen ich die Negerherzen zu
betören ausziehe.
Nach langem, doch durchaus nicht langweiligem Ableuchten aller
Salons der Negerpaläste kehre ich, geblendet von der überhellen
Tropensonne, an das Tageslicht zurück; mit verständnisvollem
Schmunzeln schleppt meine Leibgarde — das sind diejenigen
meiner Leute, die immer um mich sind und die mit der dem
Natursohn eigenen Auffassungsgabe rasch begriffen haben, worum
es sich handelt — einen Haufen Krimskrams hinterher; mit
gemischten Gefühlen, erwartungsvoll und zweifelnd zugleich, folgen
schließlich Hausherr und Hausfrau. Jetzt beginnt das Feilschen.
Einen kleinen Vorgeschmack hat der Ausreisende schon in Neapel
und Port Said, in Aden und Mombassa bekommen; hier spielt sich
das Verfahren nicht wesentlich anders ab. „Kiassi gani? Was kostet
der ganze Plunder?“ fragt man so leichthin, mit einer summarischen
Handbewegung den ganzen Haufen umschließend. Diesem
Verfahren steht der glückliche Besitzer jener Kostbarkeiten gänzlich
ohne Verständnis gegenüber; er sperrt Mund und Nase weit auf und
schweigt. So geht’s also nicht; diese abgekürzte Methode wäre auch
vom wissenschaftlichen Standpunkt aus zu verwerfen. „Nini hii? Was
ist das?“ Und ich halte ihm irgendeins der Stücke unter die Augen.
Dies erst ist der richtige Weg. Jetzt öffnet sich der vordem so
schweigsame Mund, und nun heißt es sich schnell auf die
Kollegbank der seligen Fuchsenzeit zurückversetzt denken und
eifrigst nachschreiben, was zur Abwechselung einmal nicht aus dem
Munde hochwohlweiser Professoren auf das Auditorium
herniederplätschert, sondern dem prachtvollen Zahngehege eines
ganz unbeleckten Schensi entströmt. Und wenn ich dann alles weiß,
den Zweck, den Namen, die Herstellungsart und die Wirkungsweise,
dann endlich ist auch der Schwarze geneigt und imstande, den
Einzelpreis zu fixieren. Bis jetzt habe ich dabei zwei Extreme
feststellen können: die eine Kategorie der Verkäufer fordert ohne
Rücksicht auf die Art des Verkaufsobjektes ganze Rupien, Rupia tatu
oder Rupia nne, 3 oder 4 Rupien; die andere verlangt ebenso
konsequent den Einheitspreis eines Sumni. Dieser Sumni ist im
hiesigen Sprachgebrauch der vierte Teil einer Rupie, gilt also 33⅓
Pfennig. In der Währung Ostafrikas ist er ein bildhübsches, zierliches
Silberstück von etwas kleinerer Größe als unsere halbe Mark.
Vielleicht ist es diese Handlichkeit, verbunden mit dem
ungebrochenen Glanz gerade meiner funkelnagelneuen Stücke, was
dieser Münze seine Bevorzugung sichert.
Eins muß man der hiesigen Bevölkerung im Gegensatz zu der
Schwefelbande von Neapel, Port Said und Aden nachrühmen: keiner
von ihnen zetert und jammert, wenn wir ihm statt des geforderten
Talers den zwanzigsten oder zehnten Teil bieten. In voller
Gemütsruhe geht der Neger in seiner Forderung nach und nach bis
zu einer billigen Einigung herunter, oder aber er sagt gleich beim
ersten Gegenangebot: „Lete, gib’s her.“ In diesem Augenblick
beginnt dann die Glanzrolle des Knaben Moritz und meines
Hellertopfes. Mit raschem Griff hat der Boy das Gefäß vom Haupte
seines Freundes Mambo sasa heruntergeholt; mit Kennerblick
mustert er den Kassenbestand, und dann zahlt er aus mit der
Würde, wenn auch nicht mit der Geschwindigkeit des Kassierers
einer großen Bank.
So oder ähnlich spielt sich das Handelsgeschäft auch um die
übrigen Stücke ab. Es ist viel zeitraubender als mir lieb ist, jedoch

You might also like