Download as pdf or txt
Download as pdf or txt
You are on page 1of 69

Introduction to Linear Regression

Analysis (Wiley Series in Probability


and Statistics) 6th Edition Montgomery
Visit to download the full and correct content document:
https://ebookmeta.com/product/introduction-to-linear-regression-analysis-wiley-series-
in-probability-and-statistics-6th-edition-montgomery/
More products digital (pdf, epub, mobi) instant
download maybe you interests ...

Introduction to Statistics and Data Analysis, 6th


Edition Peck

https://ebookmeta.com/product/introduction-to-statistics-and-
data-analysis-6th-edition-peck/

Statistics for Data Scientists: An Introduction to


Probability, Statistics, and Data Analysis Maurits
Kaptein

https://ebookmeta.com/product/statistics-for-data-scientists-an-
introduction-to-probability-statistics-and-data-analysis-maurits-
kaptein/

Introduction to Probability and Statistics for


Engineers and Scientists, 6th Edition Sheldon M. Ross

https://ebookmeta.com/product/introduction-to-probability-and-
statistics-for-engineers-and-scientists-6th-edition-sheldon-m-
ross/

An introduction to probability and statistics using


BASIC First Edition Groeneveld

https://ebookmeta.com/product/an-introduction-to-probability-and-
statistics-using-basic-first-edition-groeneveld/
A Second Course in Statistics: Regression Analysis 8th
Edition William Mendenhall

https://ebookmeta.com/product/a-second-course-in-statistics-
regression-analysis-8th-edition-william-mendenhall/

Fundamentals of Queueing Theory (Wiley Series in


Probability and Statistics) 5th Edition Shortle

https://ebookmeta.com/product/fundamentals-of-queueing-theory-
wiley-series-in-probability-and-statistics-5th-edition-shortle/

Linear Regression Models: Applications in R (Chapman &


Hall/CRC Statistics in the Social and Behavioral
Sciences) 1st Edition John P. Hoffmann

https://ebookmeta.com/product/linear-regression-models-
applications-in-r-chapman-hall-crc-statistics-in-the-social-and-
behavioral-sciences-1st-edition-john-p-hoffmann/

Regression Analysis: A Practical Introduction 2nd


Edition Jeremy Arkes

https://ebookmeta.com/product/regression-analysis-a-practical-
introduction-2nd-edition-jeremy-arkes/

Regression Analysis A Practical Introduction 2nd


Edition Jeremy Arkes

https://ebookmeta.com/product/regression-analysis-a-practical-
introduction-2nd-edition-jeremy-arkes-2/
MONTGOMERY
A comprehensive and current introduction PECK
VINING
to the fundamentals of regression analysis
Introduction to Linear Regression Analysis, 6th Edition is the most comprehensive,
fulsome, and current examination of the foundations of linear regression analysis. Fully
SIXTH EDITION

LINEAR REGRESSION ANALYSIS


updated in this new sixth edition, the distinguished authors have included new material
on generalized regression techniques and new examples to help the reader understand
retain the concepts taught in the book.

The new edition focuses on four key areas of improvement over the fifth edition:
INTRODUCTION TO
LINEAR
• New exercises and data sets

INTRODUCTION TO
• New material on generalized regression techniques
• The inclusion of JMP software in key areas

REGRESSION
• Carefully condensing the text where possible

Introduction to Linear Regression Analysis skillfully blends theory and application


in both the conventional and less common uses of regression analysis in today’s

ANALYSIS
cutting-edge scientific research. The text equips readers to understand the basic
principles needed to apply regression model-building techniques in various fields of
study, including engineering, management, and the health sciences.

DOUGLAS C. MONTGOMERY, PHD, is Regents Professor of Industrial Engineering


and Statistics at Arizona State University. Dr. Montgomery is the co-author of several
Wiley books including Introduction to Linear Regression Analysis, 5th Edition.

ELIZABETH A. PECK, PHD, is Logistics Modeling Specialist at the Coca-Cola


Company in Atlanta, Georgia.

G. GEOFFREY VINING, PHD, is Professor in the Department of Statistics at Virginia


Polytechnic and State University. Dr. Peck is co-author of Introduction to Linear
Regression Analysis, 5th Edition.

A Companion website with additional resources is available at


www.wiley.com/go/montgomery/introlinearregression6e SIXTH
EDITION
DOUGLAS C. MONTGOMERY | ELIZABETH A. PECK
Cover Design: Wiley
Cover Images: Abstract marbled background, blue marbling wavy lines G. GEOFFREY VINING
© oxygen/Getty Images, Linear Regression analysis graph Courtesy of
Douglas C. Montgomery

www.wiley.com
INTRODUCTION TO LINEAR
REGRESSION ANALYSIS

ffirs.indd 1 01/30/2021 3.47.08 PM


WILEY SERIES IN PROBABILITY AND STATISTICS

Established by WALTER A. SHEWHART and SAMUEL S. WILKS

Editors: David J. Balding, Noel A. C. Cressie, Garrett M. Fitzmaurice,


Harvey Goldstein, Iain M. Johnstone, Geert Molenberghs, David W. Scott,
Adrian F. M. Smith, Ruey S. Tsay, Sanford Weisberg
Editors Emeriti: Vic Barnett, J. Stuart Hunter, Joseph B. Kadane, Jozef L. Teugels

A complete list of the titles in this series appears at the end of this volume.

ffirs.indd 2 01/30/2021 3.47.08 PM


INTRODUCTION TO LINEAR
REGRESSION ANALYSIS
Sixth Edition

DOUGLAS C. MONTGOMERY
Arizona State University
School of Computing, Informatics, and Decision Systems Engineering
Tempe, AZ

ELIZABETH A. PECK
The Coca-Cola Company (retired)
Atlanta, GA

G. GEOFFREY VINING
Virginia Tech
Department of Statistics
Blacksburg, VA

ffirs.indd 3 01/30/2021 3.47.08 PM


This sixth edition first published 2021
© 2021 John Wiley & Sons, Inc.

Edition History
John Wiley and Sons, Inc. (5e, 2012)

All rights reserved. No part of this publication may be reproduced, stored in a retrieval system, or trans-
mitted, in any form or by any means, electronic, mechanical, photocopying, recording or otherwise, except
as permitted by law. Advice on how to obtain permission to reuse material from this title is available at
http://www.wiley.com/go/permissions.

The right of Douglas C. Montgomery, Elizabeth A. Peck, and G. Geoffrey Vining to be identified as the
authors of this work has been asserted in accordance with law.

Registered Office(s)
John Wiley & Sons, Inc., 111 River Street, Hoboken, NJ 07030, USA

Editorial Office
111 River Street, Hoboken, NJ 07030, USA

For details of our global editorial offices, customer services, and more information about Wiley products
visit us at www.wiley.com.

Wiley also publishes its books in a variety of electronic formats and by print-on-demand. Some content
that appears in standard print versions of this book may not be available in other formats.

Limit of Liability/Disclaimer of Warranty: While the publisher and authors have used their best efforts
in preparing this work, they make no representations or warranties with respect to the accuracy or com-
pleteness of the contents of this work and specifically disclaim all warranties, including without limitation
any implied warranties of merchantability or fitness for a particular purpose. No warranty may be created
or extended by sales representatives, written sales materials or promotional statements for this work.
The fact that an organization, website, or product is referred to in this work as a citation and/or potential
source of further information does not mean that the publisher and authors endorse the information or
services the organization, website, or product may provide or recommendations it may make. This work
is sold with the understanding that the publisher is not engaged in rendering professional services. The
advice and strategies contained herein may not be suitable for your situation. You should consult with
a specialist where appropriate. Further, readers should be aware that websites listed in this work may
have changed or disappeared between when this work was written and when it is read. Neither the
publisher nor authors shall be liable for any loss of profit or any other commercial damages, including
but not limited to special, incidental, consequential, or other damages.

Library of Congress Cataloging-in-Publication Data


Names: Montgomery, Douglas C., author. | Peck, Elizabeth A., 1953– author.
| Vining, G. Geoffrey, 1954– author.
Title: Introduction to linear regression analysis / Douglas C. Montgomery,
Elizabeth A. Peck, G. Geoffrey Vining.
Description: Fifth edition. | Hoboken, New Jersey : Wiley, [2020] | Series:
Wiley series in probability and statistics | Includes bibliographical
references and index.
Identifiers: LCCN 2020034055 (print) | LCCN 2020034056 (ebook) | ISBN
9781119578727 (hardback) | ISBN 9781119578741 (adobe pdf) | ISBN
9781119578758 (epub)
Subjects: LCSH: Regression analysis.
Classification: LCC QA278.2 .M65 2020 (print) | LCC QA278.2 (ebook) | DDC
519.5/36–dc23
LC record available at https://lccn.loc.gov/2020034055
LC ebook record available at https://lccn.loc.gov/2020034056

Cover Design: Wiley


Cover Images: Abstract marbled background, blue marbling wavy lines © oxygen/Getty Images,
Linear Regression analysis graph Courtesy of Douglas C. Montgomery

Set in 10/12pt TimesTenRoman by SPi Global, Pondicherry, India

10 9 8 7 6 5 4 3 2 1

ffirs.indd 4 01/30/2021 3.47.08 PM


CONTENTS

PREFACE xiii
ABOUT THE COMPANION WEBSITE xvi

1. INTRODUCTION 1
1.1 Regression and Model Building / 1
1.2 Data Collection / 5
1.3 Uses of Regression / 9
1.4 Role of the Computer / 10

2. SIMPLE LINEAR REGRESSION 12


2.1 Simple Linear Regression Model / 12
2.2 Least-Squares Estimation of the Parameters / 13
2.2.1 Estimation of β0 and β1 / 13
2.2.2 Properties of the Least-Squares Estimators
and the Fitted Regression Model / 18
2.2.3 Estimation of σ2 / 20
2.2.4 Alternate Form of the Model / 22
2.3 Hypothesis Testing on the Slope and Intercept / 22
2.3.1 Use of t Tests / 22
2.3.2 Testing Significance of Regression / 24
2.3.3 Analysis of Variance / 25
2.4 Interval Estimation in Simple Linear Regression / 29
2.4.1 Confidence Intervals on β0, β1, and σ 2 / 29
2.4.2 Interval Estimation of the Mean Response / 30
2.5 Prediction of New Observations / 33
v

ftoc.indd 5 01/30/2021 3.47.44 PM


vi  CONTENTS

2.6 Coefficient of Determination / 35


2.7 A Service Industry Application of Regression / 37
2.8 Does Pitching Win Baseball Games? / 39
2.9 Using SAS® and R for Simple Linear Regression / 41
2.10 Some Considerations in the Use of Regression / 44
2.11 Regression Through the Origin / 46
2.12 Estimation by Maximum Likelihood / 52
2.13 Case Where the Regressor x is Random / 53
2.13.1 x and y Jointly Distributed / 54
2.13.2 x and y Jointly Normally Distributed: Correlation Model / 54
Problems / 59

3. MULTIPLE LINEAR REGRESSION 69


3.1 Multiple Regression Models / 69
3.2 Estimation of the Model Parameters / 72
3.2.1 Least-Squares Estimation of the Regression
Coefficients / 72
3.2.2 Geometrical Interpretation of Least Squares / 79
3.2.3 Properties of the Least-Squares Estimators / 81
3.2.4 Estimation of σ2 / 82
3.2.5 Inadequacy of Scatter Diagrams in Multiple Regression / 84
3.2.6 Maximum-Likelihood Estimation / 85
3.3 Hypothesis Testing in Multiple Linear Regression / 86
3.3.1 Test for Significance of Regression / 86
3.3.2 Tests on Individual Regression Coefficients
and Subsets of Coefficients / 90
3.3.3 Special Case of Orthogonal Columns in X / 95
3.3.4 Testing the General Linear Hypothesis / 97
3.4 Confidence Intervals in Multiple Regression / 99
3.4.1 Confidence Intervals on the Regression Coefficients / 100
3.4.2 CI Estimation of the Mean Response / 101
3.4.3 Simultaneous Confidence Intervals on Regression
Coefficients / 102
3.5 Prediction of New Observations / 106
3.6 A Multiple Regression Model for the Patient Satisfaction Data / 106
3.7 Does Pitching and Defense Win Baseball Games? / 108
3.8 Using SAS and R for Basic Multiple Linear Regression / 110
3.9 Hidden Extrapolation in Multiple Regression / 111
3.10 Standardized Regression Coefficients / 115
3.11 Multicollinearity / 121
3.12 Why Do Regression Coefficients Have the Wrong Sign? / 123
Problems / 125

ftoc.indd 6 01/30/2021 3.47.44 PM


CONTENTS  vii

4. MODEL ADEQUACY CHECKING 134


4.1 Introduction / 134
4.2 Residual Analysis / 135
4.2.1 Definition of Residuals / 135
4.2.2 Methods for Scaling Residuals / 135
4.2.3 Residual Plots / 141
4.2.4 Partial Regression and Partial Residual Plots / 148
4.2.5 Using Minitab®, SAS, and R for Residual Analysis / 151
4.2.6 Other Residual Plotting and Analysis Methods / 154
4.3 PRESS Statistic / 156
4.4 Detection and Treatment of Outliers / 157
4.5 Lack of Fit of the Regression Model / 161
4.5.1 A Formal Test for Lack of Fit / 161
4.5.2 Estimation of Pure Error from Near Neighbors / 165
Problems / 170

5. TRANSFORMATIONS AND WEIGHTING


TO CORRECT MODEL INADEQUACIES 177
5.1 Introduction / 177
5.2 Variance-Stabilizing Transformations / 178
5.3 Transformations to Linearize the Model / 182
5.4 Analytical Methods for Selecting a Transformation / 188
5.4.1 Transformations on y: The Box–Cox Method / 188
5.4.2 Transformations on the Regressor Variables / 190
5.5 Generalized and Weighted Least Squares / 194
5.5.1 Generalized Least Squares / 194
5.5.2 Weighted Least Squares / 196
5.5.3 Some Practical Issues / 197
5.6 Regression Models with Random Effects / 200
5.6.1 Subsampling / 200
5.6.2 The General Situation for a Regression Model
with a Single Random Effect / 204
5.6.3 The Importance of the Mixed Model in Regression / 208
Problems / 208

6. DIAGNOSTICS FOR LEVERAGE AND INFLUENCE 217


6.1 Importance of Detecting Influential Observations / 217
6.2 Leverage / 218
6.3 Measures of Influence: Cook’s D / 221
6.4 Measures of Influence: DFFITS and DFBETAS / 223
6.5 A Measure of Model Performance / 225

ftoc.indd 7 01/30/2021 3.47.45 PM


viii  CONTENTS

6.6 Detecting Groups of Influential Observations / 226


6.7 Treatment of Influential Observations / 226
Problems / 227

7. POLYNOMIAL REGRESSION MODELS 230


7.1 Introduction / 230
7.2 Polynomial Models in One Variable / 230
7.2.1 Basic Principles / 230
7.2.2 Piecewise Polynomial Fitting (Splines) / 236
7.2.3 Polynomial and Trigonometric Terms / 242
7.3 Nonparametric Regression / 243
7.3.1 Kernel Regression / 244
7.3.2 Locally Weighted Regression (Loess) / 244
7.3.3 Final Cautions / 249
7.4 Polynomial Models in Two or More Variables / 249
7.5 Orthogonal Polynomials / 255
Problems / 261
8. INDICATOR VARIABLES 268
8.1 General Concept of Indicator Variables / 268
8.2 Comments on the Use of Indicator Variables / 281
8.2.1 Indicator Variables versus Regression on Allocated
Codes / 281
8.2.2 Indicator Variables as a Substitute for a Quantitative
Regressor / 282
8.3 Regression Approach to Analysis of Variance / 283
Problems / 288
9. MULTICOLLINEARITY 293
9.1 Introduction / 293
9.2 Sources of Multicollinearity / 294
9.3 Effects of Multicollinearity / 296
9.4 Multicollinearity Diagnostics / 300
9.4.1 Examination of the Correlation Matrix / 300
9.4.2 Variance Inflation Factors / 304
9.4.3 Eigensystem Analysis of XʹX / 305
9.4.4 Other Diagnostics / 310
9.4.5 SAS and R Code for Generating Multicollinearity
Diagnostics / 311
9.5 Methods for Dealing with Multicollinearity / 311
9.5.1 Collecting Additional Data / 311
9.5.2 Model Respecification / 312
9.5.3 Ridge Regression / 312

ftoc.indd 8 01/30/2021 3.47.45 PM


CONTENTS  ix

9.5.4 Principal-Component Regression / 329


9.5.5 Comparison and Evaluation of Biased Estimators / 334
9.6 Using SAS to Perform Ridge and Principal-Component
Regression / 336
Problems / 338

10. VARIABLE SELECTION AND MODEL BUILDING 342


10.1 Introduction / 342
10.1.1 Model-Building Problem / 342
10.1.2 Consequences of Model Misspecification / 344
10.1.3 Criteria for Evaluating Subset Regression Models / 347
10.2 Computational Techniques for Variable Selection / 353
10.2.1 All Possible Regressions / 353
10.2.2 Stepwise Regression Methods / 359
10.3 Strategy for Variable Selection and Model Building / 367
10.4 Case Study: Gorman and Toman Asphalt Data Using SAS / 370
Problems / 383

11. VALIDATION OF REGRESSION MODELS 388


11.1 Introduction / 388
11.2 Validation Techniques / 389
11.2.1 Analysis of Model Coefficients and Predicted Values / 389
11.2.2 Collecting Fresh Data—Confirmation Runs / 391
11.2.3 Data Splitting / 393
11.3 Data from Planned Experiments / 401
Problems / 402

12. INTRODUCTION TO NONLINEAR REGRESSION 405


12.1 Linear and Nonlinear Regression Models / 405
12.1.1 Linear Regression Models / 405
12.1.2 Nonlinear Regression Models / 406
12.2 Origins of Nonlinear Models / 407
12.3 Nonlinear Least Squares / 411
12.4 Transformation to a Linear Model / 413
12.5 Parameter Estimation in a Nonlinear System / 416
12.5.1 Linearization / 416
12.5.2 Other Parameter Estimation Methods / 423
12.5.3 Starting Values / 424
12.6 Statistical Inference in Nonlinear Regression / 425
12.7 Examples of Nonlinear Regression Models / 427
12.8 Using SAS and R / 428
Problems / 432

ftoc.indd 9 01/30/2021 3.47.45 PM


x  CONTENTS

13. GENERALIZED LINEAR MODELS 440


13.1 Introduction / 440
13.2 Logistic Regression Models / 441
13.2.1 Models with a Binary Response Variable / 441
13.2.2 Estimating the Parameters in a Logistic
Regression Model / 442
13.2.3 Interpretation of the Parameters in
a Logistic Regression Model / 447
13.2.4 Statistical Inference on Model
Parameters / 449
13.2.5 Diagnostic Checking in Logistic
Regression / 459
13.2.6 Other Models for Binary
Response Data / 461
13.2.7 More Than Two Categorical Outcomes / 461
13.3 Poisson Regression / 463
13.4 The Generalized Linear Model / 469
13.4.1 Link Functions and Linear Predictors / 470
13.4.2 Parameter Estimation and Inference
in the GLM / 471
13.4.3 Prediction and Estimation with the GLM / 473
13.4.4 Residual Analysis in the GLM / 475
13.4.5 Using R to Perform GLM Analysis / 477
13.4.6 Overdispersion / 480
Problems / 481

14. REGRESSION ANALYSIS OF TIME SERIES DATA 495


14.1 Introduction to Regression Models for
Time Series Data / 495
14.2 Detecting Autocorrelation: The Durbin–Watson
Test / 496
14.3 Estimating the Parameters in Time Series Regression
Models / 501
Problems / 517

15. OTHER TOPICS IN THE USE OF REGRESSION ANALYSIS 521


15.1 Robust Regression / 521
15.1.1 Need for Robust Regression / 521
15.1.2 M-Estimators / 524
15.1.3 Properties of Robust Estimators / 531

ftoc.indd 10 01/30/2021 3.47.45 PM


CONTENTS  xi

15.2 Effect of Measurement Errors in the Regressors / 532


15.2.1 Simple Linear Regression / 532
15.2.2 The Berkson Model / 534
15.3 Inverse Estimation—The Calibration Problem / 534
15.4 Bootstrapping in Regression / 538
15.4.1 Bootstrap Sampling in Regression / 539
15.4.2 Bootstrap Confidence Intervals / 540
15.5 Classification and Regression Trees (CART) / 545
15.6 Neural Networks / 547
15.7 Designed Experiments for Regression / 549
Problems / 557

APPENDIX A. STATISTICAL TABLES 561

APPENDIX B. DATA SETS FOR EXERCISES 573

APPENDIX C. SUPPLEMENTAL TECHNICAL MATERIAL 602


C.1 Background on Basic Test Statistics / 602
C.2 Background from the Theory of Linear Models / 605
C.3 Important Results on SSR and SSRes / 609
C.4 Gauss-Markov Theorem, Var(ε) = σ2I / 615
C.5 Computational Aspects of Multiple Regression / 617
C.6 Result on the Inverse of a Matrix / 618
C.7 Development of the PRESS Statistic / 619
2
C.8 Development of S(i) / 621
C.9 Outlier Test Based on R-Student / 622
C.10 Independence of Residuals and Fitted Values / 624
C.11 Gauss–Markov Theorem, Var(ε) = V / 625
C.12 Bias in MSRes When the Model Is Underspecified / 627
C.13 Computation of Influence Diagnostics / 628
C.14 Generalized Linear Models / 629

APPENDIX D. INTRODUCTION TO SAS 641


D.1 Basic Data Entry / 642
D.2 Creating Permanent SAS Data Sets / 646
D.3 Importing Data from an EXCEL File / 647
D.4 Output Command / 648
D.5 Log File / 648
D.6 Adding Variables to an Existing SAS Data Set / 650

ftoc.indd 11 01/30/2021 3.47.45 PM


xii  CONTENTS

APPENDIX E. INTRODUCTION TO R TO PERFORM LINEAR


REGRESSION ANALYSIS 651
E.1 Basic Background on R / 651
E.2 Basic Data Entry / 652
E.3 Brief Comments on Other Functionality in R / 654
E.4 R Commander / 655

REFERENCES 656
INDEX 670

ftoc.indd 12 01/30/2021 3.47.45 PM


PREFACE

Regression analysis is one of the most widely used techniques for analyzing multi-
factor data. Its broad appeal and usefulness result from the conceptually logical
process of using an equation to express the relationship between a variable of inter-
est (the response) and a set of related predictor variables. Regression analysis is also
interesting theoretically because of elegant underlying mathematics and a well-
developed statistical theory. Successful use of regression requires an appreciation of
both the theory and the practical problems that typically arise when the technique
is employed with real-world data.
This book is intended as a text for a basic course in regression analysis. It contains
the standard topics for such courses and many of the newer ones as well. It blends both
theory and application so that the reader will gain an understanding of the basic prin-
ciples necessary to apply regression model-building techniques in a wide variety of
application environments. The book began as an outgrowth of notes for a course in
regression analysis taken by seniors and first-year graduate students in various fields of
engineering, the chemical and physical sciences, statistics, mathematics, and manage-
ment. We have also used the material in many seminars and industrial short courses for
professional audiences. We assume that the reader has taken a first course in statistics
and has familiarity with hypothesis tests and confidence intervals and the normal, t, χ2,
and F distributions. Some knowledge of matrix algebra is also necessary.
The computer plays a significant role in the modern application of regression.
Today even spreadsheet software has the capability to fit regression equations by
least squares. Consequently, we have integrated many aspects of computer usage
into the text, including displays of both tabular and graphical output, and general
discussions of capabilities of some software packages. We use Minitab®, JMP®,
SAS®, and R for various problems and examples in the text. We selected these
packages because they are widely used both in practice and in teaching regression
and they have good regression. Many of the homework problems require software
for their solution. All data sets in the book are available in electronic form from the
xiii

fpref.indd 13 01/30/2021 3.47.33 PM


xiv  PREFACE

publisher. The ftp site ftp://ftp.wiley.com/public/sci_tech_med/introduction_linear_


regression hosts the data, problem solutions, PowerPoint files, and other material
related to the book.

CHANGES IN THE SIXTH EDITION

We have made a number of changes in this edition of the book. This includes the
reorganization of text material, new examples, new exercises, and new material on
a variety of topics. Our objective was to make the book more useful as both a text
and a reference and to update our treatment of certain topics.
Chapter 1 is a general introduction to regression modeling and describes some typical
applications of regression. Chapters 2 and 3 provide the standard results for least-
squares model fitting in simple and multiple regression, along with basic inference
procedures (tests of hypotheses, confidence and prediction intervals). Chapter 4 dis-
cusses some introductory aspects of model adequacy checking, including residual analy-
sis and a strong emphasis on residual plots, detection and treatment of outliers, the
PRESS statistic, and testing for lack of fit. Chapter 5 discusses how transformations and
weighted least squares can be used to resolve problems of model inadequacy or to deal
with violations of the basic regression assumptions. Both the Box–Cox and Box–Tidwell
techniques for analytically specifying the form of a transformation are introduced. Influ-
ence diagnostics are presented in Chapter 6, along with an introductory discussion of
how to deal with influential observations. Polynomial regression models and their varia-
tions are discussed in Chapter 7. Topics include the basic procedures for fitting and
inference for polynomials and discussion of centering in polynomials, hierarchy, piece-
wise polynomials, models with both polynomial and trigonometric terms, orthogonal
polynomials, an overview of response surfaces, and an introduction to nonparametric
and smoothing regression techniques. Chapter 8 introduces indicator variables and also
makes the connection between regression and analysis-of-variance models. Chapter 9
focuses on the multicollinearity problem. Included are discussions of the sources of
multicollinearity, its harmful effects, diagnostics, and various remedial measures. We
introduce biased estimation, including ridge regression and some of its variations and
principal-component regression.Variable selection and model-building techniques are
developed in Chapter 10, including stepwise procedures and all-possible-regressions. We
also discuss and illustrate several criteria for the evaluation of subset regression models.
Chapter 11 presents a collection of techniques useful for regression model validation.
The first 11 chapters are the nucleus of the book. Many of the concepts and
examples flow across these chapters. The remaining four chapters cover a variety of
topics that are important to the practitioner of regression, and they can be read
independently. Chapter 12 in introduces nonlinear regression, and Chapter 13 is a
basic treatment of generalized linear models. While these are perhaps not standard
topics for a linear regression textbook, they are so important to students and profes-
sionals in engineering and the sciences that we would have been seriously remiss
without giving an introduction to them. Chapter 14 covers regression models for
time series data. Chapter 15 includes a survey of several important topics, including
robust regression, the effect of measurement errors in the regressors, the inverse
estimation or calibration problem, bootstrapping regression estimates, classification
and regression trees, neural networks, and designed experiments for regression.
In addition to the text material, Appendix C contains brief presentations of some
additional topics of a more technical or theoretical nature. Some of these topics will

fpref.indd 14 01/30/2021 3.47.33 PM


PREFACE  xv

be of interest to specialists in regression or to instructors teaching a more advanced


course from the book. Computing plays an important role in many regression
courses. Mintab, JMP, SAS, and R are widely used in regression courses. Outputs
from all of these packages are provided in the text. Appendix D is an introduction
to using SAS for regression problems. Appendix E is an introduction to R.

USING THE BOOK AS A TEXT

Because of the broad scope of topics, this book has great flexibility as a text. For a
first course in regression, we would recommend covering Chapters 1 through 10 in
detail and then selecting topics that are of specific interest to the audience. For
example, one of the authors (D.C.M.) regularly teaches a course in regression to an
engineering audience. Topics for that audience include nonlinear regression (because
mechanistic models that are almost always nonlinear occur often in engineering), a
discussion of neural networks, and regression model validation. Other topics that
we would recommend for consideration are multicollinearity (because the problem
occurs so often) and an introduction to generalized linear models focusing mostly
on logistic regression. G.G.V. has taught a regression course for graduate students
in statistics that makes extensive use of the Appendix C material.
We believe the computer should be directly integrated into the course. In recent
years, we have taken a notebook computer and computer projector to most classes
and illustrated the techniques as they are introduced in the lecture. We have found
that this greatly facilitates student understanding and appreciation of the tech-
niques. We also require that the students use regression software for solving the
homework problems. In most cases, the problems use real data or are based on
real-world settings that represent typical applications of regression.
There is an instructor’s manual that contains solutions to all exercises, electronic
versions of all data sets, and questions/problems that might be suitable for use on
examinations.

ACKNOWLEDGMENTS

We would like to thank all the individuals who provided helpful feedback and
assistance in the preparation of this book. Dr. Scott M. Kowalski, Dr. Ronald G.
Askin, Dr. Mary Sue Younger, Dr. Russell G. Heikes, Dr. John A. Cornell, Dr. André
I. Khuri, Dr. George C. Runger, Dr. Marie Gaudard, Dr. James W. Wisnowski, Dr.
Ray Hill, and Dr. James R. Simpson made many suggestions that greatly improved
both earlier editions and this fifth edition of the book. We particularly appreciate
the many graduate students and professional practitioners who provided feedback,
often in the form of penetrating questions, that led to rewriting or expansion of
material in the book. We are also indebted to John Wiley & Sons, the American
Statistical Association, and the Biometrika Trustees for permission to use copy-
righted material.

Douglas C. Montgomery
Elizabeth A. Peck
G. Geoffrey Vining

fpref.indd 15 01/30/2021 3.47.33 PM


ABOUT THE COMPANION WEBSITE

This book is accompanied by an instructor companion website and a student


companion website:

www.wiley.com/go/montgomery/introlinearregression6e

The instructor site includes PowerPoint slides to facilitate instructional use of the
book.
The student site includes data sets.

xvi

flast.indd 16 01/30/2021 3.47.21 PM


CHAPTER 1

INTRODUCTION

1.1 REGRESSION AND MODEL BUILDING

Regression analysis is a statistical technique for investigating and modeling the


relationship between variables. Applications of regression are numerous and occur
in almost every field, including engineering, the physical and chemical sciences,
economics, management, life and biological sciences, and the social sciences. Regres-
sion analysis is used extensively in data mining and is a basic tool of data science
and analytics. Because of its wide applicability to a range of problems, regression
analysis may be the most widely used statistical technique.
As an example of a problem in which regression analysis may be helpful, suppose
that an industrial engineer employed by a soft drink beverage bottler is analyzing
the product delivery and service operations for vending machines. He suspects that
the time required by a route deliveryman to load and service a machine is related
to the number of cases of product delivered. The engineer visits 25 randomly chosen
retail outlets having vending machines, and the in-outlet delivery time (in minutes)
and the volume of product delivered (in cases) are observed for each. The 25 obser-
vations are plotted in Figure 1.1a. This graph is called a scatter diagram. This display
clearly suggests a relationship between delivery time and delivery volume; in fact,
the impression is that the data points generally, but not exactly, fall along a straight
line. Figure 1.1b illustrates this straight-line relationship.
If we let y represent delivery time and x represent delivery volume, then the
equation of a straight line relating these two variables is

y 0 1x (1.1)

Introduction to Linear Regression Analysis, Sixth Edition. Douglas C. Montgomery, Elizabeth A. Peck,
and G. Geoffrey Vining.
© 2021 John Wiley & Sons, Inc. Published 2021 by John Wiley & Sons, Inc.
Companion website: www.wiley.com/go/montgomery/introlinearregression6e

c01.indd 1 30-01-2021 14:20:27


2  INTRODUCTION

80 80

70 70

60 60

Delivery time, y
Delivery time, y

50 50

40 40

30 30

20 20

10 10

0 0
0 10 20 30 0 10 20 30
Delivery volume, x Delivery volume, x
(a) (b)
Figure 1.1 (a) Scatter diagram for delivery volume. (b) Straight-line relationship between
delivery time and delivery volume.

where β0 is the intercept and β1 is the slope. Now the data points do not fall
exactly on a straight line, so Eq. (1.1) should be modified to account for this. Let the
difference between the observed value of y and the straight line (β0 + β1x) be an
error ε. It is convenient to think of ε as a statistical error; that is, it is a random vari-
able that accounts for the failure of the model to fit the data exactly. The error may
be made up of the effects of other variables on delivery time, measurement errors,
and so forth. Thus, a more plausible model for the delivery time data is

y 0 1x (1.2)

Equation (1.2) is called a linear regression model. Customarily x is called the inde-
pendent variable and y is called the dependent variable. However, this often causes
confusion with the concept of statistical independence, so we refer to x as the pre-
dictor or regressor variable and y as the response variable. Because Eq. (1.2) involves
only one regressor variable, it is called a simple linear regression model.
To gain some additional insight into the linear regression model, suppose that we
can fix the value of the regressor variable x and observe the corresponding value of
the response y. Now if x is fixed, the random component ε on the right-hand side of
Eq. (1.2) determines the properties of y. Suppose that the mean and variance of ε are
0 and σ2, respectively. Then the mean response at any value of the regressor variable is

E y|x y| x E 0 1x 0 1x

Notice that this is the same relationship that we initially wrote down following inspec-
tion of the scatter diagram in Figure 1.1a. The variance of y given any value of x is

2 2
Var y | x y| x Var 0 1x

Thus, the true regression model μy|x = β0 + β1x is a line of mean values, that is, the
height of the regression line at any value of x is just the expected value of y for that

c01.indd 2 30-01-2021 14:20:32


Regression and Model Building  3

Observed values of y
for a given x
are sampled from Observed value
these distributions of y

N (0, σ2 = 2) μy|x Straight–line


approximation
y
True relationship

N (0, σ2 = 2)

Observed value of y

10 20 30 x x
Figure 1.2 How observations are generated Figure 1.3 Linear regression
in linear regression. approximation of a complex relationship.

x. The slope, β1 can be interpreted as the change in the mean of y for a unit change in
x. Furthermore, the variability of y at a particular value of x is determined by the vari-
ance of the error component of the model, σ2. This implies that there is a distribution
of y values at each x and that the variance of this distribution is the same at each x.
For example, suppose that the true regression model relating delivery time to
delivery volume is μy|x = 3.5 + 2x, and suppose that the variance is σ 2 = 2. Figure 1.2
illustrates this situation. Notice that we have used a normal distribution to describe
the random variation in ε. Since y is the sum of a constant β0 + β1x (the mean) and
a normally distributed random variable, y is a normally distributed random variable.
For example, if x = 10 cases, then delivery time y has a normal distribution with
mean 3.5 + 2(10) = 23.5 minutes and variance 2. The variance σ 2 determines the
amount of variability or noise in the observations y on delivery time. When σ 2 is
small, the observed values of delivery time will fall close to the line, and when σ 2 is
large, the observed values of delivery time may deviate considerably from the line.
In almost all applications of regression, the regression equation is only an approx-
imation to the true functional relationship between the variables of interest. These
functional relationships are often based on physical, chemical, or other engineering
or scientific theory, that is, knowledge of the underlying mechanism. Consequently,
these types of models are often called mechanistic models. For example, the familiar
physics equation momentum = mass × velocity is a mechanistic model.
Regression models, on the other hand, are thought of as empirical models. Figure
1.3 illustrates a situation where the true relationship between y and x is relatively
complex, yet it may be approximated quite well by a linear regression equation.
Sometimes the underlying mechanism is more complex, resulting in the need for a
more complex approximating function, as in Figure 1.4, where a “piecewise linear”
regression function is used to approximate the true relationship between y and x.
Generally regression equations are valid only over the region of the regressor
variables contained in the observed data. For example, consider Figure 1.5. Suppose
that data on y and x were collected in the interval x1 ≤ x ≤ x2. Over this interval the

c01.indd 3 30-01-2021 14:20:33


4  INTRODUCTION

True relationship
y
Piecewise linear
regression
y approximation

x1 x2 x3
x x
Figure 1.4 Piecewise linear Figure 1.5 The danger of extrapolation
approximation of a complex relationship. in regression.

linear regression equation shown in Figure 1.5 is a good approximation of the true
relationship. However, suppose this equation were used to predict values of y for
values of the regressor variable in the region x2 ≤ x ≤ x3. Clearly the linear regres-
sion model is not going to perform well over this range of x because of model error
or equation error.
In general, the response variable y may be related to k regressors, x1, x2, . . . , xk,
so that

y 0 1 x1 2 x2  k xk (1.3)

This is called a multiple linear regression model because more than one regressor
is involved. The adjective linear is employed to indicate that the model is linear in
the parameters β0, β1, . . . , βk, not because y is a linear function of the x’s. We shall
see subsequently that many models in which y is related to the x’s in a nonlinear
fashion can still be treated as linear regression models as long as the equation is
linear in the β’s.
An important objective of regression analysis is to estimate the unknown param-
eters in the regression model. This process is also called fitting the model to the data.
We study several parameter estimation techniques in this book. One of these tech-
mques is the method of least squares (introduced in Chapter 2). For example, the
least-squares fit to the delivery time data is

yˆ 3.321 2.1762 x

where ŷ is the fitted or estimated value of delivery time corresponding to a delivery


volume of x cases. This fitted equation is plotted in Figure 1.1b.
The next phase of a regression analysis is called model adequacy checking, in
which the appropriateness of the model is studied and the quality of the fit ascer-
tained. Through such analyses the usefulness of the regression model may be deter-
mined. The outcome of adequacy checking may indicate either that the model is
reasonable or that the original fit must be modified. Thus, regression analysis is an
iterative procedure, in which data lead to a model and a fit of the model to the data
is produced. The quality of the fit is then investigated, leading either to modification

c01.indd 4 30-01-2021 14:20:38


Data Collection  5

of the model or the fit or to adoption of the model. This process is illustrated several
times in subsequent chapters.
A regression model does not imply a cause-and-effect relationship between the
variables. Even though a strong empirical relationship may exist between two or
more variables, this cannot be considered evidence that the regressor variables and
the response are related in a cause-and-effect manner. To establish causality, the
relationship between the regressors and the response must have a basis outside the
sample data—for example, the relationship may be suggested by theoretical consid-
erations. Regression analysis can aid in confirming a cause-and-effect relationship,
but it cannot be the sole basis of such a claim.
Finally it is important to remember that regression analysis is part of a broader
data-analytic approach to problem solving. That is, the regression equation itself
may not be the primary objective of the study. It is usually more important to gain
insight and understanding concerning the system generating the data.

1.2 DATA COLLECTION

An essential aspect of regression analysis is data collection. Any regression analysis


is only as good as the data on which it is based. Three basic methods for collecting
data are as follows:

• A retrospective study based on historical data


• An observational study
• A designed experiment

A good data collection scheme can ensure a simplified and a generally more appli-
cable model. A poor data collection scheme can result in serious problems for the
analysis and its interpretation. The following example illustrates these three methods.

Example 1.1

Consider the acetone–butyl alcohol distillation column shown in Figure 1.6. The
operating personnel are interested in the concentration of acetone in the distillate
(product) stream. Factors that may influence this are the reboil temperature, the
condensate temperature, and the reflux rate. For this column, operating personnel
maintain and archive the following records:

• The concentration of acetone in a test sample taken every hour from the
product stream
• The reboil temperature controller log, which is a plot of the reboil
temperature
• The condenser temperature controller log
• The nominal reflux rate each hour

The nominal reflux rate is supposed to be constant for this process. Only infre-
quently does production change this rate. We now discuss how the three different
data collection strategies listed above could be applied to this process.  ■

c01.indd 5 30-01-2021 14:20:38


6  INTRODUCTION

Condenser
Coolant

50

45 Distillate
Trays Reflux
40

35

30

25
Sidedraw
20

Feed 15

10
Trays
5

Reboiler
Steam

Bottoms

Figure 1.6 Acetone–butyl alcohol distillation column.

Retrospective Study We could pursue a retrospective study that would use either
all or a sample of the historical process data over some period of time to determine
the relationships among the two temperatures and the reflux rate on the acetone
concentration in the product stream. In so doing, we take advantage of previously
collected data and minimize the cost of the study. However, there are several
problems:

1. We really cannot see the effect of reflux on the concentration since we must
assume that it did not vary much over the historical period.
2. The data relating the two temperatures to the acetone concentration do not
correspond directly. Constructing an approximate correspondence usually
requires a great deal of effort.
3. Production controls temperatures as tightly as possible to specific target values
through the use of automatic controllers. Since the two temperatures vary so
little over time, we will have a great deal of difficulty seeing their real impact
on the concentration.
4. Within the narrow ranges that they do vary, the condensate temperature tends
to increase with the reboil temperature. As a result, we will have a great deal

c01.indd 6 30-01-2021 14:20:38


Data Collection  7

of difficulty separating out the individual effects of the two temperatures. This
leads to the problem of collinearity or multicollinearity, which we discuss in
Chapter 9.

Retrospective studies often offer limited amounts of useful information. In


general, their primary disadvantages are as follows:

• Some of the relevant data often are missing.


• The reliability and quality of the data are often highly questionable.
• The nature of the data often may not allow us to address the problem at hand.
• The analyst often tries to use the data in ways they were never intended to be
used.
• Logs, notebooks, and memories may not explain interesting phenomena identi-
fied by the data analysis.

Using historical data always involves the risk that, for whatever reason, some of
the data were not recorded or were lost. Typically, historical data consist of informa-
tion considered critical and of information that is convenient to collect. The conve-
nient information is often collected with great care and accuracy. The essential
information often is not. Consequently, historical data often suffer from transcrip-
tion errors and other problems with data quality. These errors make historical data
prone to outliers, or observations that are very different from the bulk of the data.
A regression analysis is only as reliable as the data on which it is based.
Just because data are convenient to collect does not mean that these data are
particularly useful. Often, data not considered essential for routine process monitor-
ing and not convenient to collect do have a significant impact on the process. His-
torical data cannot provide this information since they were never collected. For
example, the ambient temperature may impact the heat losses from our distillation
column. On cold days, the column loses more heat to the environment than during
very warm days. The production logs for this acetone–butyl alcohol column do not
record the ambient temperature. As a result, historical data do not allow the analyst
to include this factor in the analysis even though it may have some importance.
In some cases, we try to use data that were collected as surrogates for what we
really needed to collect. The resulting analysis is informative only to the extent that
these surrogates really reflect what they represent. For example, the nature of the
inlet mixture of acetone and butyl alcohol can significantly affect the column’s per-
formance. The column was designed for the feed to be a saturated liquid (at the
mixture’s boiling point). The production logs record the feed temperature but do
not record the specific concentrations of acetone and butyl alcohol in the feed
stream. Those concentrations are too hard to obtain on a regular basis. In this case,
inlet temperature is a surrogate for the nature of the inlet mixture. It is perfectly
possible for the feed to be at the correct specific temperature and the inlet feed to
be either a subcooled liquid or a mixture of liquid and vapor.
In some cases, the data collected most casually, and thus with the lowest quality,
the least accuracy, and the least reliability, turn out to be very influential for explain-
ing our response. This influence may be real, or it may be an artifact related to the
inaccuracies in the data. Too many analyses reach invalid conclusions because they

c01.indd 7 30-01-2021 14:20:38


8  INTRODUCTION

lend too much credence to data that were never meant to be used for the strict
purposes of analysis.
Finally, the primary purpose of many analyses is to isolate the root causes under-
lying interesting phenomena. With historical data, these interesting phenomena may
have occurred months or years before. Logs and notebooks often provide no sig-
nificant insights into these root causes, and memories clearly begin to fade over time.
Too often, analyses based on historical data identify interesting phenomena that go
unexplained.

Observational Study We could use an observational study to collect data for this
problem. As the name implies, an observational study simply observes the process
or population. We interact or disturb the process only as much as is required to
obtain relevant data. With proper planning, these studies can ensure accurate, com-
plete, and reliable data. On the other hand, these studies often provide very limited
information about specific relationships among the data.
In this example, we would set up a data collection form that would allow the
production personnel to record the two temperatures and the actual reflux rate at
specified times corresponding to the observed concentration of acetone in the
product stream. The data collection form should provide the ability to add com-
ments in order to record any interesting phenomena that may occur. Such a proce-
dure would ensure accurate and reliable data collection and would take care of
problems 1 and 2 above. This approach also minimizes the chances of observing an
outlier related to some error in the data. Unfortunately, an observational study
cannot address problems 3 and 4. As a result, observational studies can lend them-
selves to problems with collinearity.

Designed Experiment The best data collection strategy for this problem uses a
designed experiment where we would manipulate the two temperatures and the
reflux ratio, which we would call the factors, according to a well-defined strategy,
called the experimental design. This strategy must ensure that we can separate out
the effects on the acetone concentration related to each factor. In the process, we
eliminate any collinearity problems. The specified values of the factors used in the
experiment are called the levels. Typically, we use a small number of levels for each
factor, such as two or three. For the distillation column example, suppose we use a
“high” or +1 and a “low” or −1 level for each of the factors. We thus would use
two levels for each of the three factors. A treatment combination is a specific com-
bination of the levels of each factor. Each time we carry out a treatment combina-
tion is an experimental run or setting. The experimental design or plan consists of
a series of runs.
For the distillation example, a very reasonable experimental strategy uses
every possible treatment combination to form a basic experiment with eight differ-
ent settings for the process. Table 1.1 presents these combinations of high and low
levels. This experimental arrangement is called a factorial design.
Figure 1.7 illustrates that this factorial design forms a cube in terms of these high
and low levels. With each setting of the process conditions, we allow the column to
reach equilibrium, take a sample of the product stream, and determine the acetone
concentration. We then can draw specific inferences about the effect of these factors.
Such an approach allows us to proactively study a population or process.

c01.indd 8 30-01-2021 14:20:38


Uses of Regression  9

TABLE 1.1 Designed Experiment


for the Distillation Column
Reboil Condensate Reflux
+1 te
Temperature Temperature Rate sa

Reflux
en p. +1

Rate
d
n em
−1 −1 −1 Co–1 T
–1
+1 −1 −1
−1 +1 −1 –1 Reboil +1
+1 +1 −1 Temp.

−1 −1 +1
+1 −1 +1 Figure 1.7 The designed experiment for the
−1 +1 +1 distillation column.
+1 +1 +1

1.3 USES OF REGRESSION

Regression models are used for several purposes, including the following:

1. Data description
2. Parameter estimation
3. Prediction and estimation
4. Control

Engineers and scientists frequently use equations to summarize or describe a set of


data. Regression analysis is helpful in developing such equations. For example, we
may collect a considerable amount of delivery time and delivery volume data, and
a regression model would probably be a much more convenient and useful summary
of those data than a table or even a graph.
Sometimes parameter estimation problems can be solved by regression methods.
For example, chemical engineers use the Michaelis–Menten equation y = β1x/
(x + β2) + ε to describe the relationship between the velocity of reaction y and
concentration x. Now in this model, β1 is the asymptotic velocity of the reaction, that
is, the maximum velocity as the concentration gets large. If a sample of observed
values of velocity at different concentrations is available, then the engineer can use
regression analysis to fit this model to the data, producing an estimate of the
maximum velocity. We show how to fit regression models of this type in Chapter 12.
Many applications of regression involve prediction of the response variable. For
example, we may wish to predict delivery time for a specified number of cases of
soft drinks to be delivered. These predictions may be helpful in planning delivery
activities such as routing and scheduling or in evaluating the productivity of delivery
operations. The dangers of extrapolation when using a regression model for predic-
tion because of model or equation error have been discussed previously (see Figure
1.5). However, even when the model form is correct, poor estimates of the model
parameters may still cause poor prediction performance.
Regression models may be used for control purposes. For example, a chemical
engineer could use regression analysis to develop a model relating the tensile
strength of paper to the hardwood concentration in the pulp. This equation could

c01.indd 9 30-01-2021 14:20:39


10  INTRODUCTION

then be used to control the strength to suitable values by varying the level of hard-
wood concentration. When a regression equation is used for control purposes, it is
important that the variables be related in a causal manner. Note that a cause-and-
effect relationship may not be necessary if the equation is to be used only for pre-
diction. In this case it is only necessary that the relationships that existed in the
original data used to build the regression equation are still valid. For example, the
daily electricity consumption during August in Atlanta, Georgia, may be a good
predictor for the maximum daily temperature in August. However, any attempt to
reduce the maximum temperature by curtailing electricity consumption is clearly
doomed to failure.

1.4 ROLE OF THE COMPUTER

Building a regression model is an iterative process. The model-building process is


illustrated in Figure 1.8. It begins by using any theoretical knowledge of the process
that is being studied and available data to specify an initial regression model.
Graphical data displays are often very useful in specifying the initial model. Then
the parameters of the model are estimated, typically by either least squares or
maximum likelihood. These procedures are discussed extensively in the text. Then
model adequacy must be evaluated. This consists of looking for potential misspecifi-
cation of the model form, failure to include important variables, including unneces-
sary variables, or unusual/inappropriate data. If the model is inadequate, then
adjustments must be made and the parameters estimated again. This process may
be repeated several times until an adequate model is obtained. Finally, model valida-
tion should be carried out to ensure that the model will produce results that are
acceptable in the final application.
A good regression computer program is a necessary tool in the model-building
process. However, the routine application of standard regression computer pro-
grams often does not lead to successful results. The computer is not a substitute
for creative thinking about the problem. Regression analysis requires the intelligent
and artful use of the computer. We must learn how to interpret what the computer
is telling us and how to incorporate that information in subsequent models. Gener-
ally, regression computer programs are part of more general statistics software
packages, such as Minitab, SAS, JMP, and R. We discuss and illustrate the use of

No No
Data

Yes Model Yes Model Yes Model


Model Parameter adequacy
specification estimation validation use
checking

Theory

Figure 1.8 Regression model-building process.

c01.indd 10 30-01-2021 14:20:39


Role of the Computer  11

these packages throughout the book. Appendix D contains details of the SAS pro-
cedures typically used in regression modeling along with basic instructions for their
use. Appendix E provides a brief introduction to the R statistical software package.
We present R code for doing analyses throughout the text. Without these skills, it
is virtually impossible to successfully build a regression model.

c01.indd 11 30-01-2021 14:20:39


CHAPTER 2

SIMPLE LINEAR REGRESSION

2.1 SIMPLE LINEAR REGRESSION MODEL

This chapter considers the simple linear regression model, that is, a model with a
single regressor x that has a relationship with a response y that is a straight line. This
simple linear regression model is

y 0 1x (2.1)

where the intercept β0 and the slope β1 are unknown constants and ε is a random
error component. The errors are assumed to have mean zero and unknown variance
σ 2. Additionally we usually assume that the errors are uncorrelated. This means that
the value of one error does not depend on the value of any other error.
It is convenient to view the regressor x as controlled by the data analyst and
measured with negligible error, while the response y is a random variable. That is,
there is a probability distribution for y at each possible value for x. The mean of
this distribution is

E yx 0 1x (2.2a)

and the variance is


2
Var y x Var 0 1x (2.2b)

Introduction to Linear Regression Analysis, Sixth Edition. Douglas C. Montgomery, Elizabeth A. Peck,
and G. Geoffrey Vining.
© 2021 John Wiley & Sons, Inc. Published 2021 by John Wiley & Sons, Inc.
Companion website: www.wiley.com/go/montgomery/introlinearregression6e

12

c02.indd 12 30-01-2021 14:25:29


Least-Squares Estimation of the Parameters  13

Thus, the mean of y is a linear function of x although the variance of y does not
depend on the value of x. Furthermore, because the errors are uncorrelated, the
responses are also uncorrelated.
The parameters β0 and β1 are usually called regression coefficients. These coef-
ficients have a simple and often useful interpretation. The slope β1 is the change in
the mean of the distribution of y produced by a unit change in x. If the range of
data on x includes x = 0, then the intercept β0 is the mean of the distribution of the
response y when x = 0. If the range of x does not include zero, then β0 has no practi-
cal interpretation.

2.2 LEAST-SQUARES ESTIMATION OF THE PARAMETERS

The parameters β0 and β1 are unknown and must be estimated using sample data.
Suppose that we have n pairs of data, say (y1, x1), (y2, x2), . . . , (yn, xn). As noted in
Chapter 1, these data may result either from a controlled experiment designed
specifically to collect the data, from an observational study, or from existing histori-
cal records (a retrospective study).

2.2.1 Estimation of β0 and β1


The method of least squares is used to estimate β0 and β1. That is, we estimate β0
and β1 so that the sum of the squares of the differences between the observations
yi and the straight line is a minimum. From Eq. (2.1) we may write

yi 0 1 xi i, i 1, 2,  , n (2.3)

Equation (2.1) maybe viewed as a population regression model while Eq.


(2.3) is a sample regression model, written in terms of the n pairs of data (yi, xi)
(i = 1, 2, . . . , n). Thus, the least-squares criterion is

n
2
S 0, 1 yi 0 1 xi (2.4)
i 1

The least-squares estimators of β0 and β1, say ˆ0 and ˆ1, must satisfy

n
S ˆ0 ˆ1 xi
2 yi 0
0 ˆ0, ˆ1 i 1

and

n
S ˆ0 ˆ1 xi xi
2 yi 0
1 ˆ0, ˆ1 i 1

c02.indd 13 30-01-2021 14:25:40


14  SIMPLE LINEAR REGRESSION

Simplifying these two equations yields


n n
n ˆ0 ˆ1 xi yi
i 1 i 1
n n n
ˆ0 xi ˆ1 xi2 yi xi (2.5)
i 1 i 1 i 1

Equations (2.5) are called the least-squares normal equations. The solution to the
normal equations is

ˆ0 y ˆ1 x (2.6)

and

n n

n
yi xi
i 1 i 1
yi xi
ˆ1 i 1 n (2.7)
n 2

n
xi
i 1
xi2
i 1 n

where

1 n 1 n
y yi and x xi
ni 1 ni 1

are the averages of yi and xi, respectively. Therefore, ˆ0 and ˆ1 in Eqs. (2.6) and (2.7)
are the least-squares estimators of the intercept and slope, respectively. The fitted
simple linear regression model is then

yˆ ˆ0 ˆ1 x (2.8)

Equation (2.8) gives a point estimate of the mean of y for a particular x.


Since the denominator of Eq. (2.7) is the corrected sum of squares of the xi and
the numerator is the corrected sum of cross products of xi and yi, we may write these
quantities in a more compact notation as

n 2

n
xi n
i 1 2
Sxx xi2 xi x (2.9)
i 1 n i 1

and

n n

n
yi xi n
i 1 i 1
Sxy yi xi yi xi x (2.10)
i 1 n i 1

c02.indd 14 30-01-2021 14:25:53


Least-Squares Estimation of the Parameters  15

Thus, a convenient way to write Eq. (2.7) is

ˆ1 Sxy
(2.11)
Sxx

The difference between the observed value yi and the corresponding fitted value
ŷi is a residual. Mathematically the ith residual is

ei yi yˆ i yi ˆ0 ˆ1 xi , i 1, 2,  , n (2.12)

Residuals play an important role in investigating model adequacy and in


detecting departures from the underlying assumptions. This topic is discussed in
subsequent chapters.

Example 2.1 The Rocket Propellant Data

A rocket motor is manufactured by bonding an igniter propellant and a sustainer


propellant together inside a metal housing. The shear strength of the bond between
the two types of propellant is an important quality characteristic. It is suspected that
shear strength is related to the age in weeks of the batch of sustainer propellant.
Twenty observations on shear strength and the age of the corresponding batch of
propellant have been collected and are shown in Table 2.1. The scatter diagram,
shown in Figure 2.1, suggests that there is a strong statistical relationship between
shear strength and propellant age, and the tentative assumption of the straight-line
model y = β0 + β1x + ε appears to be reasonable.

TABLE 2.1 Data for Example 2.1


Shear Strength, Age of Propellant,
Observation, i yi (psi) xi (weeks)
1 2158.70 15.50
2 1678.15 23.75
3 2316.00 8.00
4 2061.30 17.00
5 2207.50 5.50
6 1708.30 19.00
7 1784.70 24.00
8 2575.00 2.50
9 2357.90 7.50
10 2256.70 11.00
11 2165.20 13.00
12 2399.55 3.75
13 1779.80 25.00
14 2336.75 9.75
15 1765.30 22.00
16 2053.50 18.00
17 2414.40 6.00
18 2200.50 12.50
19 2654.20 2.00
20 1753.70 21.50

c02.indd 15 30-01-2021 14:25:58


16  SIMPLE LINEAR REGRESSION

2700

2600

2500

2400

2300
Shear strength

2200

2100

2000

1900

1800

1700

1600
0 2 4 6 8 10 12 14 16 18 20 22 24 26
Age of propellant

Figure 2.1 Scatter diagram of shear strength versus propellant age, Example 2.1.

To estimate the model parameters, first calculate

n 2

n
xi
i 1 71, 422.56
Sxx xi2 4677.69 1106.56
i 1 n 20

and

n n
xi yi
n
i 1 i 1
267.25 42, 627.15
Sxy xi yi 528, 492.64 41, 112.65
i 1 n 20

Therefore, from Eqs. (2.11) and (2.6), we find that

ˆ1 Sxy 41, 112.65


37.15
Sxx 1106.56

and

ˆ0 y ˆ1 x 2131.3575 37.15 13.3625 2627.82

c02.indd 16 30-01-2021 14:26:06


Least-Squares Estimation of the Parameters  17

TABLE 2.2 Data, Fitted Values, and Residuals for Example 2.1
Observed Value, yi Fitted Value, ŷi Residual, ei
2158.70 2051.94 106.76
1678.15 1745.42 −67.27
2316.00 2330.59 −14.59
2061.30 1996.21 65.09
2207.50 2423.48 −215.98
1708.30 1921.90 −213.60
1784.70 1736.14 48.56
2575.00 2534.94 40.06
2357.90 2349.17 8.73
2256.70 2219.13 37.57
2165.20 2144.83 20.37
2399.55 2488.50 −88.95
1799.80 1698.98 80.82
2336.75 2265.58 71.17
1765.30 1810.44 −45.14
2053.50 1959.06 94.44
2414.40 2404.90 9.50
2200.50 2163.40 37.10
2654.20 2553.52 100.68
1753.70 1829.02 −75.32
yi 42, 627.15 yˆ i 42, 627.15 ei 0.00

The least-squares fit is

yˆ 2627.82 37.15 x

We may interpret the slope −37.15 as the average weekly decrease in propellant
shear strength due to the age of the propellant. Since the lower limit of the x’s is
near the origin, the intercept 2627.82 represents the shear strength in a batch of
propellant immediately following manufacture. Table 2.2 displays the observed
values yi, the fitted values ŷi, and the residuals.    ■
After obtaining the least-squares fit, a number of interesting questions come
to mind:

1. How well does this equation fit the data?


2. Is the model likely to be useful as a predictor?
3. Are any of the basic assumptions (such as constant variance and uncorrelated
errors) violated, and if so, how serious is this?

All of these issues must be investigated before the model is finally adopted for use.
As noted previously, the residuals play a key role in evaluating model adequacy.
Residuals can be viewed as realizations of the model errors εi. Thus, to check the
constant variance and uncorrelated errors assumption, we must ask ourselves if the
residuals look like a random sample from a distribution with these properties. We

c02.indd 17 30-01-2021 14:26:16


18  SIMPLE LINEAR REGRESSION

TABLE 2.3 Minitab Regression Output for Example 2.1


Regression Analysis
The regression equation is
Strength = 2628- 37.2 Age
Predictor Coef StDev T P
Constant 2627.82 44.18 59.47 0.000
Age -37.154 2.889 -12.86 0.000
S = 96.11 R-Sq = 90.2% R-Sq(adj) = 89.6%
Analysis of Variance
Source DF SS MS F P
Regression 1 1527483 1527483 165.38 0.000
Error 18 166255 9236
Total 19 1693738

return to these questions in Chapter 4, where the use of residuals in model adequacy
checking is explored.

Computer Output Computer software packages are used extensively in fitting


regression models. Regression routines are found in both network and PC-based
statistical software, as well as in many popular spreadsheet packages. Table 2.3
presents the output from Minitab, a widely used PC-based statistics package, for the
rocket propellant data in Example 2.1. The upper portion of the table contains the
fitted regression model. Notice that before rounding the regression coefficients
agree with those we calculated manually. Table 2.3 also contains other information
about the regression model. We return to this output and explain these quantities
in subsequent sections.

2.2.2 Properties of the Least-Squares Estimators


and the Fitted Regression Model
The least-squares estimators ˆ0 and ˆ1 have several important properties. First, note
from Eqs. (2.6) and (2.7) that ˆ0 and ˆ1 are linear combinations of the observations
yi. For example,
Sxy n
ˆ1 ci yi
Sxx i 1

where ci xi x Sxx for i = 1, 2, . . . , n.


The least-squares estimators ˆ0 and ˆ1 are unbiased estimators of the model
parameters β0 and β1. To show this for ˆ1, consider

n n
E ˆ1 E ci yi ci E yi
i 1 i 1
n n n
ci 0 1 xi 0 ci 1 ci xi
i 1 i 1 i 1

c02.indd 18 30-01-2021 14:26:26


Least-Squares Estimation of the Parameters  19

n
since E(εi) = 0 by assumption. Now we can show directly that i 1 ci 0 and
n
i 1 ci xi 1, so

E ˆ1 1

That is, if we assume that the model is correct [E(yi) = β0 + β1xi], then ˆ1 is an
unbiased estimator of β1. Similarly we may show that ˆ0 is an unbiased estimator
of β0, or

E ˆ0 0

The variance of ˆ1 is found as

n n
Var ˆ1 Var ci yi ci2 Var yi (2.13)
i 1 i 1

because the observations yi are uncorrelated, and so the variance of the sum is just
the sum of the variances. The variance of each term in the sum is ci2 Var yi , and we
have assumed that Var(yi) = σ 2; consequently,

n
2 2
n
xi x 2
Var ˆ1 2
ci2 i 1
2
(2.14)
i 1 Sxx Sxx

The variance of ˆ0 is

Var ˆ0 Var y ˆ1 x

Var y x 2 Var ˆ1 2 xCov y, ˆ1

Now the variance of y is just Var y 2


n , and the covariance between y and ˆ1
can be shown to be zero (see Problem 2.25). Thus,

1 x2
Var ˆ0 Var y x 2 Var ˆ1 2
(2.15)
n Sxx
Another important result concerning the quality of the least-squares estimators
ˆ0 and ˆ1 is the Gauss-Markov theorem, which states that for the regression model
(2.1) with the assumptions E(ε) = 0, Var(ε) = σ 2, and uncorrelated errors, the least-
squares estimators are unbiased and have minimum variance when compared with
all other unbiased estimators that are linear combinations of the yi. We often say
that the least-squares estimators are best linear unbiased estimators, where “best”
implies minimum variance. Appendix C.4 proves the Gauss-Markov theorem for the
more general multiple linear regression situation, of which simple linear regression
is a special case.

c02.indd 19 30-01-2021 14:26:47


20  SIMPLE LINEAR REGRESSION

There are several other useful properties of the least-squares fit:

1. The sum of the residuals in any regression model that contains an intercept β0
is always zero, that is,

n n
yi yˆ i ei 0
i 1 i 1

This property follows directly from the first normal equation in Eqs. (2.5) and
is demonstrated in Table 2.2 for the residuals from Example 2.1. Rounding
errors may affect the sum.
2. The sum of the observed values yi equals the sum of the fitted values ŷi, or

n n
yi yˆ i
i 1 i 1

Table 2.2 demonstrates this result for Example 2.1.


3. The least-squares regression line always passes through the centroid [the point
(y, x)] of the data.
4. The sum of the residuals weighted by the corresponding value of the regressor
variable always equals zero, that is,

n
xi ei 0
i 1

5. The sum of the residuals weighted by the corresponding fitted value always
equals zero, that is,

n
ŷi ei 0
i 1

2.2.3 Estimation of σ 2
In addition to estimating β0 and β1, an estimate of σ 2 is required to test hypotheses
and construct interval estimates pertinent to the regression model. Ideally we would
like this estimate not to depend on the adequacy of the fitted model. This is only
possible when there are several observations on y for at least one value of x (see
Section 4.5) or when prior information concerning σ 2 is available. When this approach
cannot be used, the estimate of σ 2 is obtained from the residual or error sum of
squares,

n n
2
SSRes ei2 yi yˆ i (2.16)
i 1 i 1

A convenient computing formula for SSRes may be found by substituting yˆ i ˆ0 ˆ1 xi


into Eq. (2.16) and simplifying, yielding

c02.indd 20 30-01-2021 14:26:59


Least-Squares Estimation of the Parameters  21

n
SSRes yi2 ny 2 ˆ1Sxy (2.17)
i 1

But
n n
2
yi2 ny 2 yi y SST
i 1 i 1

is just the corrected sum of squares of the response observations, so

SSRes SST ˆ1Sxy (2.18)

The residual sum of squares has n − 2 degrees of freedom, because two degrees
of freedom are associated with the estimates ˆ0 and ˆ1 involved in obtaining ŷi.
Section C.3 shows that the expected value of SSRes is E(SSRes) = (n − 2)σ 2, so an
unbiased estimator of σ 2 is
SSRes
ˆ2 MSRes (2.19)
n 2
The quantity MSRes is called the residual mean square. The square root of ˆ 2 is
sometimes called the standard error of regression, and it has the same units as the
response variable y.
Because ˆ 2 depends on the residual sum of squares, any violation of the assump-
tions on the model errors or any misspecification of the model form may seriously
damage the usefulness of ˆ 2 as an estimate of σ 2. Because ˆ 2 is computed from the
regression model residuals, we say that it is a model-dependent estimate of σ 2.

Example 2.2 The Rocket Propellant Data

To estimate σ 2 for the rocket propellant data in Example 2.1, first find

n 2

n n
yi
i 1
SST yi2 ny 2
yi2
i 1 i 1 n
2
42, 627.15
92, 547, 433.45 1, 693, 737.60
20

From Eq. (2.18) the residual sum of squares is

SSRes SST ˆ1Sxy


1, 693, 737.60 37.15 41, 112.65 166, 402..65

Therefore, the estimate of σ 2 is computed from Eq. (2.19) as

SSRes 166, 402.65


ˆ2 9244.59
n 2 18

c02.indd 21 30-01-2021 14:27:17


22  SIMPLE LINEAR REGRESSION

Remember that this estimate of σ 2 is model dependent. Note that this differs slightly
from the value given in the Minitab output (Table 2.3) because of rounding. ■
2.2.4 Alternate Form of the Model
There is an alternate form of the simple linear regression model that is occasionally
useful. Suppose that we redefine the regressor variable xi as the deviation from its
own average, say xi x . The regression model then becomes

yi 0 1 xi x 1x i

0 1x 1 xi x i

0 1 xi x i (2.20)

Note that redefining the regressor variable in Eq. (2.20) has shifted the origin of the
x’s from zero to x. In order to keep the fitted values the same in both the original
and transformed models, it is necessary to modify the original intercept. The rela-
tionship between the original and transformed intercept is

0 0 1x (2.21)

It is easy to show that the least-squares estimator of the transformed intercept


is ˆ0 y. The estimator of the slope is unaffected by the transformation. This alter-
nate form of the model has some advantages. First, the least-squares estimators
ˆ0 y and ˆ1 Sxy Sxx are uncorrelated, that is, Cov ˆ , ˆ 0. This will make some
0 1
applications of the model easier, such as finding confidence intervals on the mean
of y (see Section 2.4.2). Finally, the fitted model is

yˆ y ˆ1 x x (2.22)

Although Eqs. (2.22) and (2.8) are equivalent (they both produce the same value
of ŷ for the same value of x), Eq. (2.22) directly reminds the analyst that the regres-
sion model is only valid over the range of x in the original data. This region is
centered at x.

2.3 HYPOTHESIS TESTING ON THE SLOPE AND INTERCEPT

We are often interested in testing hypotheses and constructing confidence intervals


about the model parameters. Hypothesis testing is discussed in this section, and
Section 2.4 deals with confidence intervals. These procedures require that we make
the additional assumption that the model errors εi are normally distributed. Thus,
the complete assumptions are that the errors are normally and independently dis-
tributed with mean 0 and variance σ 2, abbreviated NID(0, σ 2). In Chapter 4 we
discuss how these assumptions can be checked through residual analysis.

2.3.1 Use of t Tests


Suppose that we wish to test the hypothesis that the slope equals a constant, say β10.
The appropriate hypotheses are

c02.indd 22 30-01-2021 14:27:29


Hypothesis Testing on the Slope and Intercept  23

H 0: 1 10 , H1: 1 10 (2.23)

where we have specified a two-sided alternative. Since the errors εi are NID(0, σ 2),
the observations yi are NID(β0 + β1xi, σ 2). Now ˆ1 is a linear combination of the
observations, so ˆ1 is normally distributed with mean β1 and variance σ 2/Sxx using
the mean and variance of ˆ1 found in Section 2.2.2. Therefore, the statistic
ˆ1 10
Z0
2
Sxx

is distributed N(0, 1) if the null hypothesis H0: β1 = β10 is true. If σ 2 were known, we
could use Z0 to test the hypotheses (2.23). Typically, σ 2 is unknown. We have already
seen that MSRes is an unbiased estimator of σ 2. Appendix C.3 establishes that
(n − 2)MSRes/σ 2 follows a n 2 distribution and that MSRes and ˆ1 are independent.
2

By the definition of a t statistic given in Section C.1,


ˆ1 10
t0 (2.24)
MSRes Sxx

follows a tn−2 distribution if the null hypothesis H0: β1 = β10 is true. The degrees of
freedom associated with t0 are the number of degrees of freedom associated with
MSRes. Thus, the ratio t0 is the test statistic used to test H0: β1 = β10. The test procedure
computes t0 and compares the observed value of t0 from Eq. (2.24) with the upper
α/2 percentage point of the tn−2 distribution (tα/2,n−2). This procedure rejects the null
hypothesis if
t0 t 2, n 2 (2.25)

Alternatively, a P-value approach could also be used for decision making.


The denominator of the test statistic, t0, in Eq. (2.24) is often called the estimated
standard error, or more simply, the standard error of the slope. That is,

MSRes
se ˆ1 (2.26)
Sxx

Therefore, we often see t0 written as

ˆ1 10
t0 (2.27)
se ˆ1

A similar procedure can be used to test hypotheses about the intercept. To test

H 0: 0 00 , H1: 0 00 (2.28)

we would use the test statistic


ˆ0 00
ˆ0 00
t0 (2.29)
MSRes 1 n x 2
Sxx se ˆ0

c02.indd 23 30-01-2021 14:27:46


24  SIMPLE LINEAR REGRESSION

where se ˆ0 MSRes 1 n x 2 Sx is the standard error of the intercept. We reject


the null hypothesis H0: β0 = β00 if |t0| > tα/2,n−2.

2.3.2 Testing Significance of Regression


A very important special case of the hypotheses in Eq. (2.23) is

H 0: 1 0, H1: 1 0 (2.30)

These hypotheses relate to the significance of regression. Failing to reject H0: β1 = 0


implies that there is no linear relationship between x and y. This situation is illus-
trated in Figure 2.2. Note that this may imply either that x is of little value in explain-
ing the variation in y and that the best estimator of y for any x is ŷ y (Figure 2.2a)
or that the true relationship between x and y is not linear (Figure 2.2b). Therefore,
failing to reject H0: β1 = 0 is equivalent to saying that there is no linear relationship
between y and x.
Alternatively, if H0: β1 = 0 is rejected, this implies that x is of value in explaining
the variability in y. This is illustrated in Figure 2.3. However, rejecting H0: β1 = 0
could mean either that the straight-line model is adequate (Figure 2.3a) or that even

y y

x x
(a) (b)
Figure 2.2 Situations where the hypothesis H0: β1 = 0 is not rejected.

y y

x x
(a) (b)
Figure 2.3 Situations where the hypothesis H0: β1 = 0 is rejected.

c02.indd 24 30-01-2021 14:27:51


Hypothesis Testing on the Slope and Intercept  25

though there is a linear effect of x, better results could be obtained with the addition
of higher order polynomial terms in x (Figure 2.3b).
The test procedure for H0: β1 = 0 may be developed from two approaches. The
first approach simply makes use of the t statistic in Eq. (2.27) with β10 = 0, or
ˆ1
t0
se ˆ1

The null hypothesis of significance of regression would be rejected if |t0| > tα/2,n−2.

Example 2.3 The Rocket Propellant Data

We test for significance of regression in the rocket propellant regression model


of Example 2.1. The estimate of the slope is ˆ1 37.15, and in Example 2.2, we
computed the estimate of σ 2 to be MSRes ˆ 2 9244.59. The standard error of the
slope is

MSRes 9244.59
se ˆ1 2.89
Sxx 1106.56

Therefore, the test statistic is


ˆ1 37.15
t0 12.85
se ˆ1 2.89

If we choose α = 0.05, the critical value of t is t0.025,18 = 2.101. Thus, we would reject
H0: β1 = 0 and conclude that there is a linear relationship between shear strength
and the age of the propellant.    ■
Minitab Output The Minitab output in Table 2.3 gives the standard errors of the
slope and intercept (called “StDev” in the table) along with the t statistic for testing
H0: β1 = 0 and H0: β0 = 0. Notice that the results shown in this table for the slope
essentially agree with the manual calculations in Example 2.3. Like most computer
software, Minitab uses the P-value approach to hypothesis testing. The P value for
the test for significance of regression is reported as P = 0.000 (this is a rounded
value; the actual P value is 1.64 × 10−10). Clearly there is strong evidence that
strength is linearly related to the age of the propellant. The test statistic for
H0: β0 = 0 is reported as t0 = 59.47 with P = 0.000. One would feel very confident
in claiming that the intercept is not zero in this model.

2.3.3 Analysis of Variance


We may also use an analysis-of-variance approach to test significance of regression.
The analysis of variance is based on a partitioning of total variability in the response
variable y. To obtain this partitioning, begin with the identity

yi y yˆ i y yi yˆ i (2.31)

c02.indd 25 30-01-2021 14:28:03


26  SIMPLE LINEAR REGRESSION

Squaring both sides of Eq. (2.31) and summing over all n observations
produces

n n n n
2 2 2
yi y yˆ i y yi yˆ i 2 yˆ i y yi yˆ i
i 1 i 1 i 1 i 1

Note that the third term on the right-hand side of this expression can be
rewritten as

n n n
2 yˆ i y yi yˆ i 2 yˆ i yi yˆ i 2y yi yˆ i
i 1 i 1 i 1
n n
2 yˆ i ei 2y ei 0
i 1 i 1

since the sum of the residuals is always zero (property 1, Section 2.2.2) and the sum
of the residuals weighted by the corresponding fitted value ŷi is also zero (property
5, Section 2.2.2). Therefore,

n n n
2 2 2
yi y yˆ i y yi yˆ i (2.32)
i 1 i 1 i 1

The left-hand side of Eq. (2.32) is the corrected sum of squares of the observa-
tions, SST, which measures the total variability in the observations. The two compo-
nents of SST measure, respectively, the amount of variability in the observations yi
accounted for by the regression line and the residual variation left unexplained by
n 2
the regression line. We recognize SSRes i 1 yi yˆ i as the residual or error sum
n 2
of squares from Eq. (2.16). It is customary to call i 1 yˆ i y the regression or
model sum of squares.
Equation (2.32) is the fundamental analysis-of-variance identity for a regression
model. Symbolically, we usually write

SST SSR SSRes (2.33)

Comparing Eq. (2.33) with Eq. (2.18) we see that the regression sum of squares may
be computed as

SSR ˆ1Sxy (2.34)

The degree-of-freedom breakdown is determined as follows. The total sum of


squares, SST, has dfT = n − 1 degrees of freedom because one degree of freedom is
lost as a result of the constraint in 1 yi y on the deviations yi y . The model or
regression sum of squares, SSR, has dfR = 1 degree of freedom because SSR is
completely determined by one parameter, namely, ˆ1 [see Eq. (2.34)]. Finally, we
noted previously that SSR has dfRes = n − 2 degrees of freedom because two

c02.indd 26 30-01-2021 14:28:21


Hypothesis Testing on the Slope and Intercept  27

constraints are imposed on the deviations yi yˆ i as a result of estimating ˆ0 and ˆ1.


Note that the degrees of freedom have an additive property:

dfT dfR dfRes


n 1 1 n 2 (2.35)

We can use the usual analysis-of-variance F test to test the hypothesis H0: β1 = 0.
2
Appendix C.3 shows that (1) SSRes = (n − 2)MSRes/σ 2 follows a n 2 distribution;
2
(2) if the null hypothesis H0: β1 = 0 is true, then SSR/σ 2 follows a 1 distribution; and
(3) SSRes and SSR are independent. By the definition of an F statistic given in
Appendix C.1,

SSR dfR SSR 1 MSR


F0 (2.36)
SSRes dfRes SSRes n 2 MSRes

follows the F1,n−2 distribution. Appendix C.3 also shows that the expected values of
these mean squares are

2 2 2
E MSRes , E MSR 1 Sxx

These expected mean squares indicate that if the observed value of F0 is large, then
it is likely that the slope β1 ≠ 0. Appendix C.3 also shows that if β1 ≠ 0, then F0
follows a noncentral F distribution with 1 and n − 2 degrees of freedom and a non-
centrality parameter of

2
1 Sxx
2

This noncentrality parameter also indicates that the observed value of F0 should be
large if β1 ≠ 0. Therefore, to test the hypothesis H0: β1 = 0, compute the test statistic
F0 and reject H0 if

F0 F ,1, n 2

The test procedure is summarized in Table 2.4.

TABLE 2.4 Analysis of Variance for Testing Significance of Regression


Source of Degrees of
Variation Sum of Squares Freedom Mean Square F0
Regression SSR ˆ1Sxy 1 MSR MSR/MSRes
Residual SSRes SST ˆ1Sxy n−2 MSRes
Total SST n−1

c02.indd 27 30-01-2021 14:28:37


28  SIMPLE LINEAR REGRESSION

Example 2.4 The Rocket Propellant Data

We will test for significance of regression in the model developed in Example


2.1 for the rocket propellant data. The fitted model is yˆ 2627.82 37.15 x,
SST = 1,693,737.60, and Sxy = −41,112.65. The regression sum of squares is computed
from Eq. (2.34) as

SSR ˆ1Sxy 37.15 41, 112.65 1, 527, 334.95

The analysis of variance is summarized in Table 2.5. The computed value of F0 is


165.21, and from Table A.4, F0.01,1,18 = 8.29. The P value for this test is 1.66 × 10−10.
Consequently, we reject H0: β1 = 0.    ■
Minitab Output The Minitab output in Table 2.3 also presents the analysis-of-
variance test significance of regression. Comparing Tables 2.3 and 2.5, we note that
there are some slight differences between the manual calculations and those per-
formed by computer for the sums of squares. This is due to rounding the manual
calculations to two decimal places. The computed values of the test statistics essen-
tially agree.

More About the t Test We noted in Section 2.3.2 that the t statistic

ˆ1 ˆ1
t0 (2.37)
se ˆ1 MSRes Sxx

could be used for testing for significance of regression. However, note that on squar-
ing both sides of Eq. (2.37), we obtain

ˆ12 Sxx ˆ1Sxy MSR


t02 (2.38)
MSRes MSRes MSRes

Thus, t02 in Eq. (2.38) is identical to F0 of the analysis-of-variance approach in


Eq. (2.36). For example; in the rocket propellant example t0 = −12.5, so
2
t02 12.5 165.12  F0 165.21. In general, the square of a t random variable
with f degrees of freedom is an F random variable with one and f degrees of freedom
in the numerator and denominator, respectively. Although the t test for H0: β1 = 0
is equivalent to the F test in simple linear regression, the t test is somewhat more
adaptable, as it could be used for one-sided alternative hypotheses (either H1: β1 < 0
or H1: β1 > 0), while the F test considers only the two-sided alternative. Regression

TABLE 2.5 Analysis-of-Variance Table for the Rocket Propellant Regression Model
Source of Sum of Degrees of
Variation Squares Freedom Mean Square F0 P value
Regression 1,527,334.95 1 1,527,334.95 165.21 1.66 × 10−10
Residual 166,402.65 18 9,244.59
Total 1,693,737.60 19

c02.indd 28 30-01-2021 14:28:48


Another random document with
no related content on Scribd:
voies de violence; qu'enfin, dans ces occasions, la considération des personnes
est de grande importance aussi, et que pour le vainqueur de Rivoli, le descendant
du vainqueur de Rocroy aurait dû être sacré.

Passant vivement sur ce sujet Napoléon aimait à considérer


Napoléon se
regardait comme le l'ensemble de son règne, et il disait qu'en consultant les
plus innocent de annales du monde, en prenant l'histoire des fondateurs de
tous les fondateurs dynastie, on n'en trouvait pas de plus innocent que lui.
de dynastie. Effectivement il n'en est pas à qui l'histoire ait moins à
reprocher, sous le rapport des moyens employés pour écarter
des parents ou des rivaux, et il est certain qu'excepté les champs de bataille, où
l'effusion du sang humain fut immense, personne n'avait moins versé de sang que
lui, ce qui était dû à son caractère personnel, et surtout aux mœurs de son temps.
Se comparant à Cromwell, Je suis monté, disait-il souvent, sur un trône vide, et je
n'ai rien fait pour le rendre vacant. Je n'y suis arrivé que porté par l'enthousiasme
et la reconnaissance de mes contemporains.— Cette
Ce qu'il y avait de
vrai dans cette assertion était rigoureusement vraie. Pourtant de ce trône, où
assertion. il avait été porté par une admiration si unanime, Napoléon était
tombé avec autant d'éclat qu'il y était monté. Certes la
trahison, qu'il niait lui-même, ne pouvait être une explication de cette chute; il fallait
la chercher dans ses fautes, et sur ces fautes il était quelquefois sincère,
quelquefois sophistique, selon que les aveux à faire coûtaient plus ou moins à son
orgueil. Suivant la loi commune, là où il manquait d'excuses, il s'efforçait d'en
trouver dans des subtilités ou des inexactitudes de fait, dont il prenait l'habitude,
sans qu'on pût démêler s'il y croyait ou n'y croyait pas.

Nous avons, en racontant la chute de l'Empire en 1814,


Comment
Napoléon présenté le tableau résumé des fautes qui avaient amené
s'expliquait sur les cette chute, et qui selon nous se réduisaient à six. Elles
six grandes fautes avaient consisté,
politiques qui
avaient amené sa La première, à sortir en 1803 de la politique forte et
chute. modérée du Consulat, à rompre la paix d'Amiens, et à se jeter
sur l'Angleterre, qu'il était si difficile d'atteindre;

La seconde, après avoir soumis le continent en trois batailles, Austerlitz, Iéna,


Friedland, à n'être pas rentré en 1807 dans la politique modérée, et au lieu de
chercher à réduire l'Angleterre par l'union du continent contre elle, à profiter au
contraire de l'occasion pour essayer la monarchie universelle;

La troisième, à faire reposer à Tilsit cette monarchie universelle sur la complicité


intéressée de la Russie, complicité qui ne pouvait être durable que si elle était
payée par l'abandon de Constantinople;

La quatrième, à s'enfoncer en Espagne, gouffre sans fond où étaient allées


s'abîmer toutes nos forces;
La cinquième, à ne pas essayer de venir à bout de cette guerre par la
persévérance, et à chercher en Russie la solution qu'on ne trouvait pas dans la
Péninsule, ce qui avait amené la catastrophe inouïe de Moscou;

La sixième enfin et la plus funeste, après avoir ramené à Lutzen et Bautzen la


victoire sous nos drapeaux, à refuser la paix de Prague, qui nous aurait laissé une
étendue de territoire bien supérieure à celle que la politique permettait d'espérer et
de désirer.

Il est inutile de dire que dans les profonds ennuis de sa captivité, Napoléon
reproduisant ses souvenirs à mesure que les hasards de la conversation les
réveillaient, ne discutait pas méthodiquement les actes principaux de son règne,
comme nous avons essayé de le faire. Il touchait tantôt à un sujet, tantôt à un
autre, cherchant d'autant plus à s'excuser qu'il était moins excusable.

Quant à ses emportements envers l'Angleterre et à la


Première faute.
rupture de la paix d'Amiens, il disait que la fameuse scène à
lord Whitworth avait été fort exagérée, et que le refus du ministère britannique
d'évacuer Malte était intolérable, oubliant que par l'ensemble de ses actes il avait
créé une situation menaçante, dont les Anglais avaient profité pour ne pas évacuer
cette île. Il affirmait que le projet de descente avait été sérieux, et que ses
combinaisons navales étaient telles, que sans la faute d'un amiral il aurait triomphé
de l'Angleterre. Il est incontestable, en effet, que jamais combinaisons plus
profondes ni plus vastes ne furent imaginées, et que si l'amiral Villeneuve avait
paru dans la Manche, cent cinquante mille Français auraient franchi le détroit! Que
serait-il arrivé, lorsque, après avoir gagné en Angleterre une bataille d'Austerlitz,
Napoléon se serait trouvé maître de Londres comme il le fut plus tard de Vienne et
de Berlin? La fière aristocratie anglaise aurait-elle plié sous ce coup terrible, ou
bien aurait-elle essayé de prolonger la lutte contre son vainqueur prisonnier en
quelque sorte dans sa propre conquête? On n'en sait rien. Mais c'était une terrible
manière de jouer sa grandeur et celle de la France, que de la risquer dans de
pareils hasards!

Quant à la monarchie universelle, qu'il avait essayé d'établir


Deuxième faute.
lorsque ne pouvant venir à bout de l'Angleterre il s'était jeté
sur le continent, Napoléon n'en fournissait pas une raison valable. Cette monarchie
universelle, il ne la voulait, disait-il, que temporaire; c'était une dictature au dehors,
comme la dictature au dedans que la France lui avait conférée, et qu'il aurait
déposée avec le temps.—D'abord si la France en 1800 demandait un bras puissant
pour la sauver de l'anarchie, l'Europe ne désirait rien de semblable. Ce dont elle
voulait être préservée, c'était de l'ambition du nouveau chef qui gouvernait alors la
France, et le lui donner pour dictateur, c'était tout simplement lui donner ce qu'elle
craignait le plus, c'était pour remède à son mal lui donner le mal lui-même. Il n'y
avait donc aucune vérité à vouloir déduire de la dictature au dedans la dictature au
dehors. Il aurait fallu en tous cas la rendre courte pour la rendre tolérable, il aurait
fallu par ses actes prouver aux peuples qu'on l'exerçait dans leur intérêt, et leur
faire du bien au lieu de les accabler de maux, au point de les amener tous à se
soulever en 1813 pour combattre et détruire cette dictature européenne.

Sur cette chimère de la monarchie universelle, Napoléon disait encore que


toujours on l'avait attaqué, et qu'obligé sans cesse de se défendre il était devenu
maître de l'Europe presque malgré lui: fausse assertion souvent répétée par les
adulateurs de sa mémoire et de son système. Il est vrai que les puissances
européennes, sous l'oppression qu'elles subissaient, n'attendaient qu'un moment
pour se révolter; mais cette disposition à la révolte n'était que le résultat de
l'oppression même, et, au surplus, elles étaient si accablées après Tilsit, que sans
la guerre d'Espagne l'Autriche n'aurait pas essayé la fameuse levée de boucliers
de 1809, et qu'après la victoire de Wagram, si Napoléon n'avait pas entrepris la
guerre de Russie, personne n'eût osé lever la main contre lui.

Il était plus sincère sur la troisième faute, la guerre


Troisième faute.
d'Espagne.—La guerre d'Espagne, disait-il, avait compromis la
moralité de son gouvernement, divisé et usé ses forces.—Lui seul pouvait dire si
bien et si complétement. Oui, l'événement de Bayonne avait paru une noire
perfidie; la guerre d'Espagne avait attiré au midi les armées dont il aurait eu besoin
au nord, et après avoir divisé ses forces les avait usées par l'acharnement de la
lutte. Mais comment était-il si sincère sur ce point en l'étant si peu sur d'autres?
C'était peut-être l'évidence de la faute, et peut-être aussi la nature des excuses
qu'il trouvait à donner.—En ayant, disait-il, fondé en France la quatrième dynastie,
il ne pouvait souffrir en Espagne les Bourbons, que leur situation destinait presque
inévitablement à être les complices de l'Angleterre.—Cette raison était assurément
d'un certain poids; mais si, au lieu de hâter la solution par un attentat, Napoléon
l'eût attendue de l'incapacité des Bourbons et de la popularité prodigieuse dont il
jouissait en Espagne, il eût été probablement appelé par les Espagnols eux-mêmes
à ranger les deux trônes sous une seule influence. C'était donc une faute
d'impatience (genre de faute que son caractère le portait si souvent à commettre),
et cette excuse de la guerre d'Espagne, qui lui semblait assez bonne pour qu'il osât
avouer son erreur, ne valait guère mieux que la plupart de celles qu'il donnait pour
pallier les torts de sa politique.

Quant à la faute de n'avoir pas essayé de triompher des


Quatrième et
cinquième faute. Espagnols par la persévérance, et d'être allé chercher en
Russie une solution qu'il ne trouvait pas en Espagne même, il
était assez sincère aussi, et à cette occasion il faisait un singulier aveu.—En
réalité, disait-il, Alexandre ne désirait pas la guerre; je ne la désirais pas non plus,
et une fois sur le Niémen, nous étions comme deux bravaches, qui n'auraient pas
mieux demandé que de voir quelqu'un se jeter entre eux pour les séparer. Mais un
grand ministre des affaires étrangères m'avait manqué à cette époque. Si j'avais eu
M. de Talleyrand, par exemple, la guerre de Russie n'aurait pas eu lieu...—
Napoléon disait vrai, mais il faisait là un aveu que doivent bien méditer les
ministres servant un maître engagé sur une pente dangereuse, et n'ayant pas le
courage de l'y arrêter.

Quant à la campagne elle-même, il en attribuait la funeste issue à l'incendie de


Moscou.—Il y avait à Moscou, disait-il, des vivres pour nourrir toute une armée
pendant plus de six mois. Si j'avais hiverné là, j'aurais été comme le vaisseau pris
dans les glaces, lequel recouvre la liberté de ses mouvements au retour du soleil.
Je me serais trouvé entier au printemps, et si les Russes avaient reçu des renforts,
j'en aurais reçu de mon côté; et de même qu'en 1807, après avoir essuyé la
journée d'Eylau en février, j'avais rencontré celle de Friedland en juin, j'aurais pu
remporter quelque brillant avantage au retour de la belle saison, et terminer la
campagne de 1812 aussi heureusement que celle de 1807.—Ces raisons
assurément avaient quelque valeur, mais on peut répondre que si l'infanterie de
l'armée eût pu vivre à Moscou, la cavalerie et l'artillerie auraient manqué de
fourrages, que si les renforts avaient pu arriver jusqu'à Osterode en 1807, il n'était
pas aussi facile de les amener jusqu'à Moscou, et qu'enfin l'armée de 1812 n'avait
plus les solides qualités de celle de 1807.

Quant à la dernière des fautes graves du règne, celle d'avoir


Sixième et dernière
faute. refusé la paix de Prague, Napoléon ne disait rien de plausible,
ni même de spécieux. Il répétait cette raison banale que
l'Autriche n'était pas de bonne foi, et qu'en ayant l'air de traiter à Prague elle était
secrètement engagée avec les puissances coalisées, allégation fausse et que les
documents les plus authentiques réfutent complétement. Si en effet l'Autriche
n'avait pas été de bonne foi à Prague, il y avait un moyen de la confondre, c'était
d'accepter ses conditions, qui consistaient à nous laisser la Westphalie, la
Hollande, le Piémont, Florence, Rome, Naples, c'est-à-dire deux fois plus que nous
ne devions désirer, et à nous refuser seulement Lubeck, Hambourg, dont nous
n'avions que faire, la Sicile, que nous n'avions jamais eue, l'Espagne, que nous
avions perdue. Si, ces conditions acceptées, elle nous avait manqué de parole,
alors on l'eût convaincue de mensonge, et on aurait eu l'opinion générale pour soi.
Mais en fait il est constant qu'elle eût accepté avec joie notre adhésion, car elle
n'entreprenait la guerre qu'en tremblant, et elle avait même formellement refusé de
s'engager avec les coalisés avant l'expiration du délai fatal assigné à la médiation.
Napoléon n'aimait pas à s'étendre sur ce sujet, pénible pour son amour-propre, car
il s'était lourdement trompé en cette occasion, et avait cru qu'il faisait tellement
peur à l'Autriche que jamais elle n'oserait se décider contre lui. Il lui faisait peur
assurément, et beaucoup, mais non jusqu'à paralyser son jugement, et à
l'empêcher de prendre un parti dicté par ses intérêts les plus évidents. Pour écarter
ce reproche il disait que son mariage l'avait perdu en lui inspirant une confiance
funeste à l'égard de l'Autriche, excuse peu digne, et fausse d'ailleurs, car M. de
Metternich avait eu soin de lui répéter sans cesse que le mariage avait dans les
conseils de la cour de Vienne un certain poids, mais un poids limité, et
n'empêcherait pas de lui déclarer la guerre s'il n'acceptait pas les conditions
proposées à Prague, lesquelles après tout n'avaient qu'un inconvénient, c'était
d'être trop belles pour nous.

Ainsi raisonnait Napoléon sur les événements de son règne, sincère, comme on
le voit, sur les points où son amour-propre trouvait des excuses spécieuses,
sophistique sur les points où il n'en trouvait pas, sentant bien ses fautes sans le
dire, et comptant sur l'immensité de sa gloire pour le soutenir auprès des âges
futurs, comme elle l'avait déjà soutenu auprès des contemporains.

Il s'expliquait plus volontiers et avec plus de confiance sur


Napoléon s'étend
volontiers sur son tout ce qui concernait le gouvernement intérieur de l'Empire.
gouvernement Là, il se présentait avec raison comme un grand organisateur,
intérieur. qui, prenant en 1800 l'ancienne société brisée par le marteau
de la Révolution, avait de ses débris recomposé la société
moderne. Il n'avait pas de peine à démontrer pourquoi il avait cherché à fondre
ensemble les diverses classes de la France violemment divisées, à rappeler
l'ancienne noblesse, à élever jusqu'à elle la bourgeoisie, en donnant à celle-ci des
titres mérités par de grands-services, et à offrir ainsi à l'Europe une société
puissante, rajeunie et digne d'entrer en relation avec elle. Seulement en tâchant de
rendre la France présentable à l'Europe, pour rétablir avec celle-ci des relations
pacifiques, il n'aurait pas fallu faire vivre cette malheureuse Europe dans des
terreurs continuelles. Sur tous ces points du reste Napoléon parlait en législateur,
en philosophe, en politique, et quand certains de ses compagnons d'exil lui
répétaient qu'il avait eu tort de s'entourer d'anciens nobles qui l'avaient trahi, il
repoussait énergiquement cette objection, misérable selon lui, en leur adressant la
réponse péremptoire qui suit.—Les deux hommes qui ont le plus contribué à me
perdre, disait-il, c'est Marmont en 1814, en m'ôtant les forces avec lesquelles
j'allais détruire la coalition dans Paris, et Fouché en 1815, en soulevant la Chambre
des représentants contre moi. Les vrais traîtres, s'il y a eu des traîtres qui m'aient
perdu, ce sont ces deux hommes! Eh bien, étaient-ce d'anciens nobles?...—

Napoléon rapportait ensuite avec complaisance tout ce qu'il


Sa politique à
l'égard des diverses avait fait pour donner à la France une administration active,
classes de la puissante, probe, claire dans ses comptes. Il rappelait ses
société française. routes, ses canaux, ses ports, ses monuments, ses travaux
pour la confection du Code civil, dont il attribuait une large part
à Tronchet, sa longue présidence du Conseil d'État, où régnait, disait-il, une grande
liberté de discussion, où souvent il était contredit avec opiniâtreté, car, ajoutait-il, si
les hommes sont courtisans, ils ont de l'amour-propre aussi, et j'ai vu des
conseillers d'État, de simples maîtres des requêtes, une fois engagés, soutenir
contre moi leur opinion avec entêtement, tant il est vrai qu'il suffit d'assembler les
hommes avec l'intention sérieuse d'approfondir les affaires, pour qu'il naisse une
liberté relative, et quelquefois féconde, du moins en fait d'administration.
Napoléon avouait qu'il n'avait pas été un monarque libéral, mais soutenait qu'il
avait été un monarque civilisateur, et ajoutait que, chargé d'être dictateur, son rôle
à lui ne pouvait pas être de donner la liberté, mais de la préparer. Quant à l'essai
de cette liberté fait en 1815, il ne le désavouait pas, mais il en
Son essai de liberté
en 1815. parlait peu, comme s'il avait été confus d'une épreuve qui avait
si mal tourné pour lui. À cette occasion il s'exprimait sur les
assemblées en homme qui les connaissait bien, quoiqu'il les eût peu pratiquées, et
imputait ses mécomptes dans la Chambre des représentants à la nouveauté de cet
essai de liberté plus qu'à son vice fondamental.—Les assemblées, disait-il, ont
besoin de chefs pour les conduire, exactement comme les armées. Mais il y a cette
différence que les armées reçoivent les chefs qu'on leur donne, et que les
assemblées se les donnent à elles-mêmes. Or, en 1815, la Chambre des
représentants, réunie au bruit du canon, n'avait pu encore ni chercher, ni trouver
ses chefs.—

En toutes choses Napoléon disait qu'il n'avait pu avoir que des projets, qu'il
n'avait eu le temps de rien achever, que son règne n'était qu'une suite d'ébauches,
et alors se prenant à rêver, il aimait à se représenter tout ce qu'il aurait fait s'il avait
pu obtenir de l'Europe une paix franche et durable, (paix qu'il avait repoussée
malheureusement quand il aurait pu l'obtenir, comme en 1813 par exemple, et qu'il
n'avait voulue qu'en 1815, lorsqu'elle était devenue impossible!)— J'aurais, disait-il,
accordé à mes sujets une large part dans le gouvernement. Je
Ce qu'il aurait fait
s'il avait vieilli sur le les aurais appelés autour de moi dans des assemblées
trône. vraiment libres, j'aurais écouté, je me serais laissé contredire,
et, ne me bornant pas à les appeler autour de moi, je serais
allé à eux. J'aurais voyagé avec mes propres chevaux à travers la France,
accompagné de l'Impératrice et de mon fils. J'aurais tout vu de mes yeux, écouté,
redressé les griefs, observé de près les hommes et les choses, et répandu de mes
mains les biens de la paix, après avoir tant versé de ces mêmes mains les maux
de la guerre. J'aurais vieilli en prince paternel et pacifique, et les peuples, après
avoir si longtemps applaudi Napoléon guerrier, auraient béni Napoléon pacifique, et
voyageant, comme jadis les Mérovingiens, dans un char traîné par des bœufs.—

Tels étaient les rêves de ce grand homme, et si nous les rapportons, c'est qu'ils
contiennent une leçon frappante, celle de ne pas laisser passer le temps de faire le
bien, car une fois passé il ne revient plus. Ainsi s'écoulaient les soirées de la
captivité, et lorsqu'en discourant de la sorte Napoléon s'apercevait qu'il avait atteint
une heure plus avancée que de coutume, il s'écriait avec joie: Minuit, minuit! quelle
conquête sur le temps!... le temps, dont il n'avait jamais assez autrefois, et dont il
avait toujours trop aujourd'hui!

L'année 1816, dont une moitié s'était passée en tracasseries, fut quant à l'autre
moitié beaucoup mieux employée, et consacrée à des travaux historiques assidus.
C'est à M. de Las Cases que Napoléon donnait alors le plus de temps, car il était
plein d'ardeur pour le récit de ses campagnes d'Italie, qui lui rappelaient ses
premiers, ses plus sensibles succès. Quoiqu'il s'occupât aussi de l'expédition
d'Égypte avec le maréchal Bertrand, de la campagne de 1815 avec le général
Gourgaud, l'Italie avait en ce moment la préférence. Il aurait voulu avoir un
Moniteur pour les dates et pour certains détails matériels, et, à défaut du Moniteur,
il se servait de l'Annual register. Du reste, sa mémoire était
Travaux historiques
de Napoléon. rarement en défaut, et presque jamais il n'avait à rectifier ses
souvenirs. M. de Las Cases, forcé pour le suivre d'écrire aussi
vite que la parole, se servait de signes abréviatifs; il était obligé ensuite de recopier
ce qu'il avait écrit, et il y employait une partie des nuits. Il apportait le lendemain
cette copie, que Napoléon corrigeait de sa main. Ce travail ayant singulièrement
affaibli la vue de M. de Las Cases, son fils le relevait souvent, et l'aidait dans ses
efforts pour saisir au vol la pensée impétueuse du puissant historien. À ce travail
Napoléon en avait ajouté un autre. Il sentait l'inconvénient de ne pas savoir
l'anglais, et il avait résolu de l'apprendre en adoptant M. de Las Cases pour maître.
Mais ce génie prodigieux, qui avait à un si haut degré la mémoire des choses,
n'avait pas celle des mots, et il apprenait les langues avec peine. Il s'y appliquait
néanmoins, et commençait à lire l'anglais, sans toutefois pouvoir le parler. Ces
diverses occupations exigeaient de fréquents tête-à-tête avec
Les assiduités de
M. de Las Cases M. de Las Cases, et provoquaient des jalousies dans cette
auprès de colonie si peu nombreuse, et où il semble que l'infortune aurait
Napoléon inspirent dû rapprocher les cœurs. Le général Gourgaud avait fait
des jalousies à preuve envers Napoléon d'un dévouement remarquable, mais
quelques membres il gâtait ses bonnes qualités par un orgueil excessif, et par un
de la colonie. penchant à la jalousie qui ne reposait jamais. N'ayant pas
quitté Napoléon dans ses dernières campagnes, il se
considérait comme devant être le coopérateur exclusif de tous les récits de guerre,
et souffrait avec peine que M. de Las Cases fût en ce moment le confident habituel
de son maître. Cependant chacun devait avoir son tour, et, avec la fin de l'Empire,
que le général Gourgaud connaissait mieux, le privilége des longs tête-à-tête devait
arriver pour lui. Mais, bouillant autant que courageux, il ne savait pas se contenir,
et, dans ce cercle si étroit, où les froissements étaient nécessairement si sensibles,
il devenait souvent querelleur et incommode. Le spectacle de ces divisions
aggravait les peines de Napoléon. Il cherchait à apaiser des
Efforts de Napoléon
pour maintenir brouilles qu'il apercevait même quand on s'efforçait de les lui
l'union entre les cacher, réprimait avec autorité les fougues du général
amis qui lui restent. Gourgaud, et s'appliquait à guérir les blessures faites à la
sensibilité de M. de Las Cases, caractère concentré et un peu
morose.—Quoi, leur disait-il à tous, n'est-ce pas assez de nos chagrins? faut-il que
nous y ajoutions nous-mêmes par nos propres travers? Si la considération de ce
que vous vous devez les uns aux autres ne suffit pas, songez à ce que vous me
devez à moi-même... Ne voyez-vous pas que vos divisions me rendent
profondément malheureux?... Tenez, ajoutait-il, quand vous serez de retour en
Europe, ce qui ne peut manquer d'être prochain, car je n'ai pas beaucoup d'années
à vivre, votre gloire sera de m'avoir accompagné sur ce rocher. Alors vous n'irez
pas avouer que vous viviez en ennemis les uns avec les autres; vous vous direz
frères en Sainte-Hélène, vous affecterez l'union: eh bien, puisqu'il faudra le faire un
jour, pourquoi ne pas commencer aujourd'hui, pour votre dignité, pour mon repos,
pour ma consolation?...—

Ces pauvres exilés, malgré la surveillance ombrageuse dont


Quelques tentatives
de communications ils étaient l'objet, allaient quelquefois en ville sous divers
avec l'Europe. prétextes, mais, en réalité, pour s'y procurer des nouvelles. Ils
s'y rendaient à cheval, accompagnés d'un surveillant, auquel
ils donnaient leur monture à garder, et qui leur laissait ainsi un peu de liberté dont
ils usaient pour se ménager quelques communications avec l'Europe. Le
propriétaire du pavillon de Briars, devenu fournisseur de Longwood, se faisait
souvent l'intermédiaire de leurs correspondances, du reste bien innocentes, car
elles avaient pour unique objet d'entretenir des relations avec leurs familles, et les
plus coupables allaient tout au plus jusqu'à dénoncer à l'opinion publique
européenne les cruautés du gouvernement britannique. Il aurait fallu cependant
s'en tenir à ces discrètes communications, et ne pas trop donner l'éveil à l'esprit
soupçonneux de sir Hudson Lowe. Mais M. de Las Cases
M. de Las Cases,
pour ce motif, est imagina de se servir d'un domestique qui retournait en Europe,
expulsé de Sainte- pour lui confier un long récit des souffrances de Sainte-
Hélène. Hélène, écrit sur une pièce de soie, afin qu'il fût plus facile à
cacher. Soit par l'infidélité du domestique, soit par la rigueur
des investigations exercées sur sa personne, le dépôt fut découvert. M. de Las
Cases qui avait particulièrement déplu à sir Hudson Lowe, fut condamné, en vertu
des règlements établis, à quitter Sainte-Hélène. Une troupe de gens armés se
saisit de sa personne et de celle de son fils, et les transporta l'un et l'autre à
James-Town. Sir Hudson Lowe déclara à M. de Las Cases qu'ayant enfreint les
règlements qui défendaient les communications clandestines, il serait conduit au
Cap, et du Cap en Europe. Il n'y avait point à disputer avec ce maître absolu, et il
fallut se soumettre. On visita les papiers de M. de Las Cases, on y trouva le journal
qu'il avait tenu de ses entretiens avec Napoléon, et le manuscrit des campagnes
d'Italie. On retint l'un et l'autre provisoirement.

Napoléon fut vivement courroucé de ce qu'on avait violé son domicile, et de ce


qu'on lui enlevait un homme aussi respectable, et dont il avait un si grand besoin. Il
réclama le manuscrit de ses campagnes d'Italie, qui lui fut rendu, et s'éleva avec
amertume contre l'enlèvement de M. de Las Cases, pour un acte aussi naturel,
aussi innocent qu'une plainte échappée à la souffrance, et prouvant même qu'on
ne songeait point à s'enfuir, car dans les pièces saisies rien n'avait trait à un projet
d'évasion. Aucun bâtiment ne s'étant trouvé prêt à partir, M. de Las Cases fut
retenu dans l'île, et mis pour ainsi dire au secret, car il ne pouvait communiquer
avec Longwood. Sir Hudson Lowe ayant eu ainsi le temps de
Sir Hudson Lowe
offre cependant de la réflexion, craignit que la présence de M. Las de Cases en
laisser M. de Las Europe ne fût plus fâcheuse pour lui et les ministres anglais
Cases à Sainte- que sa présence à Sainte-Hélène, car une fois libre, il pourrait
Hélène, ce que faire entendre la voix du malheur, voix qui serait fort écoutée,
celui-ci n'accepte même dans le parlement britannique. Il offrit donc à M. de Las
point. Cases de retourner à Longwood, à condition de ne plus
chercher à correspondre, et de profiter de la leçon qu'il venait
de recevoir par un mois de séquestration. Mais M. de Las Cases avait fait de son
côté les mêmes réflexions. Il avait pensé qu'il serait plus utile à Napoléon en
Europe qu'à Sainte-Hélène, en dénonçant les traitements que subissaient les
exilés. Il était fort inquiet aussi de l'état de santé de son fils, qui souffrait du climat
des tropiques, et n'accepta point la grâce que lui offrait sir Hudson Lowe. On ne lui
permit pas de voir Napoléon, à moins que ce ne fût devant témoins, ce qu'il refusa,
mais il lui fit parvenir les motifs de sa résolution, ainsi que plusieurs objets dont il
était dépositaire, et fut embarqué dans les derniers jours de décembre 1816, après
dix-huit mois passés auprès de Napoléon, dont une année à Sainte-Hélène.
Napoléon fut très-affecté du départ de M. de Las
Chagrin que le
départ de M. de Cases. C'était de ses compagnons d'exil celui qui
Las Cases fait avait l'instruction la plus variée, et qui par sa
éprouver à connaissance de l'anglais lui rendait le plus de
Napoléon. services, outre qu'il était d'un caractère très-doux
quoiqu'un peu susceptible. Sans méconnaître que
le désir de dénoncer à l'Europe les traitements infligés aux captifs de
Sainte-Hélène était entré pour beaucoup dans son refus de revenir à
Longwood, Napoléon ne se dissimulait pas non plus que sa santé, et
surtout celle de son fils, avaient contribué à sa détermination, et il
voyait clairement que tantôt les ombrages du gouverneur, tantôt le
climat, tantôt les devoirs de famille, diminueraient successivement la
petite société qui l'avait suivi, et dont la présence peuplait de
quelques visages amis son affreuse solitude. Son valet de chambre
Marchand, écrivant vite, lisant bien, sage, discret, dévoué à son
maître avec une simplicité touchante, et de jour en jour devenant
non plus un serviteur mais un ami, Marchand recueillait plus qu'un
autre de ces mots qui s'échappent d'une âme souffrante, et qui
semblent adressés à Dieu seul.—Si cela continue, disait Napoléon
en soupirant, il ne restera bientôt ici que moi et Marchand!—Puis
s'adressant à ce dernier, il ajoutait: Tu me feras la lecture, tu écriras
sous ma dictée, tu me fermeras les yeux, et tu iras vivre en Europe
au sein du bien-être que je t'aurai assuré.—

Le 1er janvier 1817 fut pour la colonie


Le 1er janvier à
exilée l'occasion d'une petite fête de 1817.
Sainte-Hélène.
famille. Les amis de Napoléon avaient soin de
saisir les anniversaires pour venir tous ensemble lui présenter leurs
hommages, comme ils faisaient jadis aux Tuileries, et lui prouver que
proscrit, chargé de chaînes, il était toujours pour eux l'empereur
Napoléon. Ce n'étaient plus comme aux Tuileries les fêtes de
l'orgueil, mais celles du cœur, du cœur contrit, humilié, et d'autant
plus expansif qu'il était plus malheureux. Madame Bertrand,
madame de Montholon, accompagnées de leurs maris, tenant leurs
enfants par la main, le général Gourgaud, et après eux Marchand
avec les serviteurs qui avaient suivi leur maître à Sainte-Hélène,
vinrent ce 1er janvier lui présenter leurs vœux. Quels vœux, hélas!
Que sa vie sur ce rocher ne fût pas trop amère, que sa santé ne
déclinât pas trop vite, que certaines souffrances physiques dont il
commençait à sentir l'atteinte ne fussent pas trop aiguës, car pour le
revoir en France rétabli sur le trône, ou seulement libre en Amérique,
personne n'osait y songer, et encore moins en parler. Napoléon était
plus triste que de coutume, à cause des souvenirs que réveillait
cette journée, et aussi à cause du départ de MM. de Las Cases. Il
accueillit ses compagnons avec des marques d'attendrissement qui
ne lui étaient pas ordinaires, et les remercia de leur dévouement de
la manière la plus expressive. Il avait toujours pris beaucoup de
plaisir à faire des dons, et des quelques débris de son opulence que
Marchand avait sauvés, il avait composé un petit trésor pour
témoigner de temps en temps sa gratitude à ceux qui lui rendaient
service. Il y puisa pour donner soit aux enfants qu'il aimait, soit à
leurs parents, quelques objets qui devaient être pour eux de
précieux souvenirs de famille. Après ces épanchements, la journée
étant fort belle, il déjeuna avec ses compagnons d'exil sous la tente
que l'amiral Malcolm lui avait fait dresser, et qui lui procurait la seule
ombre dont il pût jouir à Longwood. On y passa la plus grande partie
du jour, et peu à peu la beauté du ciel, les témoignages de ses amis,
un doux et cordial entretien, semblèrent dissiper la sombre tristesse
qui couvrait le front de Napoléon. On parla de la France, on s'occupa
du passé autrefois si éblouissant, on ne dit rien du présent, et pour
la première fois cependant on osa dire quelques mots de l'avenir
que d'ordinaire on ne cherchait pas à pénétrer, car si profondément
qu'on y regardât, on n'y découvrait que la prison! Pourtant une sorte
d'espérance commençait à poindre, et cette espérance naissait de la
possibilité d'un changement ministériel en Angleterre. À en juger par
les journaux il était facile de voir qu'à la suite des emportements de
1815 il s'opérait un retour dans les esprits, que les peuples
revenaient aux idées de liberté, et qu'en revenant à ces idées les
haines contre la France perdaient de leur violence. Le ministère de
lord Castlereagh était vivement attaqué. L'opposition avait demandé
compte à lord Bathurst de ses cruautés envers le prisonnier de
Sainte-Hélène, et il n'y avait aucune invraisemblance à supposer un
prochain changement dans le cabinet britannique. On n'allait certes
pas jusqu'à imaginer que Napoléon pourrait devoir un rôle
quelconque à un nouveau ministère, mais ce ministère pourrait bien
alléger les fers du prisonnier, le transporter dans une autre île, qui
sait même? peut-être lui ouvrir la libre Amérique. C'était peu
probable, mais l'âme humaine à défaut d'espérances fondées, se
repaît de chimères, tant il lui est impossible de ne pas espérer! On
rêva donc quelque peu dans cette journée, et on se sépara soulagé.

L'année 1817 fut plus triste encore que l'année


Année 1817,
plus triste que 1816, et tout présageait qu'il en serait ainsi des
les autres, car dans cette captivité sans fin
précédentes. présumable, et qui n'avait d'autre perspective que
la mort, la tristesse devait aller toujours en
croissant. Les promenades à cheval qui étaient indispensables à la
santé de Napoléon, avaient complétement cessé. Le cercle de trois
à quatre lieues dans lequel il était obligé de se renfermer s'il tenait à
être seul, avait fini par lui paraître aussi étroit que le préau d'une
prison. Ayant voulu le franchir et s'étant engagé dans les parties
inconnues de l'île, il avait plusieurs fois échappé à l'officier chargé de
le suivre, et celui-ci ayant fait l'observation que pour être fidèle à ses
ordres il serait forcé de se tenir plus près, Napoléon avait renoncé à
monter à cheval. Il était resté jusqu'à deux mois
Napoléon ne
sort plus, et sa sans sortir autrement que pour faire une courte
santé s'en promenade à pied. Précédemment il recevait
ressent quelquefois des Anglais ou des Hollandais
profondément. revenant des Indes en Europe, lesquels
demandaient au grand maréchal Bertrand
l'honneur de lui être présentés. Sir Hudson Lowe ayant essayé de
changer cette manière de procéder, et Napoléon voyant qu'on
voulait faire de Longwood un guichet qui ne s'ouvrirait que par la
main de son geôlier, ne recevait plus personne. Cette réclusion
absolue, surtout depuis le départ de M. de Las Cases, faisant cesser
pour lui toute distraction, il était tombé dans une sorte d'inertie
morale, qui, jointe à son inertie physique, devait produire sur lui les
effets les plus prompts et les plus funestes.
À cette époque arrivèrent trois commissaires des puissances
alliées, ayant mission de veiller à la garde du
Arrivée des prisonnier de Sainte-Hélène de concert avec sir
commissaires Hudson Lowe. Les puissances avaient en effet
européens à signé un traité par lequel approuvant tout ce que
Sainte-Hélène. l'Angleterre avait fait précédemment, elles lui
déléguaient le soin de détenir Napoléon, à
condition toutefois que des commissaires nommés par elles
pourraient résider à Sainte-Hélène, s'assurer de la présence
continue du prisonnier, et veiller tant à sa garde qu'aux traitements
qui lui seraient infligés. La Prusse s'en fiant aux Anglais du soin de
garder son ancien ennemi, et ne s'intéressant pas assez à lui pour
chercher à savoir comment on le traitait, n'avait envoyé personne.
La Russie, l'Autriche, la France, avaient expédié chacune un
commissaire. Ces commissaires confinés dans une île presque
inhabitée, n'avaient qu'un dédommagement en perspective, c'était
de voir et d'entretenir quelquefois l'illustre prisonnier. L'envoyé
français, M. de Montchenu, vieux royaliste, fort
Leurs
caractères passionné mais point méchant, répétait sans
particuliers et cesse que c'étaient les gens d'esprit qui avaient
leurs fait l'abominable révolution française, que leur chef
dispositions. Napoléon, plus spirituel, plus scélérat qu'eux tous
ensemble, était un démon à garder dans une cage
de fer. Il n'avait aucune envie de le fréquenter, mais il désirait se
procurer le plus souvent possible la certitude physique de sa
présence à Sainte-Hélène. M. de Sturmer, envoyé autrichien, au
service du plus curieux des hommes d'État, le prince de Metternich,
aurait voulu pouvoir amuser son chef par des détails piquants. Le
commissaire russe, M. de Balmain, chargé par Alexandre de veiller à
ce qu'on gardât Napoléon sûrement, mais pas trop cruellement,
avait bien aussi quelque envie de le voir, mais moins que ses deux
collègues, et se moquait assez volontiers des inquiétudes du
Français et de la curiosité de l'Autrichien.

L'attente de ces trois commissaires fut singulièrement trompée en


arrivant à Sainte-Hélène. Sir Hudson Lowe les ayant annoncés à
Longwood comme accrédités en vertu du traité du 2 août 1815,
Napoléon refusa péremptoirement de les admettre à ce titre. D'une
opiniâtreté invincible dans le malheur comme dans le bonheur, il ne
voulait pas s'écarter du principe qu'il avait posé, et d'après lequel il
soutenait que s'étant volontairement confié à l'Angleterre, on n'avait
pas le droit de le constituer prisonnier. Par ce
Cause qui les
empêche d'être motif, il avait déclaré que prêt à recevoir ces
admis auprès messieurs avec plaisir s'ils se présentaient comme
de Napoléon. individus, il ne les recevrait pas introduits auprès
de lui en vertu du traité du 2 août. Cette fidélité à
son thème était fort regrettable, car outre les distractions qu'il aurait
trouvées dans la société de ces commissaires, il aurait pu par leur
entremise faire parvenir à Vienne et à Saint-Pétersbourg certains
détails de sa captivité, qui probablement auraient ému la pudeur de
l'empereur François, et l'excellent cœur d'Alexandre. Sir Hudson
Lowe qui en jugeait ainsi, saisit avec empressement la difficulté
soulevée par Napoléon, et déclara que les trois commissaires
n'entreraient à Longwood qu'en vertu du traité précité. Ce n'était
point l'avis des trois commissaires qui auraient bien désiré, n'importe
à quel titre, être admis auprès de Napoléon, soit pour s'assurer de
sa présence, soit pour jouir d'une société que tout le monde eût
enviée. Mais sir Hudson Lowe, craignant l'ingérance de ces
commissaires dans les questions relatives à la garde des
prisonniers, ne voulut se prêter à aucun accommodement, et ils
restèrent à Sainte-Hélène sans pouvoir pénétrer à Longwood. De
temps en temps ils montaient à cheval, allaient faire le tour des
bâtiments occupés par Napoléon, se plaçaient aux issues où ils
espéraient le rencontrer, et étaient réduits ou à l'apercevoir de très-
loin, ou à recueillir quelques détails des allants et venants. Ils s'en
procuraient aussi par les compagnons de
Leurs
communications Napoléon lui-même. Ils avaient connu l'un le grand
indirectes avec maréchal Bertrand, l'autre les généraux Montholon
les prisonniers. et Gourgaud. Ils les recevaient, ou bien allaient à
Hutt's-Gate rendre visite à madame Bertrand. Ils
s'assuraient ainsi de la présence à Longwood de l'illustre prisonnier,
et laissaient échapper des nouvelles qui, fort insignifiantes à leurs
yeux, étaient d'un prix infini pour de pauvres captifs relégués dans
une île déserte à deux mille lieues de leur patrie. M. de Montholon,
le plus adroit des habitants de Longwood, avait l'art de faire parler
les commissaires, et de leur arracher parfois quelques détails
intéressants. Cherchant à flatter son maître malheureux, à réveiller
en lui l'espérance éteinte, il s'attachait à lui persuader tantôt que le
commissaire russe allait dénoncer à l'empereur Alexandre les
traitements qu'on lui faisait subir, tantôt que le mouvement des
esprits en Angleterre se prononçait contre le cabinet Castlereagh, et
qu'avec de nouveaux ministres il obtiendrait sinon la liberté de vivre
en Amérique, au moins un changement de résidence.

Le hasard avait aussi procuré à Napoléon un


Services que le
docteur moyen de communication avec l'Europe, par
O'Meara rend à l'établissement auprès de lui du docteur O'Meara.
Napoléon. Napoléon n'ayant pas de médecin en quittant la
France, en avait remarqué un à bord du
Bellérophon, qui avait su lui plaire. C'était le docteur O'Meara,
homme d'esprit, assez adroit, et moins entêté que ses confrères des
pratiques de la médecine anglaise. Napoléon, en fait de médecine,
n'avait foi qu'à celle de l'illustre Corvisart, qu'il caractérisait par ces
mots: l'expérience chez un homme supérieur, ne voulait en général
d'aucun remède, et repoussait absolument ceux des médecins
anglais. Il écoutait cependant le docteur O'Meara qu'il avait pris à
son service, se moquait de ses prescriptions, mais s'entretenait avec
lui tantôt en italien, tantôt en français, de toutes sortes de sujets,
puis l'envoyait à James-Town lui chercher des nouvelles. Sir Hudson
Lowe avait consenti à ce que le docteur O'Meara, en sa qualité
d'Anglais, restât auprès de Napoléon sans subir les mêmes gênes
que les autres habitants de Longwood, parce qu'il le jugeait
incapable de trahir son gouvernement (ce qui était vrai), et qu'il le
croyait tout au plus capable de quelques complaisances sans
danger. Se conduisant assez adroitement dans cette position
délicate, le docteur O'Meara s'en tirait sans trahir personne, rendait
à Napoléon le service fort innocent de lui apporter quelques
nouvelles d'Europe, rendait à sir Hudson Lowe le service de
constater chaque jour la présence du prisonnier, ce que l'officier
résidant à Longwood ne pouvait pas toujours faire, et trouvait encore
le moyen de plaire à Londres en transmettant au prince régent des
détails sur Napoléon, qui, sans être une infidélité envers celui-ci,
offraient à la curiosité du prince un intérêt véritable.

De certains points du plateau de Longwood on


Nouvelles
d'Europe. découvrait la mer, et dès qu'une voile se montrait,
on voulait savoir quel était le navire qui arrivait,
d'où il venait, quelles personnes, quelles choses il avait à bord. Tout
de suite on dépêchait le docteur O'Meara à James-Town, et il
rapportait souvent les journaux, quelquefois même des lettres
soustraites à la surveillance de sir Hudson Lowe. Napoléon s'était
ainsi procuré des nouvelles qui avaient un instant charmé son
malheur. Tantôt il avait appris l'acquittement de Drouot, l'évasion de
Lavallette, événements dont il s'était fort réjoui, tantôt la fameuse
ordonnance du 5 septembre, qui l'avait confirmé dans la douce
espérance que le parti de la violence serait bientôt vaincu dans toute
l'Europe. Il avait reçu aussi de sa famille des lettres qui l'avaient
vivement ému. Les unes lui disaient que son fils se portait bien et
grandissait à vue d'œil, les autres que sa mère, sa sœur Pauline,
ses frères, désiraient le joindre à Sainte-Hélène, et mettaient leur
fortune à sa disposition. Napoléon très-touché de
Napoléon fort
touché de celles ces offres était résolu à les refuser. Se considérant
qu'il reçoit de sa à Sainte-Hélène comme un condamné à mort, il
famille. n'aurait pas plus supporté que sa mère et sa sœur
y vinssent, qu'il n'aurait voulu les voir monter sur
Elle lui offre sa l'échafaud avec lui. Sachant qu'excepté le cardinal
présence et sa Fesch et sa mère, ses proches avaient à peine de
fortune, qu'il quoi vivre, et ayant de plus 4 à 5 millions
n'accepte pas.
secrètement déposés chez M. Laffitte, il n'aurait
pas consenti à leur être à charge. D'ailleurs il
n'avait même plus besoin de recourir à ce dépôt, car sir Hudson
Lowe après l'avoir tourmenté sur les dépenses de sa maison, avait
cessé d'y insister. Il fit donc remercier ses proches de leurs offres, en
disant qu'en y étant très-sensible il ne les acceptait point.

Malgré sa réclusion absolue, Napoléon reçut


Visite de
quelques quelques Anglais à l'époque du retour en Europe
Anglais de la flotte des Indes. Ce moment, comme nous
revenant des l'avons dit, était celui d'une véritable fête à Sainte-
Indes. Hélène, car les bâtiments venant de cette
destination lointaine prenaient des vivres frais à
James-Town, y laissaient ou de l'argent ou des marchandises, et
animaient un instant la solitude profonde de ce rocher perdu au
milieu de l'Océan. Naturellement la curiosité de voir Napoléon était
extrême chez les voyageurs de toute condition, et d'autant plus vive
qu'ils avaient plus de culture d'esprit. De grands dignitaires, des
magistrats, des savants, passagers sur la flotte des Indes, se
mettant au-dessus des mesquines prescriptions de sir Hudson
Lowe, s'adressèrent directement au grand maréchal pour obtenir
l'honneur d'être présentés à Napoléon. Dans le nombre on compta
lord Amherst et plusieurs personnages distingués. Napoléon les
admit auprès de lui, se montra plein de calme, de douceur, de bonne
grâce, et s'entretint longuement avec eux, tantôt des Indes, tantôt
des affaires anglaises elles-mêmes, et toujours avec sa supériorité
d'esprit accoutumée. Les plus importants lui demandant ses
messages pour l'Europe, il leur répondit avec une noble résignation:
Je ne vous charge de rien. Rapportez à vos
Langage que
leur tient ministres ce que vous avez vu. Je suis ici sur un
Napoléon. rocher, qu'on a rendu pour moi plus étroit encore
que la nature ne l'avait fait, et sur lequel je ne puis
pas même me promener à cheval, après avoir été à cheval toute ma
vie. J'habite sous un toit de planches, où je suis tantôt dévoré par la
chaleur, tantôt envahi par une humidité pénétrante. Je ne puis en
sortir sans être entouré de sbires par un geôlier impitoyable. Je ne
puis ni écrire à ma famille, ni recevoir de ses nouvelles sans avoir ce
geôlier pour confident. On m'a ôté déjà deux de mes compagnons,
et Dieu sait si on me laissera ceux qui me restent! Si on voulait ma
mort, il eût été plus noble de me traiter en soldat comme l'illustre
Ney. Si ce n'est pas cela qu'on veut, qu'on me donne de l'air et de
l'espace. Qu'on ne craigne pas mon évasion. Je sais qu'il n'y a plus
dans le monde de place pour moi, et que mon seul avenir est
d'expirer dans vos fers. Mais la question est de savoir si, en y
demeurant, j'y serai à la torture. Au surplus je ne demande rien; que
ceux qui auront vu ma situation, et que leur cœur portera à la faire
connaître, le fassent. Je ne les en prie même pas.—
L'état de Napoléon justifiait assez les tristes
La santé de
Napoléon pressentiments auxquels il se livrait en parlant de
décline lui-même. Ceux qui le voyaient étaient frappés de
rapidement. la profonde altération de ses traits, et bien qu'il ne
fût pas encore à la veille de sa mort, on pouvait
aisément augurer qu'elle ne serait pas éloignée. L'aversion qu'il avait
conçue pour la promenade à cheval telle qu'on la lui avait permise,
l'avait amené à négliger complétement ce genre d'exercice. Malgré
la belle saison arrivant vers la fin de 1817 à Sainte-Hélène, il passa
presque six mois sans mettre le pied à l'étrier. Le docteur O'Meara
lui pronostiquant que cette renonciation aux exercices de toute sa
vie lui serait funeste: Tant mieux, répondait-il; la fin viendra plus vite.
—Il commençait à éprouver une douleur sourde au côté droit, et
Marchand lui disait qu'il aurait besoin d'un peu d'exercice. Oui, disait-
il en soupirant, il me serait bon de faire à cheval une course de dix à
douze lieues; mais le peut-on sur ce rocher?—Il avait toujours eu le
goût des bains prolongés; il se livra plus que jamais à ce penchant,
qui lui procurait un soulagement à la douleur dont il souffrait. Il restait
plusieurs heures de suite dans un bain chaud, puis se couchait, et
s'affaiblissait ainsi à vue d'œil. Son esprit attristé ne perdait ni en
force, ni en éclat, mais son corps devenait chaque jour plus débile,
et il disait à ceux qui lui donnaient leurs soins et paraissaient affligés
de cet affaiblissement: Vous le voyez, ce n'était pas mon corps qui
était de fer, c'était mon âme.—

Sir Hudson Lowe, en voyant décliner si vite la


Sir Hudson
Lowe lui fait santé de Napoléon, commença à s'inquiéter,
construire une craignant qu'on ne lui attribuât ce déclin rapide.
maison Bien des voix s'étaient élevées en Angleterre
nouvelle. contre les traitements infligés au captif de Sainte-
Hélène, et il ne voulait pas fournir un fondement à
de telles accusations. N'osant lever l'interdiction des promenades à
cheval sans surveillance, il pensa qu'un changement de demeure
serait un remède efficace, d'autant que les bâtiments de Longwood,
construits en terre et en bois, tombaient déjà en ruine. L'abandon de
Plantation-House à l'illustre prisonnier aurait répondu à toutes les
convenances, mais il entendait le garder pour sa famille, et il prit le
parti de bâtir. Lord Bathurst l'y avait autorisé, à condition que le
nouvel emplacement ne coûterait pas trop cher à acquérir. Soit que
la dépense d'acquisition fût trop grande du côté de Plantation-
House, soit que le plateau de Longwood parût toujours plus facile à
surveiller, sir Hudson Lowe résolut d'y laisser la nouvelle demeure
de Napoléon, et seulement de choisir, en se rapprochant du pic de
Diane, un endroit où le vent du sud-est se ferait moins sentir. Il fit
part à Napoléon de ce projet, et lui envoya tous les plans pour qu'il
pût y introduire les changements qui lui conviendraient. Napoléon
répondit que toute habitation dans cette partie de l'île serait funeste
à sa santé, que d'ailleurs on mettrait trois ou quatre ans à mener ces
constructions à fin, que dans trois ou quatre ans ce serait un
tombeau et non pas une maison qu'il lui faudrait; qu'il aurait eu
l'incommodité des ouvriers dans son voisinage, sans pouvoir profiter
de leur travail, et que si c'était son goût qu'on cherchait à connaître il
déclarait qu'il ne désirait nullement une maison nouvelle, et
s'accommodait de celle qu'il avait, bien suffisante pour y mourir.

Sir Hudson Lowe ne se laissa point décourager par cette


réponse, et entreprit en effet de bâtir, en choisissant 1818.
l'exposition la mieux abritée possible, dans le district de
Longwood, et en élevant un mur de gazon qui épargnât aux yeux et
aux oreilles des exilés la vue et le bruit d'un chantier.

Napoléon dicte Le 1er janvier 1818 fut plus triste que les
beaucoup précédents, et beaucoup plus que celui de 1817,
moins, et lit quoique ce dernier eût été attristé par le départ de
davantage. M. de Las Cases. Napoléon travaillait moins, et
semblait découragé de dicter le récit de ses
campagnes, s'en fiant à la postérité du soin de sa gloire.—À quoi
bon, disait-il, tous ces mémoires à consulter, présentés à notre juge
à tous, la postérité? Nous sommes des plaideurs qui ennuient leur
juge. La postérité est un appréciateur des événements plus fin que
nous. Elle saura bien découvrir la vérité sans que nous nous
donnions tant de peine pour la lui faire parvenir.—Napoléon dictait
moins, mais il lisait davantage. Sa sensibilité au beau, devenue
exquise par l'âge et la souffrance, savourait avec délices les chefs-
d'œuvre de l'esprit humain. Le soir, parlant un peu moins des
événements de sa vie, il parlait de ses lectures, et parfois lisait à ses
amis des passages des grands écrivains de tous les temps avec
l'accent d'une haute et sûre intelligence.

Il lisait souvent l'Écriture sainte, dont la grandeur


Son jugement
sur les grands frappait son génie; mais Homère avait sa
écrivains. préférence sur tout autre monument de l'antiquité.
Il le trouvait grand et vrai, paraissait charmé du
contraste qu'offraient les sentiments délicats, nobles, souvent
sublimes des personnages de l'Iliade, avec leurs mœurs simples
jusqu'à la grossièreté, et faisait la remarque que peu importait le
costume jeté sur l'homme, pourvu que cet homme fût l'homme
véritable, celui de tous les temps et de tous les pays. Ce qui le
charmait encore dans Homère, c'était avec la grandeur la parfaite
vérité.—Homère, disait-il, a vu, agi. Virgile, au contraire, est un
régent de collége, qui n'a rien vu, ni rien fait.—Cette sévérité à
l'égard de Virgile provenait de ce que Napoléon, ne sachant pas
assez le latin pour apprécier la délicieuse langue du poëte
d'Ausonie, n'était sensible qu'à la vérité et à la majesté des tableaux,
moindre chez Virgile que chez Homère.

Parmi les écrivains modernes les auteurs dramatiques avaient sa


préférence. Il n'aimait pas les genres incertains, ni le mélange du
comique avec le tragique. Il méprisait ce que nous appelons le
drame, et disait, que c'était la tragédie des femmes de chambre. Il
vantait la grandeur chez Corneille, l'éloquence des sentiments chez
Racine, et la profondeur comique chez Molière, prisait peu Voltaire
comme auteur dramatique, en l'admirant d'ailleurs beaucoup comme
prosateur pour le fond et la forme. Sensible à la grâce mais toujours
positif, il lisait avec un plaisir infini madame de Sévigné, en disant
cependant qu'après l'avoir lue avec délices il ne lui en restait rien. Il
trouvait l'histoire médiocrement écrite en France, excepté les
mémoires, et s'en prenait de cette infériorité à l'ignorance des
affaires dans laquelle on avait fait vivre les gens de lettres. Il entrait
volontiers dans les difficultés de cet art, qu'il avait pratiqué lui-même,

You might also like