Professional Documents
Culture Documents
Full download The 9 Pitfalls of Data Science Gary Smith file pdf all chapter on 2024
Full download The 9 Pitfalls of Data Science Gary Smith file pdf all chapter on 2024
Full download The 9 Pitfalls of Data Science Gary Smith file pdf all chapter on 2024
Smith
Visit to download the full and correct content document:
https://ebookmass.com/product/the-9-pitfalls-of-data-science-gary-smith/
More products digital (pdf, epub, mobi) instant
download maybe you interests ...
https://ebookmass.com/product/distrust-big-data-data-torturing-
and-the-assault-on-science-gary-smith/
https://ebookmass.com/product/the-ai-delusion-gary-smith/
https://ebookmass.com/product/avoiding-data-pitfalls-how-to-
steer-clear-of-common-blunders-when-working-with-data-and-
presenting-analysis-and-visualizations-jones/
https://ebookmass.com/product/building-a-data-culture-the-usage-
and-flow-data-culture-model-gary-w-griffin/
Data Analytics VCE Units 3 & 4 Gary Bass
https://ebookmass.com/product/data-analytics-vce-units-3-4-gary-
bass/
https://ebookmass.com/product/foundations-of-calculus-for-data-
science-an-foundational-guide-to-understanding-the-application-
of-calculus-to-data-science-bisette/
https://ebookmass.com/product/principles-of-data-science-sinan-
ozdemir/
https://ebookmass.com/product/game-data-science-el-nasr/
https://ebookmass.com/product/foundations-of-materials-science-
and-engineering-7th-edition-william-fortune-smith/
The 9 Pitfalls of Data Science
Gary Smith and Jay Cordes have a most captivating way and special talent
to describe how easy it is to be fooled by the promises of spurious data and
by the hype of data science.
Professor John P.A. Ioannidis,
Stanford University
Smith and Cordes have produced a remarkably lucid, example-driven text
that anybody working near data would do well to read. Though the book is
presented as fables and pitfalls, a cogent, scientific approach reveals itself.
Managers of data science teams stand to learn a great deal; seasoned data
scientists will nod their heads knowingly.
D. Alex Hughes
Adjunct Assistant Professor, UC Berkeley School of Information
The current AI hype can be disorienting, but this refreshing book informs
to realign expectations, and provides entertaining and relevant narrative
examples that illustrate what can go wrong when you ignore the pitfalls of
data science. Responsible data scientists should take heed of Smith and
Cordes’ guidance, especially when considering using AI in healthcare
where transparency about safety, efficacy, and equity is life-saving.
Michael Abramoff, MD, PhD,
Founder and CEO of IDx
Watzke Professor of Ophthalmology and Visual Sciences at the
University of Iowa
In this era of big data, it’s good to have a book that collects ways that big
data can lie and mislead. This book provides practical advice for users of
big data in a way that’s easy to digest and appreciate, and will help guide
them so that they can avoid its pitfalls.
Joseph Halpern
Joseph C. Ford Professor of Engineering,
Computer Science Department, Cornell University
Increasingly, the world is immersed in data! Gary Smith and Jay Cordes offer
up a veritable firehose of fabulous examples of the uses/misuses of all that
“big data” in real life. You will be a more informed citizen and better-armed
consumer by reading their book . . . and, it couldn’t come at a better time!
Shecky Riemann
math blogger
THE 9 PITFALLS OF
DATA SCIENCE
1
1
Great Clarendon Street, Oxford, OX2 6DP,
United Kingdom
Oxford University Press is a department of the University of Oxford.
It furthers the University’s objective of excellence in research, scholarship,
and education by publishing worldwide. Oxford is a registered trade mark of
Oxford University Press in the UK and in certain other countries
© Smith and Cordes 2019
The moral rights of the authors have been asserted
First Edition published in 2019
Impression: 1
All rights reserved. No part of this publication may be reproduced, stored in
a retrieval system, or transmitted, in any form or by any means, without the
prior permission in writing of Oxford University Press, or as expressly permitted
by law, by licence or under terms agreed with the appropriate reprographics
rights organization. Enquiries concerning reproduction outside the scope of the
above should be sent to the Rights Department, Oxford University Press, at the
address above
You must not circulate this work in any other form
and you must impose this same condition on any acquirer
Published in the United States of America by Oxford University Press
198 Madison Avenue, New York, NY 10016, United States of America
British Library Cataloguing in Publication Data
Data available
Library of Congress Control Number: 2019934000
ISBN 978–0–19–884439–6
DOI: 10.1093/oso/9780198844396.001.0001
Printed and bound by
CPI Group (UK) Ltd, Croydon, CR0 4YY
Links to third party websites are provided by Oxford in good faith and
for information only. Oxford disclaims any responsibility for the materials
contained in any third party website referenced in this work.
Gary Smith and Jay Cordes have a most captivating way and special talent
to describe how easy it is to be fooled by the promises of spurious data and
by the hype of data science.
Professor John P.A. Ioannidis,
Stanford University
Smith and Cordes have produced a remarkably lucid, example-driven text
that anybody working near data would do well to read. Though the book is
presented as fables and pitfalls, a cogent, scientific approach reveals itself.
Managers of data science teams stand to learn a great deal; seasoned data
scientists will nod their heads knowingly.
D. Alex Hughes
Adjunct Assistant Professor, UC Berkeley School of Information
The current AI hype can be disorienting, but this refreshing book informs
to realign expectations, and provides entertaining and relevant narrative
examples that illustrate what can go wrong when you ignore the pitfalls of
data science. Responsible data scientists should take heed of Smith and
Cordes’ guidance, especially when considering using AI in healthcare
where transparency about safety, efficacy, and equity is life-saving.
Michael Abramoff, MD, PhD,
Founder and CEO of IDx
Watzke Professor of Ophthalmology and Visual Sciences at the
University of Iowa
In this era of big data, it’s good to have a book that collects ways that big
data can lie and mislead. This book provides practical advice for users of
big data in a way that’s easy to digest and appreciate, and will help guide
them so that they can avoid its pitfalls.
Joseph Halpern
Joseph C. Ford Professor of Engineering,
Computer Science Department, Cornell University
Increasingly, the world is immersed in data! Gary Smith and Jay Cordes offer
up a veritable firehose of fabulous examples of the uses/misuses of all that
“big data” in real life. You will be a more informed citizen and better-armed
consumer by reading their book . . . and, it couldn’t come at a better time!
Shecky Riemann
math blogger
Introduction
A
2012 article in the Harvard Business Review named data scientist
the “sexiest job of the 21st century.” Governments and businesses
are scrambling to hire data scientists, and workers are clamoring
to become data scientists, or at least label themselves as such.
Many colleges and universities now offer data science degrees, but their
curricula differ wildly. Many businesses have data science divisions, but
few restrictions on what they do. Many people say they are data scientists,
but may have simply taken some online programming courses and don’t
know what they don’t know. The result is that the analyses produced by
data scientists are sometimes spectacular and, other times, disastrous. In
a rush to learn the technical skills, the crucial principles of data science
are often neglected.
Too many would-be data scientists have the misguided belief that we
don’t need theories, common sense, or wisdom. An all-too-common
thought is, “We shouldn’t waste time thinking about why something may
or may not be true. It’s enough to let computers find a pattern and assume
that the pattern will persist and make useful predictions.” This ill-founded
belief underlies misguided projects that have attempted to use Facebook
status updates to price auto insurance, Google search queries to predict
flu outbreaks, and Twitter tweets to predict stock prices.
Data science is surely revolutionizing our lives, allowing decisions to
be based on data rather than lazy thinking, whims, hunches, and preju-
dices. Unfortunately, data scientists themselves can be plagued by lazy
The 9 Pitfalls of Data Science. Gary Smith and Jay Cordes. Oxford University Press (2019).
© Gary Smith and Jay Cordes 2019. DOI: 10.1093/oso/9780198844396.001.0001
Introduction |
thinking, whims, hunches, and prejudices—and end up fooling them-
selves and others.
One of Jay’s managers understood the difference between good data
science and garbage. He categorized people who knew what they were
doing as kids; those who spouted nonsense were clowns. One of our goals
is to explain the difference between a data scientist and a data clown.
Our criticism of data clowns should not be misinterpreted as a disdain
for science or scientists. The Economist once used a jigsaw puzzle and a
house of cards as metaphors:
In any complex scientific picture of the world there will be gaps, misperceptions
and mistakes. Whether your impression is dominated by the whole or the holes
will depend on your attitude to the project at hand. You might say that some see
a jigsaw where others see a house of cards. Jigsaw types have in mind an overall
picture and are open to bits being taken out, moved around or abandoned should
they not fit. Those who see houses of cards think that if any piece is removed, the
whole lot falls down.
We are firmly in the jigsaw puzzle camp. When done right, there’s no
question that science works and enriches our lives immensely.
We are not going to bombard you with equations or bore you with tech-
nical tips. We want to propose enduring principles. We offer these
principles as nine pitfalls to be avoided. We hope that these principles will
not only help data scientists be more effective, but also help everyone dis-
tinguish between good data science and rubbish. Our book is loaded with
grand successes and epic failures. It highlights winning approaches and
warns of common pitfalls. We are confident that after reading it, you will
recognize good data science when you see it, know how to avoid being
duped by data, and make better, more informed decisions. Whether you
want to be an effective creator, interpreter, user, or consumer of data, it is
important to know the nine pitfalls of data science.
2 | INTRODUCTION
P I T FA L L 1
Jerry showed up for work one morning and found chaos. Revenue had
dropped 10 percent overnight, and no one knew why.
The analytics department scrambled for reasons and couldn’t find any.
There hadn’t been any power outages, server crashes, or known bugs in
their software, but revenue had plummeted in every country, on every
web page, and for every ad. A dozen data analysts met in a conference
room to study the numbers and find an answer.
After a long and frustrating discussion, Jerry looked at the minute-by-
minute record of clicks on millions of web pages and noticed that revenue
stopped everywhere at 2 a.m. and didn’t resume until 3 a.m. What are the
chances everything would stop at exactly the same time for precisely one
hour? It’s embarrassing how long it took a dozen smart people to figure
out what happened: daylight saving time.
It’s even more embarrassing that the very same phony crisis happened
the following year. They didn’t learn from their mistake, but there is a big-
ger lesson here. Useful data analysis requires good data. These data sug-
gested a nonexistent problem because the data were flawed. Good data
The 9 Pitfalls of Data Science. Gary Smith and Jay Cordes. Oxford University Press (2019).
© Gary Smith and Jay Cordes 2019. DOI: 10.1093/oso/9780198844396.001.0001
160
140
120
Number of earthquakes
100
80
60
40
20
0
1900s 1910s 1920s 1930s 1940s 1950s 1960s 1970s 1980s 1990s 2000s
6000
5000
4000
Crime incidents
3000
2000
1000
0
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31
Day of month
Figure 1.2 Most crime occurs on the first day of the month?
40
30
Percent
20
10
0
0 25 50 75 100 125 150 175 200
Income, thousands of dollars
80
Percent readmitted within 30 days
60
40
• •
•
•
20
• •
•
0
6.8 6.9 7.0 7.1 7.2 7.3 7.4 7.5 7.6
Blood pH
80
•
Percent readmitted within 30 days
60
• •
40 •
•
•
20
0
6.8 6.9 7.0 7.1 7.2 7.3 7.4 7.5 7.6
Blood pH
80
Percent died in hospital
60
40
20
0
6.8 6.9 7.0 7.1 7.2 7.3 7.4 7.5 7.6
Blood pH
Figure 1.7 is a rendition of the figure she used to document her conclusion,
minus a piano player in the background. The professor concluded that per-
forming these new genres was more dangerous than going to war:
People who go into rap music or hip hop or punk, they’re in a much more occupa-
tional hazard profession compared to war. We don’t lose half our army in a battle.
The average age at death for musicians in relatively new genres does appear
to be dramatically lower than for musicians in traditional music genres
and for the population as a whole. However, a closer look reveals some
puzzling issues. The female and male life expectancy lines seem to be
showing an increase in life expectancy over time, which makes sense, but
years are not on the horizontal axis! The horizontal axis is 14 musical
genres. Why are the trends in U.S. life expectancy graphed in comparison
to musical genres, rather than by year?
It is also bewildering that the average age at death for rappers and male
hip-hop artists is less than 30. Seriously, don’t some survive until their
40s, 50s, or even older ages? If we pause and think about these data before
comparing hip-hopping to going to war, the fundamental problem emerges.
The new genres are so new that the performers haven’t had a chance to live
to an old age.
75
70
Average age at death, years
65 U.S. males
60
55
50
45
male musicians
40
35 female musicians
30
25
Blues
Jazz
Country
Gospel
Soul
Pop
World music
Metal
Rap
Hip Hop
Folk
Rock
Disco/Funk
Ounk
Hip hop began in the late 1970s. People who began doing hip hop in
1980 at age 20 and are still alive would be 57 years old in 2017. Anyone who
died before 2017 would be younger than 57. People who began doing hip
hop after 1980 would be even younger. In contrast, blues, jazz, and coun-
try have been around long enough for performers to grow old.
Once again, one of the keys to becoming a good data scientist is to use
good data.
Households, millions 5
0
1965 1970 1975 1980 1990
Figure 1.8 Number of households earning more than $100,000 per year
Do you notice anything odd about this figure? There is a 5-year differ-
ence between each of the first four bars, but a 10-year difference between
the fourth and fifth bars (1980 and 1990). If the bars had been spaced
properly and a 1985 bar inserted, the increase over time would appear
gradual, without an abrupt jump between 1980 and 1990.
In addition, $100,000 in 1990 is not the same as $100,000 in 1965. Prices
were about four times higher, so that $100,000 in 1990 was roughly e quivalent
to $25,000 in 1965. We should compare the number of families earning
$25,000 in 1965 with the number of families earning $100,000 in 1990. We
should also take into account the increase in the population. It is not sur-
prising that more people have high incomes when there are more people.
Figure 1.9 fixes all these problems by showing the percentage of house-
holds that earned more than $100,000 in inflation-adjusted dollars, with
1985 inserted, and data for 1995 through 2015 included to give more his-
torical context. The 1980s are unremarkable. What does stand out is 2000,
the height of the Internet bubble, followed by the burst bubble, the Great
Recession, and recovery.
Good data scientists know that the purpose of a graph is to inform, not
to mislead. Dollar data should be adjusted for inflation. Data that change
as the population grows should be adjusted for population growth.
Relevant data should not be omitted in order to deceive.
20
Households, percent
15
10
0
1965 1970 1975 1980 1985 1990 1995 2000 2005 2010 2015
Figure 1.9 Percent of households earning more than $100,000 per year, adjusted for inflation
L aw of small numbers | 3
tournament, Phil Mickelson hit an errant drive and the ball caromed off
the head of a spectator on one side of the fairway, and landed in the rough
on the other side of the fairway. Mickelson told the spectator, “If your
head was a touch softer, I’d be in the fairway.”
A professional golfer who has the best score in the first round of a golf
tournament is not necessarily going to win the tournament. A golfer who
wins a tournament is not necessarily the best golfer in the world, and is
certainly not assured of winning the next tournament he plays in.
In any competition—including academic tests, athletic events, or company
management—where there is an element of luck that causes performances
to be an imperfect measure of ability, there is an important difference
between competitions among people with high ability and competitions
among people of lesser ability. If four casual golfers play a round of golf,
and one player is much better than the others, the winner is determined
mostly by ability. If four of the top golfers in the world play a round of golf,
the winner is determined mostly by luck. This is the paradox of luck and
skill: the more skilled are the competitors, the more the outcome is deter-
mined by luck.
Let’s look at some pro data. There are four major men’s golf tourna-
ments: the Masters Tournament, U.S. Open, British Open, and PGA
Championship. In each of these tournaments, any of a dozen or more
players might win. Who does win is largely a matter of luck. That’s why
there are so few repeat winners. As of February 2019, a total of 221 golfers
have won at least one of the four major golf championships; 139 (63 per-
cent) won once, and never again.
The Masters Tournament is the only major golf tournament that is played
on the same course every year (the Augusta National Golf Club), which
makes for a fair comparison of player scores in adjacent years. The Masters
Tournament begins during the first full week in April with close to 100 golf-
ers playing 18-hole rounds on Thursday and Friday. After these 36 holes, the
top 50 players, plus any player who is within 10 strokes of the leader, make
the cut, which allows them to play rounds 3 and 4 on Friday and Saturday.
There were 53 golfers who made the cut in 2017 and 53 in 2018, but only
27 golfers made the cut both years, which is, by itself, evidence of the
importance of luck in golf. Figure 1.10 shows the 2017 and 2018 scores for
the 27 golfers who made the cut both years. (Remember, low scores are
better.) The correlation between the 2017 and 2018 scores is 0.14. There is
a positive correlation, but it is loose.
IRODALOM ÉS KASZINÓ
CSIPOGÁS
Sok idő mult el azóta, hogy Tisza István gróf a róla való
ellenvéleményt azokkal a madárhangokkal hasonlitotta össze, amik
az Erzsébet-téren a feje tetejére potyognak. De nekem még most is
tátva a szájam miatta. Nem azért, hogy e példázat nem finom. Ha
csak ezzel lehetett kifejezni, amit Tisza mondani akart, akkor
jogosan használta ezt a hasonlatot. Mert plasztikusnak eléggé
plasztikus. Hanem a kétségbeejtő önbizalom miatt, ami benne
megnyilatkozik. Hiszen vannak nagyemberek az emberiség
történetében, istennek hála, hogy vannak; nincs gyönyörübb
látnivaló egy ilyen nagyembernél. Mért olvasok történelmet? Csak
azért, hogy a nagyemberekkel találkozzam, szinte ugy mondanám:
hogy érintkezzem velük. A kortársi nagyemberek valamennyiével
ugyanis lehetetlen találkoznom. Tisztelnem kell az idejüket és
kimélnem a magamét. Ha nem kerülhetek közelebbi ismeretségbe
velük: akkor semmi egyebet nem kaphatnék róluk, – ama futó félóra
alatt, amit mellettük tölthetnék – mint elmosódó képet testi
mivoltukról. Tehát, ha mégannyiszor kimennék is Párisba: nem
jelentkezném vizitre Anatole Francenál, aki pedig engem csakugy
fogadna, mint ezer más idegent, akikkel egy-egy hiábavaló
negyedórát elpocsékol. De minek? Igy, messziről, jobban ismerem
és jobb, ha a hegyes fehér szakállát és a házisapkáját is csak
magam elé képzelem, minthogyha néhány feszes percen belül
valóban megtekintem. Pedig akárminő időben él valaki, mindig
vannak nagyember kortársai.
A nagyemberek természetrajzához valóban hozzátartozik az
önbizalom. Enélkül nem is tudnák nagy munkájukat elvégezni. De
hozzátartozik a kétség, a küzködés, a bizonytalanság, a töprengés
is. Egy kis hamletinek is kell lennie a nagy emberben. E hamleti
lélekdarabkának nem okvetlenül kell megnyilatkoznia már a
kortársak előtt, elég, ha utólag, a nagy ember naplójából, vagy
memoárjaiból tudjuk meg, hogy mikor a legnagyobbat művelte, akkor
is küzködött magával, egy kicsit, s mikor a világ már tapsolt és azt
mondta: ‚Nagyszerü‘ – benne még halkan felvetődött a kérdés:
– Vajon? Nem szamárság-e?
Tóth Ede életrajzában olvasom, hogy mikor 1875-ben
Balatonfüreden a Tolonc egyik felvonását befejezte, kipirult arccal
ment ki a sétányra és a kérdezősködőknek ezt felelte:
– Most végeztem be egy felvonást, ami vagy őrültség, vagy
sekszpiri gondolat.
Ha akármelyik eshetőség igaz lett volna, akkor Tóth Edét joggal
számithatnók a mi nagy embereink közé. De az a felvonás nem is
őrültség, nem is sekszpiri gondalot. S Tóth Edében inkább csak ez a
kételkedés volt nagyemberi. De lám, mégis megvolt benne. Hogyne
volna meg nagy államférfiakban, kiknek munkája olyan, hogy ötven
évig nagyszerü lehet, aztán már kárhozatos. Napoleon is csak kifelé
mutatta a leghatározottabb energiát, befelé csatázott önmagával.
Bismarck ugyanigy cselekedett. Menjek visszább? Mondjam, hogy
Krisztus negyven napig harcolt az ördöggel? Fölösleges példák
ezek, mert biztos, hogy azok az emberek, akik milliók sorsáról
döntöttek, otthon, hálóingben, időszakonként meg-megdöbbentek
azon, hogy jól döntöttek-e? S ha ez a kétség életükben kifelé nem is
nyilatkozott meg, – mert akkor támogatta volna azokat az
ellenfeleket, akik a nagy ember alkotó munkáját gátolni igyekeztek, –
mindenesetre megóvta őket attól, hogy az ellenvélekedőket
verebeknek nyilvánitsák.
Most én kérek bocsánatot a hasonlatért. Azért, hogy az ujvidéki
bankett szónokát Napoleonnal, Bismarckkal, Krisztussal vontam egy
kalap alá. A nagyemberek mind nagy rombolók és nagy alkotók
voltak. Tisza István, s ezt majd csak az utókor állapitja meg még
határozottabban, sem egyik, sem másik. Rombolt ugyan. De
hogyan? Aki el akarja pusztitani a parlamentárizmust, amit – elvi
álláspont magaslatáról – meg lehet cselekedni, az nem ugy rombolja
le, hogy majomparádét csinál helyette. Alkotott is. De mit? A Code
Napoleon-ban, az egészben, nincs annyi sajtóhiba, ahány lényeges
ostobaság csak egy-egy Tisza-féle törvényben foglaltatik. Szóval: az
ő munkája, ezt már ma biztosan ki lehet mondani, sem nagystilü
pusztitás, sem hatalmas épitkezés. De jószerivel még ő maga sem
gondolhatja, hogy az. Neki is tudnia kell, hogy időfordulót élünk. A
szocializmus ostromolja a parlament kapuit. A nagyember kinyitja a
kaput, vagy agyonveri az ostromlókat. Tisza egyiket sem cselekszi.
Ő tehát csak megakadályozza a nagy idők elkövetkezését. Még ezt
sem nagyszabásuan. A foltozó suszter munkáját végzi egy
elvénhedt rend cipőin. Pedig csak néhány év kérdése, hogy ezt a
rendet sirba tegyék, s akkor a cipő is ottpenészedik majd a halott
bütykös lábain.
Verebek? Aki látó-szemü embere van ennek az országnak – nem
a politikusokat gondolom, nem – mind egyetért abban, ha különböző
szempontokból is, hogy amit Tisza csinál: legalább is értelmetlen.
Mindezek csak verebek volnának? Nem valószinü. S ha Tisza
valóban hinné is ezt, kimondania nem volna szabad. Rettegnie
kellene, hogy tizmillió magyar közt, csak ő az egyetlenegy, aki nem
megy verébszámba. Ha igy volna, nem volna érdemes dolgoznia a
tizmillióért. Sajnos, nem igy van. A tizmillió magyar közt ő az
egyetlenegy, aki nem alkalmas e tizmilliónak a boldogitására. Mások
nem kerülnek abba a helyzetbe, hogy a maguk alkalmasságát
bebizonyitsák. Tisza már kétszer bebizonyitotta az alkalmatlanságát.
Mindamellett ő beszél, s a többiek hallgatni kénytelenek, épen azért,
mert nem verebek, hogy csiripeljenek.
És aki, – tul politikán, napi aktualitáson, pártlelkesedésen, – ugy
nézi a ma eseményeit, mintha máris történetet olvasna, egy-egy
pillanatra sajnálja Tiszát, aztán egy-egy pillanatra szégyelli magát
miatta. De csak pillanatokról van szó. Az egész ember és minden,
ami körülötte van, nagyon el fog mulani. Roppant jelentéktelen
epizódja lesz a legujabb magyar históriának. Ez évek sirján nem
emelkedik obeliszk. Akácfa nő csak ott és rajta verebek ülnek,
szürke verebek, feledést hullatók.
A GOROMBA KÜLFÖLD
MAGYAR NÉPDAL
Nem kell erre azt mondani: ‚Ez a ne zokogjál, ez Pest.‘ Nem igaz.
Ez csak a külső Dob-utca, amelylyel Budapestet azonositani
mégsem lehet. Nem igaz, hogy Budapesten a magyarok nem tudnak
magyarul. Bizonyos rétegen alul nem tudnak, de nemcsak magyarul
nem, hanem semminő más nyelven sem. A gyászos csak az, hogy
éppen ebből az iszaprétegből bugyborékol fel a magyar nép nótája.
ÖNÉLETRAJZ
FELOLVASÁS
A PÁLYADIJ
A pályadijat, mondani sem kell, nem adták ki. Aki nem adta ki,
mondani sem kell, a Magyar Tudományos Akadémia, amely, hosszu
évek óta, pályadijak ki-nem-adásával foglalkozik. Akinek nem adták
ki: Csuday Jenő egyetemi tanár, amit csak azért kell mondani, mert a
ki-nem-adást helyeselni óhajtom. Még helyesebb, hogy Csuday
pörölte az Akadémiát 29.000 korona kártéritésért, s leghelyesebb,
hogy a pör négy és fél év alatt ugy ért véget a Kuria itéletével, hogy
a tudóst keresetével végérvényesen, visszavonhatatlanul
elutasitották. Tudni kell még, mint adatokat, amiket nem kell tudni,
hogy Csuday az Akadémia számára a Magyarok Történetét irta meg.
A per folyamán pedig kiderült, hogy az Akadémia birálóbizottsága
nem olvasta el a pályázó művet. Mely jól tette, igazán mely nagyon
okosan tette. A tudós érezte, hogy mit kell megirni: Magyarország
Történetét muszáj megirni, amely nem tud védekezni. A
birálóbizottság érezte, hogy mit nem kell elolvasnia: Magyarország
Történetét, melyet ugyis elég jól ismerünk. Mi Magyarország
Története? Ez: ‚Őseink halászó és vadászó népek voltak, akik
ellenfeleiket szolgálni küldték maguk előtt a másvilágra‘. És ez:
‚Menjen a király az ő kedves kunjaival‘. Meg ez: ‚Hütlen gyámból
rossz király‘. Továbbá ez: ‚Látván pedig, hogy… egy tollvonással
megsemmisitette‘.
Ezt bizony kár még külön is elolvasni, ezt már valamennyien
könyv nélkül tudjuk. Ez nem ér 20.000 koronát, nem is beszélve
arról, hogy 29.000 koronát megérne. Legkevésbé éri meg azt a
három délutánt, amely ahhoz szükségeltetnék, hogy az ember Lehel
kürtjét, a kedves kunokat, a hütlen gyámot és a tollvonást elolvassa.
És azután hogyan lehetne kártéritést megitélni, 29.000 koronát?
Valóban nem lehet bebizonyitani, hogy egy ilyen pályamű csakugyan
29.000 korona kárt okozott volna a Magyar Történetnek. Azt sem,
hogy a Magyar Történet 29.000 korona kárt okozott az
Akadémiának. A tudósnak pedig, aki a Magyar Történetet irja, ez a
történet semmi kárt nem okoz, sőt hasznot okoz, hisz a tudós éppen
azért tudós, mert a Magyarok Történetét irja. Ha ugyanazzal az irni-
nem-tudással, szük látkörrel, csekély itélettel novellákat irna, akkor
nagyon rossz ujságirónak számitana és senkinek eszébe nem jutna,
hogy tudósnak nevezze.
Hiszen, igaz, valakinek nagy kára van e Magyarok Történeteiből.
De ez a valaki nem indit kártéritési pert sem a történetirók, sem az
Akadémia ellen. Ez a valaki bizonyos fiatal emberek összessége,
akiket szokás gyüjtőnéven tanuló-ifjuságnak nevezni. Ártatlan fiuk
ők, magyar fiuk, akiket az iskolai történetirás szántszándékkal
szamarakká nevel in historicis. Az Akadémiának, persze, könnyü,
mert nem olvassa a történetkönyveket. E sorok szerény irója
azonban elolovasta pályázónak ama művét, mely Magyarok
Történelme cimen még a Millennium előtt jelent meg, sőt két kiadást
is megért, mert a publikum éhes, összefoglaló, nem tulságosan