Download as pdf
Download as pdf
You are on page 1of 74
LAS LEYES DEL AZAR Bartolo Luque Juan M. R. Parrondo eS Ss . } Descubrir la ciencia Materia j Lasleyer dj azar © Derive Luque y Juan Me Patron, 2018 (Ode eat edclor. EMSE EDAPP, SL, 2016, Resizacin edit: Sonat Aeampas, SL. ‘Deo ewsstracon de cuba: J, Mauncio Restropo (© Rawpul com) Shuterstoct ‘Dioatoy maquetacin: Kia Rira ‘© wstrcones: Jordi Dace (© Fologrtas: Tete as imégenies do este volumen son de domino pico exter {0 ls de as pigines 35 (amneerShuterstock) 36 jmsagesS.cgb £9), 57 (Ron Els! ‘Shutertoet, 153 (Schute GPLIWikimadia Commer). Depésiolegot 8 21176-2016 Iereaa en Arcangel Maggio ~ Division Litros i Lalayetie 1095. ‘Buinos ies, enol mos de febrero de 2017. ‘Reservados lodos fos derechos. Queca rgurasamente prohibida la odhcién total» parca de esta obra yor cuoiguer medio @ ‘rocedimiena yu dtntucién madiane equ opréstarropublicos. Las leyes del azar PROBABILIDAD, INFORMACION, ESTADISTICA Bartolo Luque Juan MR Parrondo CONTENIDO Introducelén Cémo pensar el azar Ruletas y coincidencias 1Qué es la probabilidad? Orgenesde eter delprobbidod Como pensar sobre el azar: el problema de Monty Hall iCudntas veces ganaré? Probabilidad y entropia te aseribucten biol Bl valor medio y la ley de los grandes nimeros La corps te Cae ‘Sorpresas, casualidades, milagros y otras probabitidades El problema del cumpleafios El principio de improbabilidad Probabilidad condicionadayy teorema de Bayes Teorema de la probablided tots: Cima determinar ‘udnte gent 2¢ droge o Gene un to Vagal o mal veto? la falacia del fiscal: la importancia de evaluar las probabilidades adecuadamente Elazar en movimiento: modelos Modelos y simulaciones Caminantes aleatorios Juegos parad6jtcos y motores moleculares a a 14 20 21 23 28 30 35 37 a7 40 43 47 48 583 53 55 Pregiintale a Google la importancia de Dios en la Biblia Fluctuaciones fatales Bits, palabras y adivinanzas Preguntas inteligentes eeutrea lnformacién suministra una pregenta? 3 Besdigode Hufnan Correlacionesy compresién de datos Complejided algorftmica La informacién en el lenguaje ‘Censos, encuestas y estimaciones 7 427 611 178 personas en un mundo en miniatura Ver os exoufoess Estimacién: contar sin contarlo tado un media maestro ex unestinodorisesgado La varienza muestrel esun etimador sesqads ‘pero podemos regi. El problema de los tanques alemanes ‘Amios estimaderes parecen razonables, ‘con cud nos quetamos? Intervalos de confianza De los datos a las ideas {Qué es una hipétesis estadistica? Valor p Correlaci6n no implica causalidad A modo de epilogo: abusos estadisticos Glosario 63 67 na 7 7 79 82 83 87 88 93 93 96 96 100 102 104 110 1m ur 117 122 126 136 148 Introduccién ‘Entre los 25 ylos 35 afios la probabilidad de quedarse embarazada de gemelos de forma natural se multiplica por cuatro». (EI Pals, 16 de mayo de 2016) 1a probabllidad de que un hombre en el paro encuentre empleo £8 del 16,4% frente al 12,6% de la mujer desempleada». (E! Mundo, 24 de mayo de 2016) «la actividad fisica regular disminuye en un 7% la probabilidad dle padecer cdncer en general. (ABC, 17 de mayo de 2016) En la actualidad es bastante facil encontrar afirmaciones como estas entre los deulares de periddicos o informativas de radio y te. {evislén. La probabiidad esta por todos lados. Casi nadie sabe muy bien qué es, pero aun asf posee una indudable capacidad de suscitar toda clase deemociones:tranquilidad cuando nos dicen que la ope. ‘acién a Iz que nos vamos a someter tiene un 99% de probabilidad de éxito; preceupacién si leemos que la probabitidad de una nueva Tecesién econbmica el préximo afio es «muy alta»; indi ignacion si nos {nteramos de que ls probabilidad de que auestro hijo sufra acoso escolar «podria disminuirs con cierta: s medidas que los. colegios se resisten aaplicar ete. Las tees del azar Be ‘Tenemos una nocién intuitiva de la probabilidad como «propen- sin» a que algo ocurra y una ligera idea de que las probabilidades cercanas al 100% son muy eltas, mientras que las probabitidades en torno al 50% son indicto de una situacién completamente aleatoria, Con esta imagen intuitiva, y con el prestigio que otorga a cualquier informacién aderezarla con datos numéricos y con clerto aroma a ciencia positiva, comunicadores y politicos utilizan la probabilidad y la estadfstica para lanzar toda clase de mensajes contundentes. Uno de los objetivos de este libro es precisamente servir de antidoto aesa tendencia: matizar la credibilidad de esos mensajes y proporcionar al lector herramientas suficientes para valorar en su justa medida cualquier afirmacién basada en la probabilidad o la estadistica. ‘A pesar de su actual popularidad, la teoria de la probabilidad es relativamente reciente. De hecho no fue considerada una rama «ho- norable» de las matematicas hasta los afios cuarenta del siglo pasa: do, Su utilizacién en las ciencias positivas es también tardia. Hasta el siglo x1X, matematicos y pensadores analizaron situaciones azarosas solo en relacién con juegos de cartasy dados. En aquella época, como consecuencia de la Revolucién Francesa y del auge de los estados-na- cién, se empezaron a aplicar cilculos probabilisticos de manera seria ‘a estad{sticas, a seguros y 2 algunos temas curiosos como la compo- ‘sicién de los jurados. Paralelamente, se desarrollé la estadistica para ‘analizar observaciones y mediciones experimentales en fisica y quk mica. En la segunda mitad del siglo xtg, los calculos probabilisticos comenzaron a aplicarse en fisica para describir el comportamlento de las moléculas de un gas. Pero no fue hasta el siglo xx que la probabilidad adquirié la re- levancta que presenta en la actualidad. A partir de los afos sesenta, précticamente ya no hubo ciencia alguna (fisica, quimica, biologia, eFonom(a, sociologia..) que no incorporase Ia probebilidad como he iesmienta basica de analisis. La probabilidad y el andlisis estadistico irrumpieron en todos los saberes cuantitativos y se convirtieron en elementos indispensables en la construccién de nuestra imagen del mundo, Para completar este escenario, en los afios cuarenta y cin- cuenta del sigio xx, el matemitico e ingeniero electrénico Claude ‘Shannon se dio cuenta de que la informacién que se transmitia en textos, mensajes, imagenes y sonido, se podia estudiar comosi provi- hiera de una fuente aleatoria. Con ello senté las bases de la teoria de la informacién, sin la cual habria sido imposible la posterior revolu- cién digital y de las telecomunicaciones. Lateoria de la probabilidad, ademas de ser crucial para entender el mundo contempordneo, es divertida. No ha perdido el vinculo con Jos juegos de azar y en muchas ocasiones desafia de manera. sorpren- dente nuestra intuicién, acostumbrada a un mundo determinista. Un libro sobre el azar necesariamente tenia que cubrir todos estos as- pectos: las sorpresas, las curiosidades, pero también las aplicaciones, la discusién conceptual acerca del significado dela probabilidad y los rudimentos matematicos de las distintas ciencias del azar. estaes la idea que nos ha guiado en la confeccién de este libro, En el capitulo 1 analizamos qué es la probabilidad, mostramos ‘que la mejor forma de pensar sobre el azar es imaginar muchas ré- plicas o repeticiones de un fenémeno aleatorio e introducimos con- eptos bésicos como el valor medio, el teorema central del limite Ja distribucién gaussiana, El capitulo 2 muestra una coleccién ee resultados curlosos e inesperados que ayudan a entender mejor el pauetecas i 1a probabilidad y nos permiten introducir algunos conceptos craclales, como las a i ecm probabilidades condicionadas y la in- Una de las aplicaciones més potentes de ta teo ial connor de nadernet tains ong sms legend ses aan beng el efco en una cada, et. Hoy prfedcamentecualguter prone i esl de rar Bg natural, industrial, soctal 0 econémico se puede estudiar constru- yendo un modelo que reproduzca su comportamtento, En el capftulo 3 estudiaremos algunos de estos modelos mas basicos: caminantes aleatorios y procesos de ramificacion, con aplicaciones algo hetero- dovas a la jerarquia de paginas web, de palabras en la Biblia o a la proliferacin de bacterias. El capitulo 4 est enteramente dedicadoa la teorfa de la informa- cién, y el Sy el 6 ala estadistica, En el capitulo 5 veremos cémo se realizan estimaciones sobre poblaciones a partir de pequefias mues- tras y c6mo encontrar el error de dichas estimactones. En el 6 anali- zaremos cémo ir «de los datos a las ideas», es decir, c6mo utilizar los datos estadisticos para validar o refutar modelos e hipétesis. En este {iltimo capitulo analizaremos también con qué facilidad se pueden encontrar correlaciones entre variables que no responden a ninguna relacién entre ellas y terminaremos con algunas advertencias sobre eluso actual de laestadistica. Después de este viaje, el lector tendré una panordmica del papel de la probabilidad y la estadistica en las nuevas teenologias y en la descripcién que la ciencia hace del mundo. Esta es sin duda motiva ‘cin suficiente para emprenderlo y completarlo. Pero hemos procu: ado también que cada etapa del viaje sea lo suficientemente curiosa y divertida como para que el lector disfrute del trayecto. Como pensar el azar teva dela probit en 0 erat cont gee notte kena astoa tae Perre-simon Laplace Ruletas y coincidencias la tarde del 14 de julio de 2000 Barney Vinson, un escritor espe- cializado en juegos de casino, se encontraba en el César Palace de Las Vegas, En una de las ruletas, cuenta Vinson, el ndmero siete salié cuatro veces seguidas. El jefe de seguridad del local le dijo a uno de sus compafieros: «Te apuesto un mill6n de délares 2 que no sale de nuevo», La apuesta no fue aceptada, pero el siete volvié a salir una quinta vez... y una sexta! Aquella tarde Vinson fue testigo de al due, segtin algunos aficionados a a ruleta, ha sido registrado en able seven a lo largo de toda la historia del juego: el 9 de julio de en el Hotel San Juan de Pu i guidas.en el niimero diez, Sp AE eee En un lanzamiento de ruleta la bola puede caer en cualquiera de los 37 nimeros que van del al 36.Sisuponemos que todos ellos lgualmente probables, la probablidad de que salga el niimero shee O cmguer ove a 1/37 fst clu Icaive na ee Las leyes Get onar Me ée probabilidad propuesta por el gran mateméy cle ies eS Uae (1749-1827) a princiine del sigh cee Ja probabiidad dem suceso A eselcociente - el niimero decasys fouorabls, aquels en los que se producirfa el 4850, y el nine ‘detodos ls casos posibles, Observemos que, masque una definicgn ge probabilidad, se trata de una regia para calcularla, De hecho, estamnes suponiendo a priorique todos los casos posibles son igualmente py. pables Por tanto, la regla de Laplace presupone en cierto modolane- cién de probabilidad o, al menos, bajo qué condiciones un conjuny de sucesos son igualmente probables. En la ruleta sustentamos esz ccreencia en su simetria circular; y en el caso de un dado, por ejemply, en su simetria cibica. La regla de Laplace para calcular probabilidades se puede aplicr fécilmente a dos lanzamientos de la ruleta. Si después de un lanze miento en que ha salido el nimero siete, lanzamos la bola de ruen, 2aué posibilidades hay de que salga otra vez. el niimero siete? Solr mente una. De modo que si nuestro evento A es «dos-sietes-segth | dos», el niimero de casos favorables es 1. ZY cudntos son posible’? | En la primera tirada tenfamos 37 posibilidades y, puesto queen | segunda también tenemos 37, el total de casos posibles o parejas nfimeros es 37 = 37, Estamos ahora en disposicién de calcular la probabilidad “—< j un niimero concreto, por ejemplo el diez, salga seis veces ee (Siempre que el crupier no haga ninguna trampa). Esta probabil al 5 1/(37 « 37 x 37 x 37 x37 x 37) = (1/37)*, aproximadamen® a Posibilidad entre 2500 millones. Observemos que, © sen uier secuencia de sets nameros, como por ejemplo la 31-32” 15, tiene exactamente la misma probabilidad de salir que ses * sels dieces seguidos. La ruleta no tiene memoria. En genersl Wt , suele suponer que la secuencia 10-10-10-10-10-10 es m8 FF. ble que la 31-3-10-27-7.15, porque la primera es «especi#” hemo pensar axar bes tras que la segunda tiene un aspecto anodino, Pero imaginese que la segunda secuencia esti formada por las fechas de nacimiento de sus dos hijos: el 31 de marzo de 2010 y el 27 de julio de 2015. Cree de verdad que la probabilidad de que aparezcan en la ruleta seis dieces seguidos es menor que la de que aparezcan de forma exacta y conse- cutiva las fechas en las que nacieron sus hijos? Sin embargo, la secuencia 10-10-10-10-10-10 s{ es especial en cierto sentido. Si en lugar de preguntarnos por secuencias concretas, nos preguntamos por el niimero de veces que aparece el diez en sets tiradas, entonces dicha secuenciaes la tinica en la que el diez aparece seis veces. Eso la hace bastante especial. Secuencias en las que el diez aparece cinco veces hay muchas. Por ejemplo; 10-10-31-10-10-10 o 7-10-10-10-10-10. Para que una secuencia de seis tiradas tenga exac- ‘tamente cinco dieces, uno cualquiera de los numeros de la secuencia Gene que ser distinto de diez. Bs decir, ese nimero puede ser cual- quiera de los 36 distintos de diez y puede aparecer en cualquiera de las sels posiciones de la secuencia, Por tanto, el nimero de secuen- cias de seis ndmeros con exactamente cinco dieces es 36 x 6 = 216, Se puede también calcular el niimero de secuencias con cuatro, tres, dos, uno o ningiin diez. Este ultimo caso, ningin-diez, esal que le co- Fresponden més secuencias, Hay 36* secuencias en las que no apare- ce ningin diez. Este nimero es, aproximadamente, dos mil millones, ‘Como todas tas secuencias son «equiprobables», es dos ‘mil millones de veces més probable que no aparezca ningun diez en seis tiradas, ‘que la aparicién de seis dieces seguidos. Pero recuerden que cada ‘secuencia concreta tiene la misma probabilidad. Lo que hace que el evento seis-dieces sea mucho mas Improbable que ningtin-diez, es ue hay dos mil millones de secuencias compatibles con el ditimo evento y solo una compatible con ol primero, Volveremos sobre este asunto al final de! capitulo. 4 nao —_ a —— LQué es la probabilidad? La nuleta, tirar un dadoo lanzar una moneda al aire son ejemplos cls- sicos para hablar de azar y de probabilidad. Pero, zqué significa exac- tamente «A es mas probable que B> o «la probabilidad de tal evento es del 40%»? La regla de Laplace, que se utiliz6 durante casi un siglo como definicién de probabilidad, pasa de puntillas por la cuestién. ‘Asigna a priori probabilidades por cuestiones de simetria y nos per- mite, a partir de ellas, avanzar en el cilculo de otras probabilidades mucho mas complejas. Sin embargo, poco nos dice sobre el significa- do tltimo de la probabilidad de un evento. Todavia hoy, después de ‘siglos de discusi6n, los matemsticos y filésofos siguen debatiendo la cuestién, De hecho, antes de la aparicién del problema sobre Ia interpreta~ cién de la probabilidad, ya existia una discusién previa sobre la dico- toma entre azar y determinismo, y también otra sobre una cuestion mucho més fundamental: si realmente existe o no el azar. La fisica ‘ddsica describfa toda la realidad fisica de forma determinista, sin de- far, Como decia el légico George Boole en el siglo xix: ela probabilidad es expectativa basada en un conocimiento parcial. Un conocimiento perfecto de todas las circunstancias que in- fluyen en un evento convertiria la expectativa en certezay no dejaria jugar a! necesidad para una teoria de probabilidades». Gracias al de- sayrollo de la mecénica cuéntica a principios del siglo xx se ha podi- do demostrar que Boole no estaba en lo cierto: el determinismo es incompatible con una descripcién local de la realidad fisica, es decit, esta practicamente aceptado que la naturaleza es intrinsecamente aleatoria Pero, incluso suponiendo que el azar no sea otra cosa més que desconocimiento de los detalles que rodean a un fenémeno, la inter pretacin de la probabilidad es problemstica, El matemitico Joseph jar espacio alguno al az ho pensar eer L, Doob (1910-2004) comentaba que «en 1933, para la mayoria de Jos matematicos, a probabilidad era alas mateméticas como el mer- cado negro es al mercado», Desde sus primeros escarceos con los Juegos en la época de! Renacimiento hasta comienzos del siglo Xx, la probabilidad fue una fuente de problemas y resultados interesantes. Pero su falta de rigor formal y las cuestiones de indole flloséfica y conceptual detrés del término «probabilidad la mantuvieron como tuna rama no del todo aceptada por la Matematica con maytisculas. Hoy la teoria de la probabilidad es una construccién matematica for- mal perfectamente coherente. En 1933, el matemético soviético An- drey Kolmogorov (1903-1997) establecié los axiomas o propledades bésicas que tienen que verificar eventos y probabilidades. Seguin Kol- mogorey, los eventos pueden combinarse de distintas formas dando lugar a nuevos eventos, de manera completamente andloga a como se combinan las proposiciones de la légica formal, Por ejemplo, de A += vaca-llover-mafiana y B = va-a-soplar-un-fuerte-viento-mafiana, se pueden obtener nuevos eventos: Ia negacién, no-A (mafiana no llove- +), la conjuncién A y B (mafiana llover4 y soplaré un fuerte viento) yla disyuncién Ao B (mafana lovers o soplaré un fuerte viento, © ‘ambas cosas ala vez). La probabilidad de un evento A es una funcién ue asocia un niimero, p(A), a dicho evento. Este niimero esté entre ceroy uno.’ Una «probabilidad nula» se asacia a un suceso imposible, ¥ «probabilidad uno» se asocia a un suceso seguro. La probabilidad tiene que verificar, ademas que, sidos eventos son incompatibles, es decir, sip(A y 8) = 0,entonces p(4 0 B) =p(A) + p(B).Con estas pro- Pledades tan simples se puede construir toda la teorfamatemStica d la probabilidad. * * tnmacas ocaslone también olarye de esterase esribela A) = 10. Por emo. demos decir ue proba osongida es 1/2 = 05 0d forma equbalente, del 50%, oan es iseliietaierteroe Lasleyes delazar 16 eo ‘sin embargo, esta teorfa matemética basada en axiomas no zan- ja la cuestién de cémo interpretar la probabilidad, es decir, de do- tar de significado al niimero p(A), puesto que no proporciona una definicién conceptual de probabilidad ni especifica su conexién con observaciones y experimentas. Es necesario, por tanto, un interpre- tacién de la teoria de la probabilidad. Hoy por hoy, la interpretacién més extendida es la lamada frecuentista, En esta interpretacién es necesario que el evento A sea uno de los posibles resultados de una accién o un xexperimento», por ejemplo, tirar un dado o una mo- eda, Si repetimos el experimento bajo las mismas condiciones un gran mimero de veces, observaremos A en, aproximadamente, una fraccién p(A) de las ocasiones. Es decir, si Nes el niimero de repeti- ciones del experimento, observaremos A en N x p(A) ocasiones. ES facil comprobar que los axiomas de Kolmogorov son compatibles con esta interpretacién. I primer problema de la interpretacién frecuentista es que s6lo es aplicable a experimentos que se pueden reproducir de forma idén- tica un gran ndmero de veces. Sin embargo, en ocasiones hablamos de la probabilidad de eventos tinicos, como cuando decimos que es probable que la causa della extincién de los dinosaurios fuera el im- pacto de un meteorite. O cuando el meteorélogo dice que mafana llo- verd con una probabilidad del 40%. El frecuentista puro diré que, en el primer caso, la afirmacién se trata unicamente de una forma de ha- blar: es fataz asignar una probabilidad concret, un nimero, al even- to meteorito-causa-la-extincién, cuando ni siquiera podemos enume- rar todas las posibles causas que podrfan hacer que los dinosaurios desaparecieran de la faz de la Tierra. En el segundo caso, segin el frecuentista radical, el meteorélogo quiere decir que, bajo las mis- mas circunstancias de presi6n, temperatura, movimiento de masas nubosas y otras variables que definen el estado de la atmésfera hoy, la evolucién de la misma es tal que, en un 40% de las ocasiones, daré leo pensar elazar a” lugar a Huvia mafiana. En realidad el «experimento» no esreproduct- ble, al menos no de forma practica, porque no podemos controlar las. condiciones atmosféricas. Podemos hacer algo de estadistica, pero Jas mismas condiciones atmosféricas no se van a repetir jamas de focna est uss ontdeney Capi le bes cal eaabIGs durante siglos o milenios, En realidad, el meteordlogo sf repite mu- ches yous tesperanecen perp Aachindlas ini eel ordenador de un modelo que reproduce bastante bien el movimien- to de las masas de aire y vapor de agua en la atmésfera y que est4 basado en ecuaciones que si han sido validadas por experimentos inprodicio cu aiskorsibx ler seater metonelognas satin nls fora alstovies a tases he cele peed de a cela son sorent. Tenones eumuce un erperomons {a simulacién, que puede repetirse muchas veces y as{ recuperar a viersiiislds Evcuedistr ote ION Selerre dace he ss qed tess puede caviascaes recto eens tanto, netamente frecuentista. . si En principio, la interpretacién frecuentista es muy razonable, ie discute que, si el experimento que da lugar a un evento pu- Dene oe las mismas condiciones una infinidad de veces, ea oo la que se observa el evento tender{a a acercarse Probabilidad cuando se aumenta el niimero de repeticiones, El Segundo problema de la interpretacién frecuentista es el signifi do ce «bajo las mismas condiciones». Cuando el médico nos dies ‘que cierto tratamiento tiene un 95% de éxito quiere decir qu : largo de muchas aplicaciones de dicho tratamiento, en el ee : casos se ha observado la curacién del paciente y en el 5% re: eid no se ha apreciado mejora alguna, Pero uno puede dudar, co) vag eae tier onto sem repeones dru epeinonectog condiciones, puesto que no hay dos individuos iguales, asteye det oar En medicina se intenta precisar mas este tipo de estadisticas mi- diendo las tasas de éxito en grupos homogéneos —varones de 40 afios, fumadores y con sobrepeso, por ejemplo—. El problema es que, cuantas mis caracterfsticas se ailaden, més reducido es el ni mero de casos y menos fiable es la tasa de éxito que se obtiene. La soluci6n es afladir sélo las caracteristicas relevantes para el éxito ‘oe fracaso del tratamiento. Pero esta no es tarea sencilla. :Cudles son las caracteristicas relevantes para la eficacia de una terapia 0 para el riesgo de una operacion? Podemos decir entonces que el frecuentista traslada el problema de la interpretacién de la probabilidad al problema, no més senci- lo, de decidir qué caracteristicas son relevantes para que un evento cocurra y cuales no, Por ello ha habido pensadores, matematices y fi- Iésofos que han tratado de ofrecer una interpretacién de la proba- bilidad mas amplia, basada en conceptos como «propensién», 0 que han aceptado que se trata de un concepto subjetivo que cuantifica nuestra ignorancia o nuestras expectativas ante un fendmeno alea- torio, No obstante, en este libro nos restringiremos, en la mayorfa de las ocasiones, a la interpretacién frecuentista, con la suposicion de que, al menos de forma ideal, los experimentos se pueden repe- tir una infinidad de veces bajo las mismas condiciones. Las ruletas, tos dados y las monedas son buenos candidatos. Constituyen expe rimentos muy sencillos en los que la aplicacin de la interpretacion frecuentista esta aparentemente exenta de los problemas que hemos mencionado. Decimos aparentemente porque, como afirmaba George Boole, el resultado del lanzamiento de una moneda puede predecirse ‘si uno conoce perfectamente la fuerza inicial con la que se lanza, las corrientes de aire, la rugosidad de la superficie sobre la que cae, et ‘Lo mismo, quiz en mayor medida, ocurre con la ruleta, cuyo resulta- do puede ser manipulado por un crupier experto. En cualquier caso podemos imaginar el lanzamiento «ideal» de una moneda como Ut ime pensar azar 19 ‘experimento que puede repetirse muchas veces bajo las mismas con- diciones y cuyo resultado es puramente aleatorio. No es de extrafiar ue el propio concepto de probabllidad surgiera histéricamente del anlisis de juegos de azar con dados y monedas, en los que la nocién de probabilidad, en su interpretacién frecuentista, aparece de forma natural y nos permite hacer predicciones no triviales. Por ejemplo, el cdlculo de probabilidades nos proporciona pode- rosas razones para dudar de la afirmacién con la que abriamos el capftulo: que sélo en dos ocasiones se ha observado aun mismo ni- ‘mero aparecer seis veces seguidas en la ruleta de un casino, Aunque la probabilidad de este evento es muy pequeiia —una entre 2500 mi- Nones—, hay muchas ruletas girando en el mundo, Pongamos que hay 2000 casinos en todo el planeta, una cifra bastante conservadora, cada uno con 10 ruletas con las que se juega unas 500 veces al dia (2100 por hora * 5 horas). Eso significa que, en un solo dia, se jue- 82 10 millones de veces. Por tanto, deberfamos observar el suceso ‘un-nimero-aparece-seis-veces-consecutivas una vez cada 250 dias, sproximadamente. Es dedi una vez cada aio o cada dos afos, mas 0 dina pedir ct Lururandea grtmarens we ccien afios. En un siglo, supontendo que los casinos abran s6l0 los ines de semana, las ruletas habrfan funcionado aproximadamente 100 aiios * 100 dfas por afio = 10 000 dias. El nimero total de lan. Zamir sat 100000 mllones Be de tendrames ue aber observado al suceso un-niimero-aparece-seis-veces-c unas 10!» 1/27} = 9 veces nce expose quel suceeo we ise street ie cesoco haya ocurrido alguna ver, cir ney aeareste nn en Origenes de la teorta de la probabilidad rere Simon Laplace escribia en su Théoria Anaitique dos Probabiltés (1812), «Es un hecho destacable que una cienca que empezé analizando Juegos de azar acebe convirendose en el més importante objeto del conc ‘mento huriano». Poco tiempo despues, | matemstica frencés Siméon Danis Poisson (1781-1840) en aus Rachorches aur le Probabilté (1897) corcrelaba més esa orien: «un probiema relatva a los juegos de azar, proouesto 2 un ‘auster janserista por un hombre de murdo, ha sido! erigen del calculo de probebildedess. EI austero jansenista no era otro que Blase Pascal (1623- 41662) y ol hortbre de mundo, Antoine Gembauld, Caballero de Mere. Ent siglo of Cabatloro do Maré, aficionado al juoge con loe dodos, planted el siguiente probleme a los matemicos Blaise Pascal y Ferra de Fermat (1601-1665): {Qué es més probable: (8) sacar i menos un 6 altar 4 veces un solo dado 0 (b) sacar un 12 en 24 tradas de 2 dasos? A pesar de co Peet een cn resent sete ine re delite sexual (i), acepté el rto. En el intercambo episiolar ue mentu- td Pascaly Fost poe ue’ ee prose a prt es bam aprobabiidad modema, se poms W pobetitid conplomerars pre ester ol probes 3d Cabaiiaro de Méré. Para e caso (a) enemas gus: P(ningin 6) =(5/ 6)" 1 uttzando la probetiidad complementai,Negames 8 P(almenos an 6)=1-(5/6)" =0,51 ‘Mientras queen ol cas0 (): . Paingi 12) =(35/ 36) ye nuevo, lizando la probabiidad complementaria (Ql menos un 12)~=1~ 35/36)" =0,49. ‘Sorprendontomenta, rao que sospechabs De Méré por pura expeion- ca. Fue Christiaen Huygens (1629-1695) quen,recogiondo y complatardo el trabajo de Pascal y Fermat, resento por primera vez en sociedad el calcula ‘de probablidades en su fibro De Ratocinis in Ludo Alege (1687). Habla ‘acid la teota de la prebabildad. lo pensar sor ee Cons Pensar sobre el azar: el problema de Monty Hal A pesar de los problemas que conlleva ineludiblemente la interpre- tacién freeuentista, la forma més clara e intuitiva de pensar sobre el azar y las probabilidades es imaginar muchas repeticiones del fen6- meno cuya probabilidad se quiere conocer. Un ejemplo que ilustrade forma contundente esta afirmacién es el famoso problema de Monty Hall, inspirado en el exitoso concurso Let's Make a Deal de los aos sesenta y setents, presentado por Monty Hall y Carol Merril en la te- levisién estadounidense, En la fase final del concurso, Monty ensefa tres cofres @ un su- frido concursante. En uno de ellos hay un gran premio y en los otros. dos hay una calabaza. El concursanteelige nervioso uno de los cofres, Monty aparta entonces el cofte elegido y mira lenta y teatralmente en el interior de los otros dos. Cierra de nuevo uno de ellos, toma el ‘tro con las dos manos y lo vuelca ante los ojos del concursante y el Publico, dejando caer la calabaza que haba en su interior. El concur- sante suspira aliviado, aunqueno tiene ninguna razén para ello. Mon- ‘ty, generoso, le ensefia los dos cofres que quedan cerrados yle ofrece '2 posibilidad de reconsiderar su decisién inicial: «Puedes ahora es- coger cualquiera de ellos», anuncia con un redoble de baterfa, Qué deberfa hacer el concursante? Mucha gente piensa que, una vez eliminado uno de los cofres, et Premio puede estar por igual en los dos que quedan. Por lo tanto, no importa el cofre que se elia: la probabilidad de ganar el premio es del 50%. Sia eso afiadimos que, en la mayorfa de las personas, modifi- ‘car una decisién correcta produce una sensacién de pérdida bastante ‘mas dolorosa que mantenerse en una incorrecta, no es de extrafar que casi todo el mundo se nlegue a cambiar de cofre. Hemos escenifi- ado el juego de Monty Hall en muchas ocasiones ante piiblicos rauy as lege dl ar a LLC istintosy cast todas los xconcursantes» han preferido quedarse con, elcofre elegidoen primer ugar. ‘sin embargo, lo mejor que puede hacer el concursante es cambiar ‘su decision inicial. Es facil convencerse de ello si pensamos no en un solo concurso sino en un gran nimero de ellos. Supongamos que el concursante tiene oportunidad de repetir el juego 600 veces, esdecir, imaginemos 600 réplicas del concurso, cada una con el premioen un cofre tomado al azar. Cuando el concursante elige por primera vez tuno de los tres cofres, es evidente que, aproximadamente, un tercio de las vecesacertard y dos tercios de las veces se equivocaré, Es deci, solamente en un tercio de las réplicas, unas 200, e1 premto estaré en el cofre elegido por el concursante. Monty descubre el cofre con la calabaza y quedan dos cofres cerrados. Recordemos que s6lo en un tercio de las réplicas el premio esta en el cofre elegido inicialmente. En elresto de las réplicas, el premioestaré en el otro cofre. Por tanto, si el concursante mantiene su decisién inicial, ganaré un tercio de las veces. Si cambia, ganaré dos tercios de las veces. Este ‘argumento se muestra en la figura 1, donde hemos dibujado séio 6 réplicas del juego. En términos de probabilidad, podemos decir que Ja probabilidad de ganar manteniendo la decisién inicial es un tercio, y la probabilidad de ganar si se cambia de cofre es de dos tercios. Los dos cofres no son equivalentes, como podria parecer a primera vista. Uno de ellos ha sido tomado al azar entre tres cofres en princi- pio iguales (con igual probabilidad de contener el premio). Elotro ha sido el superviviente de la inspeccién realizada por Monty Hall. Bs bastante dificil entender que la solucién correcta es cambiar de cofre si pensamos en una tinica realizacién del concurso, mientras que dicha solucién es casi trivial cuando se observan las réplicas de! concurso en la figura 1, Pero el problema de Monty Hall nos enses otro aspecto interesante acerca de la probabilidad y el azar. Al intro~ ‘ducir informacién acerca de un evento, cambian las probabilidades ino pensar ar 2 FIG. 4. Varlas repet cones del eoncursode ty Hal, EL cofre que tha elogidoInilalmente ef jugadorse encuentra en la ‘Stel jugador cambia de ‘ofr, tas probabilidades de siros eventos relicionados. La teort dela probabildad dispo- ne de herramientas muy potentes para analizar las relaciones entre ‘eventos aleatorios: las probabilidades condicionadas, que analizare- ‘mos en el siguiente capitulo, éCuantas veces ganaré? Probabilidad y entropia Larepeticién de un experimento es crucial para la interpretacién fre« cuentista de la probabilidad. Al principio del capftulo nos hemos en- frentado a este tipo de repeticiones en la ruleta y hemos encontrado algo a primera vista sorprendente: la ruleta no tiene memoria tanto, todos los niimeros tienen la misma probabilidad de sur ine. Lasleyes delaxar me pendtentemente de los resultados anteriores. :Cémo es posible que, fespués de muchas repeticiones, la frecuencia de aparicién de cada nimero se acerque a la probabilidad, como afirma la interpretacién frecuentista? La respuesta a esta pregunta tiene mucho que ver con algunas cuestiones fundamentales no s6lo de la teorfa de la probabi- Jidad, sino también de la fisica. Como vimos al principio de este primer capftulo, si nos pregunta- mos por el nimero de dieces en seis tiradas consecutivas,lo més pro- bable es que no aparezca ninguno, debido a que hay muchas secuen- dias sin ningiin diez, mientras que sélo hay una secuencia con seis dieces. Este ejemplo muestra claramente la diferencia entre las pro- babilidades de secuencias concretas y las de tipos de secuencias, es decir, conjuntos de secuencias que se ajustan a un cierto criterlo, La probabilidad de cada secuencia concreta ‘es siempre la misma, mien- tras que las probabilidades de tipos de secuencias pueden ser muy diferentes. En nuestro ejemplo, el tipo de secuencia salir-seis-veces- el-diez-en-sels-tiradas es 2000 millones dé veces més improbable que el tipo de secuencia no-salir-el-diez-en-seis-tiradas. La probabi- idad de un tipo de secuencia se calcula de forma muy sencilla, Basta multiplicar la probabilidad de una secuencia concreta por el nimero de secuencias de dicho tipo. Esta distincién entre secuencias concretas y tipos de secuencia, y el modo en que se calculan las probabilidades de cada tipo, es la base de uno de los conceptos mas profundos y relevantes de la fisica mo- derna: la entropfa, Para analizarlo en detalle utilizaremos un ejemplo més sencillo, y mAs relevante, que el de laruleta. Supongamos que lan- zamos una moneda al aire 100 veces. En esta ocasién la moneda esté trucada, de modo que la probabilidad de que salga cara es p= 045 y la de que salga cruzes \~p =0,55. Cual es la probabilidad de obte- ner n caras y 100-n cruces? En este caso, las secuencias concretas NO son igualmente probables, puesto que es més probable la cruz que a se a oa] ° o Numero de tiradas 1.2 Laure dann negra ligula ena prbaitnd de ue apa ‘ese na secenca coer con ncaa ra 100 acs mana segue con Probe decare 045 cru ,53 La cura gs mest el nmeede ecu con tarasy 100-rerxes La cara ners cent e elcent Ia rotablad de cbse ‘rm caraen lr 100 lnsamieyton La xa vores ereoponds eames cura tears conta lotr dor curvaretan reer pre uel comparctn ‘cara. La probabitidad de sacar, por ejemplo, dos caras en dos tiradas 50,45 x 0,45. Como las probabilidades se multiplican, por ser las ti- radas eventos independientes, la probabilidad de una secuencia con- creta que contenga n caras y 100-n cruces es: P{n) = 0,45* x 0,55100 . Elresultado de esta férmula es la curva discontinua negra de la figura 2, donde enfrentamos el ntimero de cruces na su probabilidad re-es- calada convenientemente —es decir, multiplicada por una constante— ara poder compararla posteriormente. Como vemos en la figura, la secuencia concreta mis probable es a de 0 carasy 100 cruces. A partir de ella, las probabilidades se van reduciendo a medida que disminuye ‘el ntimero de eruces y aumenta el néimero de caras. Aunque parezca increfble, si tuviéramos que apostar por una secuencia concreta entre las 2° 1,3 «10™ posibles secuencias, lo mésinteligente serta apostar ala de 100 cruces seguidas. osteyes detazor embargo, todo cambia si consideramos tipos de secuencias, Secuencias con 0 caras y 100 cruces sélo hay una. Tenemos, sin em- ‘argo, 100 secuencias con una cara y 99 cruces. Con dos caras y $8 cruces, hay ya 4950 posibilidades y, con 50 caras y $0 cruces, hay més de 10® posibilidades, un nimero extraordinariamente grande, En la figura 2, también con una escala adecuada para que puedan compararse todas con claridad, hemos dibujado en gris e! numero de posibilidades para cada tipo de secuencia. Finalmente, la probabilidad de cada tipo es el producto de la pro- babilidad de la secuencia y del nimero de posibilidades, y el resulta- do es la curva continua negra en la figura 2. Esta curva tiene su maxt- ‘mo enn=45,en completo acuerdocon lainterpretacién frecuentista: puesto que la probabilidad de que salga cara es 0,45, en un numero grande de tiradas deberdn salir un 45% de caras yun 55% de cruces. Lo interesante es que las secuencias concretas que constan de 45 ca rasy $5 cruces son mucho menos probables que lasecuencia con 100 ‘cruces, como se ve en la curva discontinua negra. La probabilidad de cada tipo, es decir, la curva continua negra, es el resultado de la com- binacién de las otras dos curvas, y se denomina distribucion binomial (véase el recuadro «La distribucién binomial», en ia pag. 28). ‘A finales del siglo xx, el fisico austriaco Ludwig Boltzmann utiliz6 esta combinacién para resolver unode los enigmas mas profundos dela fisica: conciliar el comportamiento del mundo macroscépico (el mundo ‘que podemos observar a simple vista) con las leyes que rigen el mundo microscépico de los atomos y las moléculas. Cada uno de estos mun- dos se comporta de manera diferente: en el microsc6pico el movimien- to no cesa, no hay friccién, la enerefa no se plerde, no hay una flecha del tiempo que distinga el pasado del futuro; en el macrosc6pico, !os cuerpos sufren fuerzas de friccién y tienden a pararse, la energfa se di sipa en forma de calor inutilizable y hay infinidad de procesos irrever- sibles, como cuando se hace afiicos una copa de cristal al caer al suelo. ino pense ar 2 Boltzmann se dio cuenta de que la diferencia entre el mundo mi- eroscépico y el macrosc6pico era en realidad una diferencia «de mi radan, y que esa diferencia, aunque muy simple y sutil, pod{a explicar los distintos comportamlentos de cada uno de los mundos. Cuando miramos el mundo microscopico vemos el movimiento detallado de cade particule, mientras que cuando miramos el mundo macroscépi- ‘c9 s6lo vemos los comportamientas colectivos, igual que a un politico no le interesa realmente saber la identidad de todos y cada uno de sus votantes, sino s6lo si el nimero total le permitira sentarse en un sillén del parlamento, Cuando decimos «mirar», no nos referimos ‘inicamente a observar o realizar medidas en et mundo maicrosc6pico ‘o macroscépico, sino también a las descripciones tedricas que hace~ mos de cada uno de ellos. Estos dos tipos de «mirada» se dan también en nuestro ejemplo de las secuencias. A un jugador que apueste en cada una de las 100 tiradas le importa cmo cae la moneda en cata una de ellas, es decir la secuencia concreta de resultados. Este seria un jugador «microscépi- co». Por el contrario, un jugador «macrosc6pico» seria el que apostara al mimero total de caras de toda la serie, y estaria s6lo interesado en cudntas caras salen en las 100 tiradas, es decir, en el tipo de secuencia, En un sistema fisico, Hamamos «estados microscépicos» a las secuen- Gas concretas y «estadas macroscépicos» a los tipos de secuencias. La probabilidad de que se dé un estado microscépico es mayor cuanto menor es su energia. Pero esta es la probabilidad de un es- tado microscépico concreto, igual que la curva discontinua negra de la figura 2 es la probabllidad de una secuencia concreta. Al pasar al mundo macroscépico las cosas cambian radicalmente; igual que en el ejemplo de La moneda, las provabitidades de les tipos de secuen- cia difieren mucho de las probabilidades de las secuencias concretas. Esto es debido a que también un estado macroscé6pico puede darse ‘en forma de un gran niimero de estados microscépicos. En un siste- La distribucién binomial Le probiatilided de 10s tos de secuancia que se explican gn el texto se deniomina distibucion binomial, Més concretamente, 0 ls probatiided pln) {e oblones mn caras y Nn cruces a lanzar N veces una moneda en la que la ‘probablidad de que selga cara esp. La formula dela dstnbucion binomial es: pine (*) gtr Tiesto teoa amie pennies (") elite ima onbinonepetdo oe fo osc do tar ea aera yo pee rn oe Mo?ndedn_2M Brower cata ']arcndmne se moun era onc ety ati, ha wk aya gous ne enalvsny ue csp ore poi figura 2. Ei segundo factor, pitl-p)" es la probabilidad de que aparezca eT ath Sates Onn ean ee ee el eeocgenupace een nce ib arta tpn ic a negra dela figura 2. ; La distribucién binomial eparece cuando estamos interesades en el nu- Pa panera pavers le ee eamaeasiitaten mince Scaual Sccrainiaoe sewes saumuausc cn Katarn & paaad a gtae cineen ae orc pomen See tel inima Siu pammerenae ony Peete pedrmgeomaci er seem ma fisico, el equivalente a la curva gris de la figura 2 es el nimero de estados microscépicos compatibles con un estado macroscopico dado, Boltzmann demostré que la entropfa (una magnitud que habla no pensar et aor 20 ——_— aparecido a mediados del siglo wrx al estudiar gases y motores tér- rmicos pero cuya naturaleza era afin misteriosa) estaba relacionada con ese niimero de estados microscépicos compatibles, fn concreto, la entropfa es proporcional al logaritmo de dicho nimero y la impor- tancia de esta relacl6n matematica es tal que se encuentra grabada ‘sobre la tumba del propio Boltzmann en el cementeria de Viena? Pensemos, por ejemplo, en un gas conte- nido en un recipiente que esta dividido en dos recintos por una pared permeable, tal y como se muestra en la figura 3. Como la caja esta apoyada en el suelo, la energia de las moléculas es menorenel recinto inferior porque su energia potencial gravitatoria es menor mientras mas cerca se esté del cen- tro de la Tierra. Por lo tanto, cada molécula «preferira> estar en el recinto inferior igual que, con nuestra moneda trucada, cada tira- PIG. 3 :Céme se distribu da «preferia» ser cruz en lugar de cara, Sin Yes as molécuas de un embargo, en una observacién macroscépi- SY isranec tere vog €2 no estamos interesados en ol comporta- recintos dl mismotamae miento de cada una de las moléculas sino Sélo en el comportamiento colectivo, que en Sr riedelyan dns este caso es la fraccién de molGculas que es- mis probubilided ée estar tén en cada recinto, Bl problema del gas es Sore Des entonces idéntico al problema delamoneda tunis clonadonacees: ¥. de la misma manera que lo hicimos con pi mas robablees aque las 100 tiradas, se puede demostrar que en ene! que una fraccion el estado macroscépico mas probable habra *P*°cablede moléculas se encientra enelrecinto luna fraccién apreciable de moléculas en el superior. fio,en el inferior laenergt ‘esmenor.Cadauna de las * El capitule¢veremos una genet de lnodin de entopl debids 2 Cade Shanon y silabeacuaiuler ania ser ‘Las ayes de! azar recinto superior, El valor concreto de esta fraccién es el resultado de la combinacion de un factor energético y de un factor entrépico, que son los andlogos a la curva discontinua negra y a la curva gris, dela figura 2, respectivamente. Cuanto menos pesadas son las mo- Iéculas y cuanto mas calientes estan, mas importante es el factor entr6pico y, por tanto, tienden a estar repartidas por igual en los dos recintos. Si no fuera por el factor entrépico, el estado mas pro- bable seria aquel en el que todas las moléculas estén en el recinto inferior, con la minima energia posible, De hecho, asi ocurre cuando la temperatura es-273‘C. Sino fuera por la entropfa, las moléculas que componen el aire que respiramos se precipitarian al suelo. La entropfa también explica por qué moléculas muy ligeras, como las de hidrégeno, no pueden ser retenidas por el campo gravitatorio terrestre y formar parte de la composicién del aire. Algo que no ocurre en planetzs con mayor gravedad, como Jipiter. La Luna, con su débil campo gravitatorio, apenas puede mantener ninguna mo- lécula gaseosa y por eso su atmésfera es practicamente inexistente, Es sorprendente cémo la probabilidad, la entropia y unos célculos combinatorios sencillos pueden arrojar informacién de lo que ocu- tre en las atm6sferas de planetas lejanos. El valor medio y Ia ley de los grandes niimeros Con el ejemplo anterior y la distribucién binomial hemos visto que la interpretaci6n frecuentista es consistente con el célculo de pro- babilidades, Si lanzamos muchas veces una moneda en la que la probabilidad de que salga cara es 0,45, el némero de caras es alea torio pero muy cercano al 45%. La generalizacién de este resultado constituye el llamado teorema central del limite, uno de los resulta- dos mas importantes de la teorfa de la probabilidad y fundamento de gran parte de la estadistica, como veremos en los capitulos Sy & m0 penser ear ” Para explicar el teorema central del limite, necesitamos introdu- cir un nuevo concepto basico en la teoria dela probabilidad: el valor medio de una cantidad aleatoria. El valor medio se obtiene sumando todos los posibles valores que toma la cantidad multiplicados por su probabilidad respectiva. Es el parémetro que nos da mds informacion acerca de una cantidad aleatoria. De hecho, en la mayorta de las oca~ slones una cantidad aleatoria puede visualizarse como una variable que fluctia en torno a su valor medio. El segundo parimetro impor- tante para caracterizar la cantidad aleatoriaes la dispersi6n 0 desvia- clén tipica, que se suele denotar con la letra griega o'y que nos indica la magnitud de dichas fluctuaciones. También se utiliza su cuadrado o? que se denomina varianza o dispersién cuadrética. En probabilidad y estadistica es necesario distinguir culdadosa- ‘mente entre el valor medio de una cantidad aleatorla y la media de una serie de datos. Esta Ultima suele denominarse media empfrica, Para enfatizar que se calcula a partir de un conjunto de datos obte- nidos empiricamente. Por el contrario, et valor medio de una canti- dad aleatoria es un concepto completamente tedrico que se obtiene a Partir de las probabilidades de que dicha cantidad tome valores con- cretos. Por ejemplo, el valor medio dela puntuacién obtenida al tirar tun dado no sesgado es (1+24+3+4+5 +6)/6=3,5 porque cada uno de los seis resultados posibles se obtiene con la misma probabilidad, 1/6. Sin embargo, si tiramos el dado diez veces, por eJemplo, pode- mos obtener la secuencia: 2, 1,4, 1,5, 3,3, 1, 6,5. La media de todas estas tiradas es (2+ 1+ 4+145+3+341+6+5)/10=3,1, queno iene por qué coincidir con el valor medio. Por supuesto, al aumen- tar el niimero de tiradas, la media de los resultados se acercaré cada ‘vez mas al valor medio 3,5 como consecuencia de la interpretacién frecuentista de la probabilidad, En efecto, tras un gran mimeroN de Uradas, cada cara del dado habré salido, aproximadamente, N/6 ve~ es. La media de las tiradas seré, aproximadamente: x az lyse ar hme pence al exar 2 (N16) +2(N /6)43(N /6)+4(N /6)+ SIN 16)46 0 15) W 35 Obsérvese que el ntimero N se cancela en ta fracciény lo que que- da es el valor medio. El mismo argumento se puede aplicar a cual- ‘quier cantidad aleatoria X que tome valores x,,x, X, con probabilidad P(x,) P(x.) ple), ete. El valor medio de la cantidad es: pn pC) +p 66)4 5,08) 4" ‘Tras un gran niimero N de experimentos en donde obtenemos va- lores de Ja cantidad aleatoria, cada posible resultado x habra salido, aproximadamente, Np(x) veces. Para calcular la media empirica te- nemos que dividir entre N la suma de todos los resultados; este nii- mero N se cancela, con lo cual la contribucién de cada resultado a la media empirica es, aproximadamente, xp(x). Asi, volvemos a obtener que la media empfrica m de una serie de datos obtenida mediante realizaciones de la cantidad aleatoria X se acercar4 al valor medio 4, tun resultado estrechamente relacionado (de hecho, equivalente) ‘con la consistencia de la interpretaci6n frecuentista. Pero zcomo se acerca la media empirica al valor medio? El teorema central del limi- te responde a esta pregunta y la respuesta es sorprendente por su universalidad: la mediam es una cantidad aleatoria cuya distribucion de probabilidad es, aproximadamente, la famosa campana de Gauss. La campana de Gauss, también conocida como gaussiana o distribu. cién normal, es una distribucién de probabilidad que responde a.una formula matemética muy concreta (véase el recuadro «La campana de Gauss», en la pag. 35). Su grafica es muy conocida: tiene la forma de una campana centrada en el valor medio de la distribuci6n y cuy? anchura es igual a su dispersién. Formulemos el teorema con mas precision, Consideremos la suma Va Xe s Xeno dy en donde X,, X,.%,y-"5X, son cantidades aleatorias idependientes y con Ja misma distribucién de probabilidad, Una hipétesis crucial para ¢elteorema es que tanto el valor medio y como la dispersién de esa dis- tribuciéa deben de ser cantidades finitas. El teorema dice que, cuando Nes muy grande, la distribucién de ¥ es gaussiana con valor medio iN ydispersién o¥/N . Es sorprendente la universalidad del resultado: 1a distribucion de ¥ es gaussiana Independientemente de como sean las cantidades X,, X,,X,--Xy. Puede que tomen sélo dos valores, 0 y 1, ‘con probabilidad p y 1-p respectivamente; o pueden ser el resultado de turadas de un dado; o pueden tomar valores continuos entre -100y 100. Nada de eso importa: cuando sumamos muchas de esas cantidades in- dependientes el resultado esté descrito por una campana de Gauss, Pero también es de gran importancia el hecho de que el valor me- dio y la dispersin de la suma dependan de N de forma diferente: ef Primero es proporcional aN y la segunda proporcional a VV. Esta diferencia es cructal para que la teorfa de la probabilidad sea dtil en Ja vida real y para fundamentar la Interpretacién frecuentista, Para convencernos de ello consideremos la cantidad ma Xit ht hypo hy N que no es otra cosa que la media empfrica de nuestras cantidades alea- torias.Elteorema central dellimite nos dice también que mes gaussiana cuando W esgrende, peroen este caso el valor medio seré wy dispersién @/ JW . Bs decir, m esuna cantidad aleatoria que fluctia en torno al va- Jor medio 4 pero esas Nuctuaclones se hacen cada ver més pequefias, Pensemos, por ejemplo, en los lanzamientos de una moneda justa (50% de probabitidades de salir cara o cruz). Si X, €s 1 si sale cara ‘Las \eyes del azar en el primer lanzamiento y 0 si sale cruz, y asf sucesivamente para X,, Xy ete, entonces la sums ¥ definida més arriba serd el ntimero total de carasy m la fracci6n de caras en N lanzamientos. El teorema central del Ifmite nos dice que dicha fraccién m es una cantidad que fucida en torno al 0,5 (que es el valor medio de %,) y que el tama- ‘no de esas fluctuaciones es 1/N aproximadamente, En la imagen siguiente vemos el resultado para N = 10, 20, 30, 40, 60 y 100 Lan- zamientos. Hemos marcado con puntos més gruesos las probabili- dades comprendidas entre 0,45 y 0,55. Vernos que a medida que N 025; ons: “ al i. est ul | I, 014 Fp 0.12F aaa q 3 a oth ml = Hh * all lh . se f ih. J OF paso 0.00 F 00 oo ow ft stall. a ih a © 02 o4 06 08 4 ° 4 06 of Como pensar elazer co erece la distribucién se concentra més y mds alrededor de 0,5 y el porcentaje de area correspondiente al intervalo (0,45, 0,55) se hace nds y més grande. Si lanzéramos la moneda diez mil veces, espera mos que m se aleje de su valor esperado como maximo en una canti- dad 1/ 10000 «0,01. es decir, que se encuentre entre 0,49 y 0,51. En cambio, sila lanzamosun millén deveces, el tamaio de la fluctuacion seré 1/-1000000 = 0,001 y lo esperable serfa que m se encontrara en- tre 0,499 y 0,501. Esto que acabamos de ilustrar se conoce como la ey de los grandes niimeros, yse utiliza constantemente en estadistica para estimarel error de encuestas y experimentos cientificos. La campana de Gauss te SoS ee eee ee es rr Utes on ceca ae areca ee ce Loe ee eee per emerges cgpeinager yop oon ia Ss per cece eae ae Se soe oe na ore ee era ey Soot acrletyaneaak aadinm nasal sees sf \ OT Su gréica ee une compane simésica respedo al valor medo que se ‘achota mas y mas con la varianza, Poderios interpreter a medie como un factor da trslacén y fa desvacin tpica 0 (iz cusdreca do la vavinza) ‘Pom un factor de escala del grado de diepersion. Obvervando les gréficas Bera la binomial y ta normal, nos demos cuenta desu extreordinerio parecido. De hecho, puede demostrares que cuando Nes grande y p pequetia en at caso de la binomial, puede usarse un equivalents continuo normal préctica- mente sin arrastrarerores. Elarea bajo la curva entre ios valores.a yb de una distrbucion de proba- bilded continue 08 la protabided de que a cantdec eleatr tome valerea ‘leatoros que estén justamenia entre ay b. Una propiedad inloresarte cela ‘normales quela probablicad de que la cantdad aleatrigestéente a= 0 y ‘bo 98 slemore dol 68%, ¥ de que esté a dos sigmas de la medi, el 95%, Por ejonpin, sila altura de una peiacion se cls buye camo una normal con media 170 em y desviscén 10 em, ‘entonces el 68% de esa poblaciin estar entre fos 160 y 180 cm, y el 85% ente los 150 y 190 om. Come se explica on o onto, to ‘oral es fundamartal en prbebi- ‘ad y etadistica porque e eorema ‘conta cel mite asegura que cua quer suma de muchas canidedes eobrias os gevssiane, Su impor tancia es tal que l gobierno alam lainduyé enios bilies de diez mar- ‘08 unto con la efigie de Gauss, roe hme penser osar Sorpresas, casualidades, milagros y otras probabilidades ‘epee eu compre de preoiidann esl. ye ema os dae con prundgahats eas on despues Loi istodres pratique progres mer ‘te cago fe tn fet dado gn sees ues Seba toc ‘ontados con losaruney ot verdes lo priners Cepek Debora} Benset, Aleworedod hast medladoe El problema del cumpleafios Como apunta Deborah J, Bennett en la cita que abre este segundo capitulo, resulta extrafio que el desarrollo de la teorfa de la probabi- lidad haya sido tan lento en la historia de la matemética, teniendoen ‘uentz e] uso exhaustivo que hacemosa diario de la misma. De hecho, atin hoy muchos consideramos que nuestro sistema educativo debe- "fa dedicar més tiempo y recursos a la comprensién de la probabill- dad y la estadistica, puesto quea lo largode nuestras vidas todos nos vemos abocados, una y otra vez, a tomar decisiones basadas en ellas. Un problema clasico que viene a Ilustrar nuestra falta de intuicion en la estimacién de probabilidades es el llamado problema del cum- Pleafios. Dice asi: «jCuantas personas deben estar en una sala para que sea més probable que improbable que dos de ellas tengan la misma 8 Las leyes del azar Se fecha de cumpleafios?» Obviando afios bisiestos, mucha gente sucle razonar de la siguiente ego-manera: hay una posibilidad entre 365 de que una persona cualquiera en una misma sala haya nacido el mismo fa que yo y, por tanto, una probabilidad 364/365 de que no, Siena sala hay n personas, entoncesla probabilidad de que las n- 1 restantes tengan fechas de cumpleafios diferentes a la mia es (364/365)"*. De modo que la probabilidad de que al menos una de ellas tenga el mis- mocumpleatios que yo es 1 - (364/365)". Haciendo esa probabilidad igual a 1/2, obtenemos n = 253 personas aproximadamente. El razo- namiento es valido, pero observemos que esta no es la respuesta a la pregunta inicial. El problema era encontrar la probabilidad de que dos personas cualesquiera en la sala coincidieran en sus cumpleafios. Esto incluye, por supuesto, la probabilidad de que alguien tenga el mismo cumpleafios que yo, que es lo calculado anteriormente; pero también incluye la probabilidad de que dos o mas personas cualesquiera com- partan el mismo cumpleafios, siendo diferente al mio. Hagamoslo bien. El mimero de posibles distintos ‘cumpleafios que pueden darse entre n personas es 365" —la primera persona puede haber nacido en cualquiera de los 365 dias del afto, la segunda tam- bién, etc.—. Calculemos primero la probabilidad de que nadie cumpla el mismo dia. Eso puede ocurrir de 365x364x...x(365~n+ 1) maneras distintas la primera persona puede haber nacido en cualquiera de los 365 dias, fijado ese cumpleafios, la segunda s6lo tiene 364 dias posibles, eté—.De modo que: P (a personas no cumplan el mismo dis) = y utilizando la probabilidad complementaria: 365x364x...x (365 —0+D 365" ¥ ahora con tan sélo n = 23 personas esta probabilidad se hace aproximadamente de 0,507. Moraleja: mientras que es posible que (al menos 2 personas cumplan el mismo dia) Sorpreses, corvaliades, mlagres y etresprotabiidades ” —_W—,.OA | l — ‘curra algiin hecho improbable, lo es mucho menos que se dé un caso concreto. Dela mano del estadistico Robert Matthews, vamos a contrastar este célculo con datos reales. :Dénde podemos encontrar grupos de 23 personas de manera natural?, pensé Matthews, Pues en los parti- dos de fitbol, donde compiten 22 jugadores supervisados por un ér- picro. En la siguiente tabla aparecen djez encuentres celebrados en la iiga inglesa el 19 de abril de 1997, donde participaron 220 jugadores y 10 drbitros. Para cada encuentro a la derecha aparecen las coinci dencias en cumpleafes entre los 22 jugadores y el arbitro: Fechas de cumpleanos colncidentes Sin coinedoncs on (A V7 vr AV SATE Equipes entrentados Areanal va, BBD ‘Aston Vila ve Tiles ‘Chelsea vs. Leicester Gy Tivo va Manchesir Unied | James (1870) 9 Wratt (185) Bu (211775) y B Novi (24/1777) Jonson 14/1273) y Wadi (3: 14/1200) ‘Sin enincidenoas ‘arty, 11/6) y Fat ca, 17865) ‘eanesorough ve. Sander Newasie vs Oaty Notoagham Forest vi Leads Shel Wed vs: Wrnbledon ‘Sn eoneidenoas Seuthorpton va. Coveney Bona (Ss, 3028) y Whatan Go O/RTA) West Ham ve Even ‘Sn sonaceneas Hemos calculado la probabilidad de que al menos haya una coin- eldencia en un grupo de 23 personas: P = 0,507 y de que no haya ninguna: 1~ 0,507 = 0,493. Con un poco mas de pericia matemau- ‘a, Robert Matthews calcula también las probabilidades de que haya exactamente una coincidencia: 0,363; dos coincidencias: 0,111; tres coincidencias: 0,018 y una triple coincidencia: 0,007, stempre para \un grupo de 23 personas. En la siguiente tabla comparamos la teoria * Robert Matthews. Coincidences thetruh sort tere. Teaching Sates vol. 20 (2007) ” sees del aaer a ‘con los casos reales, lo esperado y 1o observado. Para calcular el va- lor esperado nes basta con multiplicar el nimero de partidos, 10 en total, por la correspondiente probabilidad. Tenemos: ‘Tipo de colncidencie Esperado | Observada ‘Sn ccnaionce 3 < “A menos una concdesca 3 8 Exectamento une eoinedencia 4 4 ‘Exactamente 608 comodencis, 7 z Exaciomente tes conadersioe 2 a ‘Exaciomente une tiple covsodencia ° 0 0 2 ‘Gue haya ol menos alguien que cunpla el dia da paid. Elajuste entre la prediccién probabilista y las coincidencias rea- les observadas es excelente. En particular, vemos apoyadalla idea de ‘que mientras menos especifica es una coincidencia, es mas probable ‘que ocurra; como por ejemplo las 6 coincidencias en algunos cum- pleafios de algunas parejas. Sin embargo, entre 230 participantes no encontramos ninguno que cumpla en el dia especffco del partido, por ejemplo. El principio de improbabilidad Enel capitulo anterior comenzamos hablando de la «milagrosa» tarde del 14 de julio de 2000 en que el niimero 7 salié seis veces seguidas en la ruleta del casino César Palace de Las Vegas. Veamos otro famoso ejemplo de cémo un evento aparentemente improbable es en realt- dad bastante probable. Un hecho que algunos autores han llamado «el principio de improbabllidad».* Echemos un vistazo a las loterias primitivas, donde se escogen al azar 6 niimeros de 49, E16 de septiemt ‘David, Han, cThe probit Principle: Way Caincdences, Mirades, and Rare vests HaPP# rary Deyn Sorprese, cansliodts milagesyerosprotobildder “ _— bre de 2009, la loteria primitiva bulgara premiéa la serie de nimeros 4, 15, 23, 24, 35 y 42. Cuatro dias después, el 10 de septiembre, la serie premiada fue... jexactamente la mismal E] «mmilagro caus6 una tormenta medidtica (sla primera vez en los 52 afios de historia de la Joteriay, etc.) € incluso se abrié una investigacion por sospechas de fraude. Pero analicemos el suceso como hicimos con los casinos: apli- cando la ley de los grandes nuimeros y la explosion combinatoria. Se juegan muchas loterfas primitivas en el mundo y de manera repetida a lo largo de muchos afios. Cualquier serie tiene las mismas posibili- dades y hay un total de (2) combinaciones posibles —grupos distintos de seis nimeros no repe- tidos escogidos de un total de 49. Asf que la probabitidad de cualquier serie particular de seis niimeros es P = 1/13 983 816; que es, ni mas ai menos, la probabilidad de que dos sorteos particulares coincidan, {Cudntos sorteos se necesitarian para que la probabilidad de sacar los mismos seis nimeros en dos ocasiones fuera superior a un un me- dio, es decir, para que este evento fuese més probable que improbable? Utilizando el mismo razonamiento que usamos para el problema del cumpleafios obtenemos 4404 sorteos, Si se celebran dos sorteos cada Semana, 104 sorteos por afio, alcanzamos ese valor en menos de 43 alios. De modo que, pasados 43 afios, es mas probable que improbable ue alguna pareja de series de seis nimeros sorteados porla maquina de la loterfa coincidan exactamente. jY lo que parecia un milagro se convierte en lo esperable! Nos hemos ceftido a una sola loterfa. Si pen- samos en el niimero de loterias de todo el planeta, lo milagroso es que |as series no se repitieran, Ast que no deberfamos sorprendernos por {ue en La loterfa primitiva Mifal HaPayis, que se juega en Israel, se re- Pitieran los niimeros 13, 14, 26, 32, 33y 36,121 de septiembre yel 16 « Lester dt nor ©! Ee de octubre de 2010. ¥ que de nuevo el pablico y 1a prensa levantaran sospechas sobre la posibilidad de estar amafiada. ‘Semejantes milagros, sucesos extraordinarios y coincldencias es- ‘én al orden del dia en nuestras vidas. Por ejemplo, muchos hemos flirteado alguna vez con una tabla ouija, una especie de ruleta con 26 letras distintas, que supuestamente nos pone en comunicacién con Jos espiritus de personas fallecidas. La probabilidad de que por azar ‘salga una palabra concreta como AMOR es baja, porque se trata deun acontecimiento concreto. Sin embargo, la probabilidad de que salga alguna palabra no concreta con sentido es: ‘extremadamente alta, por- que se trata de un acontecimiento genérico. Por este mismo motivo Jas predicciones de los videntes y magufos son vagas. Las prediccio- ‘nes concretas raramente se hacen realidad. Que a algin televidente, de los millones que estan asistiendo al programa de television donde el paranormalista de turno proyecta su energfa, se le repare mila- grosamente ese reloj viejo que hacia afios que no funcionaba, es mas probable que que se le repare concretamente a Perico de los Palotes. La incomprensién de estos hechos tiene su rafz en nuestro ego- centrismo. Cuando es nuestro reloj el que se arregla, lo vivimos como ‘una experiencia milagrosa. Un ejemplo que causa conmocién en mu- cha gente son los suefios proféticos. Supongamos que! Ja probabilidad de un suefio profético sea de 1/10 000. Se trata de una probabilidad realmente baja. La probabilidad de que nuestro suefio no haya sido profético es abrumadora, de 9999/10 000. :Cudl es la probabilidad de tener al menos un suefio profético al cabo de un afio? La probabi- lidad de no tener un suefio profético en 365 dias sera: 0 joo) "0984 y utilizando la probabilidad complementaria: P(365 suetios no profiticos) = ( 9999 (al menos un suefio prot -1-( (al menos un suet proftico) = 1 (- Sorpresas, casvalidades, miagrs y eras probobihdades a _ gsuna probabilidad baja, pero si tomamos una poblactén como la espafiola, por ejemplo, que es de unos 47 millones de habitantes, el 436% de esa cantidad tendré al menos un suefo profético alo largo de un afio. Es dectr, 1,7 millones de personas habrén sofiado algo que fuego ocurrié, Dependiendo de la trascendencia de ello —pensemos ‘en la muerte de un ser querido, por ejemplo— el impacto personal dela casualidad nos causaré una sensacién indeleble, cuando en rea- tidad lo extrafio seria que no hubiera suefios proféticos. EI principio de improbabilidad nos dice que no debertamos sor- prendernos por las coincidencias, sino més bien por queno sucedie- ran. De hecho, deberfamos esperar que las cofncidencias sucedan. La ley de los grandes ntimeros nos asegura que, dadas suficientes oca- siones, deberfamos esperar que un suceso especifico cualquiera ocu- ma sin importar lo improbable que pueda ser en cada oportunidad. Probabilidad condicionada y teorema de Bayes Uno de los conceptos clave de la teor'a de la probabilidad es Ia lla- mada probabilidad condicionada. Simbélicamente se escribe en la forma P(A|B) y se lee «probabilidad del evento A condicionada al evento B», ya que esa probabilidad de observar A habiendo ocurri- do B Desde un punto de vista frecuentista, es relativamente senci- id condicionada: repe- lio precisar en qué consiste esta probabili timos un experimento muchas veces pero nos quedames s6lo con . €asos en los que B ha ocurrido; la probabilidad condicionada (ALB) es la fraccién de veces que ocurre A en ese subconjunto de ©Perimentos, Si el experimento se repite N veces, el nimero de ‘©casiones en que ocurre B es N x P{B) y el namero de ocasiones en ee A/y B simultaneamente es WV P(A y 8). Por tanto, la \dad condicionada sera: “ ‘Las leyes del azar NxP(4yB) P(Ay 8) PUB pa) PO) que es una de las férmulas fundamentales de la teorfa de la proba- bilidad. Observemos que si P(A y 8) = 0, es decir, silos sucesos Ay B son excluyentes entre sf (por ejemplo, que al lanzar un dado salga a Ja ver A= un-nimero-par y B= un-ndmero-impar), entonces P(4|B) = 0 (siha salido un ntimero impar, la probabilidad de que sea par 250). Apartir de la probabilidad condicionada se define otro concepto que ya hemos manejado de manera intuitiva: la independencia esta~ distica. Dos eventos, y B, se dicen independientes cuando la ocurren- cia de uno no afecta a la ocurrencia del otro. La magia del lenguaje ‘matematico permite expresar esta idea de forma elegante y escueta: Aes independiente de B si P(4|B) = P(A), es decir, sila probabilidad ‘com la que ocurre A es la misma, haya ocurrido o no B. De la definicién de probabilidad condicionada deducimos inmediatamente que, si Ay Bon independientes, P (A y B) = P (A) x P (B) y de ello concluimos ‘que si Aesindependiente de B, entonces también Bes independiente de A O dicho de otra forma, también P(B|A) = P(8). Una de las herramientas més poderosas que se desprende del concepto de probabilidad condictonada es el conocido como teore- ma de Bayes. Supongamos que el 0,5% de la poblacién padece una enfermedad y que disponemos de un andlisis para detectarla con una fiabilidad del 98%. Usted se hace la prueba y resulta positi- va. :Cual es la probabilidad de que esté realmente enfermo? Mucha gente responderia que el 98% una probabilidad muy alta. Pero vedmoslo con calma con la ayuda del siguiente drbol de probabil dades: ORES CENTOS, Milagros y otras probabllidades “ss Ne ‘49posiivos —_—Tfabo-regativo 168 lasos-sosinon 0751 najation ‘Supongamos que realizamos el andlisis a 10 000 pacientes, el co- mienzo de nuestro arbol. Como la probabilidad de estar enfermo es 0,5%, unas 50 personas estarén enfermas y 9950 estarin sana, En nuestro arbol eso se indica mediante las dos primeras ramas. Hemos distinguido de esta manera a las personas realmente enfermas y sa- nas. Si una persona esté enferma, lo detectaremos con un 98% de acierto. Sobre nuestros 50 enfermos eso supone 49 anilisis positives ¥ 1 falso negativo —una persona enferma que el test no detectaré y asarécomo sana—. En la rama de la derecha tenemos a 9950 perso- has sanas, de las que el test confirmaré que no tienen la enfermedad #1 98% (9751 negatives): pero como falla un 2% de las veces, propor- sionari 199 falsos positivos —pacientes a los que se le comunicaré que tienen la enfermedad cuando realmente na la tienen—. De modo ue la probabilidad condicional de padecer la enfermedad sabiendo ‘que su test ha dado positivo es: P(enfermo | positive) = 49 / (494199) 02, is6lo de un 20%! Sile sirve de consuelo, la misma sorpresa que se ha llevado usted, uerido lector, es la que se llevan los especialistas en medicina a los ‘ue periédicamente se les somete ala estimacién de probabilidades en Problemas semejantes. De fondo bucea et mal comprendido teorema de Bayes, que se deduce de la definicién de probabilidad condicional. ‘Tenemos que: P(A|s) = P(Ayy 8) / P{B). también que: P(BIA) =P(B yA) 1 P(A), Puesto que P(Ay 8) = P(B y A), podetos expresar: 6 mayetien P(AIB)P (8) Pa) Esto es el teorema de Bayes, un transformador de probabilida- des que parecen «iitiles» en primera instancia, pero que en realidad no lo son, en probabilidades que realmente sf que nos informan. En ” nuestro ejemplo anterior, la probabilidad que parece informarnos es P(posttivo|enfermo) = 0,96%, pero en realidad la que nos interesa es P(enfermojpositivo). Asi que usando el teorema de Bayes: P(BIA) = _. ._ P(postivo | enfermo)? (enfermo) Prenfem ost = ee) podemos calcular lo que nos interesa: P (positivoenfermo) P(enfemo) = 0,980,05 = 0,049. Para computar el denominador P{positivo) necesitamos usar el llama- do teorema de la probabilidad total. En nuestro caso nos dice que ten- gamos en cuenta que los positives pueden ser correctos o falsos. Ast: P (positive) = P(positivolenfermo) P(enfermo) + P(positivojsano) * Pisano) = 0,98 x 0,05 + 0,02 x 0,995 = 0,049 +0,119 De modo que: 0,089 Plentermo)posite) = ae oa” 02 resultado que obtuvimos antes de una manera frecuentista. See arene en ene Or Ov Teorema de la probabilidad total: .Cémo determinar cuanta gente se droga o tiene un vicio ilegal o mal visto? Sien una encuesta sobre sex0 le pregunteran por sus tondencias 0 siha ‘ecutio elguna ver a Ia proaiivién, oi fe pregurtaran en ora i funa tmeriwuana.o consume cocalna, :respendera con encordad? Mucha gorte ‘aunque se le asegurara el anonimalo de los dates, sipiementa rechazare responder al cuestionero, A fin de cuenas, es inpcibe eeegumar ta con senciadad absolute, .n<7 Porque al menos el encuestador end contan- dade slo. Pero fo certo 8s que existan maneras de garantzrltaimerte eve ano- rimato, Una de fas es hacer uso dol fereme dole probabiied fil, Su- Pongamos que tenerros una colecciin de avc8s08 A, A, A, tles que su Lnion copa todo & espacio de posiitdaces y no venen Mreeccones entre «i. Por ejemplo, en el juogo de Ia ruta: cor, par © mpar son te sucosoe que cumplen lo expuesto, ObserverTos que cualavier sweso B del espacio e posibilcades puede ser descrito com la sua de as intersecciones con 20a uno de estos tres sucesos que cubren completamente ese espacio. Por ejemplo: negro en la ruleta puede ser par o par. En general, pademos ex- bresaro como: P(S)=P(Ay A,)+ P(Ay A) +P(By A). Uileand dl eorema {de Bayes podemos sustituir las probebilaces conuntas por P(E) = P(BIA,)PIA,) + PLBA,PIA,)* PIBIAPA) Este es a! teorema do la probabldad total. Vearcn cémo apkzaro & ruesto asunto. Supongamos que queremos ester el corsuro de mar- ‘huana entre el profesorado universitario y realizamos para ell una encuesta ‘© 1000 profesores. Para garantizar el anonimato, se le dive ai encuestado: ‘que tance una moneda cuyo resultads puede sor cars o cruz a 50%. Si sale ‘cara, debe contestar con sinceridad « la pregunta de si consume matihuene habitualmente y si sale cn debe eortestar ala preguna: Les pare nero ‘del edificio de su vivienda? El encuestador no esta presente en el anzamian- 4 de moneday recoge la respuesta sn conocer reel de oul hase La Pregurta que realmente ha contestado el encussiado. ‘Supongamos que tas respuastas afimativas, fs sles, han sido 375. ara eatimr la proporcien de elas qe coesponde a verdadero conse 48 ‘Las leyes del exar de rarihuana, emplearemos el teorema de Ja probabilidad total de la sf uierte manera PYSi) = POSi{Fora marituan?) PC Fume mesinuana?) + POIs pr el omer) PEs par el nimero) ‘Sustiuyendo: 0,375 = P(SiyFuma maribuasa?) 0,5 +0,5x 05 ‘btenemos: (Si, Funa marituans?) ~ (0,375 ~0,25)/0,5 =0,25, Es decir, un cuarto del profesorado fuma y su anonimato se ha mantenido Inviolado, La falacia del fiscal: la importancia de evaluar las probabilidades adecuadamente Observemos que, en general, no es lo mismo P(4|#) que P(8|4), Un ejemplo clasico nos lo dejaré claro: si A representa el suceso «tener dos brazos y dos piernas» y B «ser un mono», P(A\B) representa la probabilidad de que «si somos un mono, tengamos dos brazos y dos piernas» y entonces, P(A|B) = 1. Sin embargo, P(B\A) representaria la probabilidad de que «si tenemos dos brazos y dos piernas, seamos tun mono» y esto no siempre serd cierto. Cuando se confunden ambas probabilidades se est cayendo en un error més corriente de lo de seable, hasta el punto de que se conoce como la falacia del fiscal. E! caso més famoso al respecto, un asalto con robo a una mujer ocurrido en 1964 en Los Angeles,® se ha convertido en un clisico de las introducciones a la teorfa de la probabilidad. La asaltante fue 5 1 Pueblo contra Colle, 68 Csl.24319,498 2433,66 Cat pr 497. Serpresas casualidades milegroty otras probeblidades ° i uensicada como una joven rubia con coletay se la vio hutra bordo ge un coche amarillo, en compaffs de un var6n afroamericano con parba y bigote. Transcurridos unos dfas, fue detenida como presunta calpable Janet Collins, una joven rubia con coleta, que mantenfa una yelacién con un hombre afroamericano con barba y bigote, y que era duefio de un coche amarillo. En el juicto, el fiscal estimé las probabil dades de cada una de esas caracteristicas individuales de la siguiente manera: P{autom6vil amarillo) = 1/10, P(varén con bigote) = 1/4, (mujer con coleta) = 1/10, P(mujer rubia) = 1/3, P(hombre afroa- mericano con barba) = 1/10, P(pareja interracialen coche)= 1/1000, Suponiendo independencia entre ellas, concluyé que la probabilidad de semejante coincidencia, el producto de estas probabilidades, era de 1/12 000 000. Se argumenté que en la ciudad de Los Angeles vi- vian algo mas de 1 millén de parejasy deberfa rondar los 24 millones para esperar encontrar dos parejas con semejantes caracteristicas Con esta evidencia, la Corte Superior del Condado de Los Angeles de- claréa Janet Collins culpable, Vamos a hacerlo bien. La sutilezaes que yasabemos que al menos hay una pareja con esas caracteristicas en la ciudad de Los Angeles: ila que cometié el asalto! Asi que lo que queremos calcular es una condicional: la probabilidad de que haya més de una pareja sabiendo ya que hay una o mas. En palabras del teorema de Bayes: (cui de una pareja) ‘P(ana.o mis parejas) P (més de una parejjuna o més parejas) = Donde hemos incluido que: ‘P( més de una pareja y una o més pares) = P (més de une pareja) Para calcular estas probabllidades podemos utilizar la distribu- cién binomial que vimos en el cap{tulo anterior, Tenfamos que el ni- 'MeT0 de parejas aproximado en Los Angeles era N= 1.000 000y que 50 ‘Las leyes del axer a en nee a probabilidad de «éxito» era p = 1/12 000 000. Observemos que: P(una o mas parejas) = 1 - P{cero parejas con esas caracterfsticas) y que P(mas de una pareja) = 1 - P{cero parejas con esas caracterist- cas) ~ P(una pareja). Usando la binomial: Pio de wa pareja) =1~ (1092.90) pep) (uma pareja 0 mis) 1 ~ (109000) pap” 1,000.00) 14) (189) 0p Sustituyendo valores obtenemos que (ends do wom parejaluna o mis press) = 0.04 De hecho, si subimos N de 1 millén a 5 millones de parejas —lo estimado para toda el 4rea metropolitana— la probabilidad pasa a ser 0,19. Observemos que hemos aumentado entre cinco y seis Orde- nes de magnitud el resultado inicial. Cuatro afios después, el caso fue recurrido y la Corte Suprema de California anulé la sentencia de cul- pabilidad gracias a este correcto, ahora si, razonamiento matematico. La incorrecta evaluacién de las probabilidades presenta resulta- dos de tintes dramticos al aplicarse a juicios donde se dirime la ino- cencia 0 culpabilidad de un acusado. La famosa pareja de psicblogos Daniél Kahneman y Amos Tversky han demostrado en sus investiga” clones de campo cuan alejada est nuestra intuicién probabilista en multitud de situaciones de su estimaci6n real. Por ejemplo, en unod® sus trabajos proponian el siguiente problema: Se produce un atrope” Mo nocturno con fuga por parte de un taxi. Existen en la cludad dos compafifas. En la primera, que posee el 85% de los taxis de la ciudad, todos son verdes (V) y en la competencia, que posee el 15% restart son azules (A). Se dispone de un testigo que, tras una prueba Pe Soepresas casaiades, miagres y stras probabilidades st —_aoo agai de su fabilidad en condiciones semejantes las del accident la wocke de autos, se estima que identifica de manera correcta el color ge un taxi el 80% de las veces y que yerra el 20%. Cuando el testigo firma que el taxi del atropello es A, la pregunta es sencilla: ycud} ve probabllidad de que el taxi fuera realmente A? La respuesta tipica 5 80% ya que mucha gente piensa que la probabilidad requerida foincide con Ia tasa de acierto de nuestro testigo. Es también su res- puesta, querido lector? Calculemos. ‘Tenemos quela probabilidad de que un taxi sea realmenteverdees Pireal V) = 85/100 y deque searealmenteamarillo,P(veal 4) = 15/100 Como el testigo no es perfecto, puede identificar el taxi realmen- te amarillo tanto como A (acierto}, como V (error 0 falso positive). ‘Almargen de la identificacién del testigo, en ambos casos el taxi es realmente A. La prueba pericial del testigo nos informa justamen- te de estas probabilidades. Y observemos que aqul esté la sutileza: esas probabilidades son condicionadas. Asi, P(dreal A) 80/100 y MA\real V)= 20/100. Queremos calcular la probabitidad de que el taxi visto por nuestro ‘estigo fuera realmente amarillo, sabiendo que él lo ha identificado Como un taxi A, es decir, queremos calcular P{real 4|4). El teorema de Bayes nos dice que: real A\A) xP (A) = P(Alreal A) x P(real oR BE ide sélo nos queda evaluar P(A) y lo haremos gracias al llamado "ema de la probabilidad total: P(A)= P(Apeat A) x P real A) + P(Apeal F) x P(real V) = HIS, 085 12 [00 "100 * 100 “100” 100" 100 10000 82 Los leyes del azar a Y despejando, obtenemos: Plreal A)P(real 4) 12 P(A) Ec) P(real A\A) = una probabilidad sorprendentemente baja teniendo en cuenta que ‘nuestro testigo tiene una flabilidad del 80%, gverdad? El azar en movimiento: modelos Todo oe fms spl de que se ples, Pa eciey Goer Modelos y simulaciones 8n los capitulos anteriores hemos visto cémo analizar y caleular la Probabilidad de ciertos eventos ante problemas muy diversos, mu- chos de ellos de indudable interés practico. Ademas de esos ejemplos, podemos imaginar con facilidad multitud de situactones en donde el séleulo de probabilidades es itil: pronésticos meteoroldgicos, fallos *" Productos o en cadenas de montaje, andlisis de datos experimen- tales, ete, Sin embargo, la teorfa de Ja probabilidad muestra toda su poten “a como herramienta para describir el mundo real cuando conside- FaMOS no sélo eventos ‘que son el resultado de un tnico experimento, ‘iho también la evolucién azarosa de alguna porcin de a realidad. aos Cuando estudiamos sistemas aleatorios que camblan =e ategre, Mt herramienta matemética para estudiar esta evolucion ten, Ta Son los llamados proceso: estocésticos, una rama amplisima ‘eorfa de ta probabilided. MM era: Se ee Los procesos estocdsticos son modelos para describir la evolucién de magnitudes aleatorias. Los ejemplos donde resulta util una des- cripcién de este tipo son innumerables puesto que todo esté afecta- do de algan tipo de aleatoriedad: no sélo los precios de las acciones en bolsa o la ganancia de un jugador en un casino, sino también la presién atmosférica o el nivel de precipitaciones, la concentracién de una determinada proteina en una célula, el nimero de bacterias en un cultivo, el nimero de coches que atraviesan un cruce en una ciudad, etc. Si disponemos de modelos matematicos que reproducen el com- portamiento de alguna porcidn de la realidad, podemos hacer pre- dicciones resolviendo las ecuaciones correspondientes 0, si esonoes posible, mediante simulaciones en el ordenador llamadas simulacio- nes numéricas. Podemos también recrear esas porciones de la reali- dad. El fuego, el cleaje u otros elementos méviles que aparecen en las peliculas de Pixar, por ejemplo, son el resultado de la simulacién en tun ordenador de un modelo matematico. Un madeio aleatorio queno es otra cosa que un proceso 0 muchos procesos estocdsticos de muy alta complejidad. Por supuesto, existen modelos puramente determi nistas, pero la inclusién de aleatoriedad en la modelizacién de fen6- menos naturales, sociales, econémicos, etc, aumenta enormemente ‘su capacidad para reproducirlos con mayor fidelidad, En este tercer capitulo vamos a ver algunos ejemplos de procesos estocdsticos. Son todos bastante simples, pero han dado lugar a dis ciplinas matematicas y nos permitiran entender por qué los modelos probabilisticos son tan potentes y, al mismo tiempo, tan peculiares. El primero de ellos responde a una pregunta aparentemente be nal: gcmo crece o decrece lacola en un supermercado? La llegada de clientes a una de las cajas es claramente un fendmeno aleatorio. 14 dindmica precisa de este fenémeno es compleja y depende en gra” parte de la psicologia de los clientes: si hay varias colas, est4 cla"? a ie los clientes irdn a las mas cortas; cuando hay una tinica caja, al- os quiza sigan comprando st la cola es muy langa, esperando a que se despeje Un Poco. Hay toda una disciplina dentro de la teoria de! laprobabilidad dedicada a este problema: la llamada teorfa deco- ns Obviamente, no se dedica tnicamente a las que se forman en los supermercados. El fenémeno que hemos descrito consiste, esencial- nente, en unidades que se afladen a una cola y salen de ella. Visto de esta forma, el mismo fenémeno se da en multitud de situaciones: an colas en bancos y oficinas de todo tipo, pero también en cadenas de montaje, en almacenamlento de productos para venta y proble- nas de logistica, en nodos de redes de comunicaciones que reciben yemiten datos a un cierto ritmo, etc. La ubicuidad de estas colas de uy distinta naturaleza hace que la teorfa de colas sea una rama de especial importancia en la teorfa de la probabilidad, y que se haya convertido en el tema central de numerosos libros, congresos y cur- ‘sen universidades. w Caminantes aleatorios '2 caminata aleatoria es uno de los modelos probabilistices més \elhados. En él, un caminance salta de casilla en casilla en un table- weanmisata esté definida por el tablero sobre el queel caminan- Inlag, ¥ por las probabilidades de cada uno de los posibles saltos. 'bura 4 mostramos varios ejemplos con distintos tableros en ‘Sue el caminante se representa como una ficha o una particula. dato, sie “caminante» es por supuesto una forma de hablar. El mo- Aioneg, a aminata aleatoria se puede aplicarainfinidad desitua- Satan oe tONES saltando entre los Stomos de un metal, monos ‘pergy ct STP0l en érbol en un bosque, informacion ssnanio te Nis adciann” &2 departamento en una empress 0, como veremos “lante, usuarios de internet saltando entre paginas web. FIG, 4,Caminantesaleato- os sobredistints tipos destableros osustrate, Arriba ala tzquierda ‘vemos un caminante sobre un tablero bidimenstonal, fen el que el eanioante, en cada paso, purdesaltar a cualquiera de las cuatro caminante se mueve sobre tun tablero unidimensional yysalta as izguierda oa Jaderecha en cada paso; cn la imagen inferior, st caminante se mueve sobre tuna red, en donde las casillas se muestran como cireulos, modelo puede incluso ser ms abstracto, ya que el tablero no tien que ser necesariamente un sustrato espacial. Por ejemplo, el cam ante unidimensional, que se mueve en un tablero formado por u™ hilera infinita de casillas, como las que se muestra en Ia figura 4(5¥ FIC. 5. La eseutura ‘Quantum Coud de An Gormley. que puede “ ‘ontemplarse en Landes, th dvefada mediante ‘aminante alstoris que comienzansuandaduraen Jasupertice deuna igre hhumara, La figura puede sedvinarseenet centro dela enorme enrucara, ue tiene 30 marosde alt est construacon sermentos de cer de 5 metros de ongtua. Petior derecha), puede ser un modelo de la cotizacién de un valor bursit de las ganancias en un juego o dela energia de un sistema Uantico, Se _ aplicaciones de los caminantes aleatorios son toumerbes com, (at incluso para componer miisica 0 disefiar obras m0 la escultura Quantum Cloud que se muestra en la figura 5. No- tos vamos a explicar dos de ellas con algo de detalle. Juegos paraddjicos y motores moleculares Como ya hemos mencionado, el caminante aleatorio se puede utili zar para representar la ganancia en un juego de azar. Esta relacién entre caminantes y juegos inspiré los llamados juegos paraddjicos, tun curioso fenémeno que se da.en ciertos sistemas aleatorios. Su for- ‘mulacién original consiste en dos juegos de azar. En el primero —lo Mamaremos juego A— el jugador gana un euro con una probabilidad de] 49,5%y plerde un euro con una probabilidad de! 50,5%. Este jue- go Aes similar a apostar rojo o negro en la ruleta de un casino. Se gana con una probabilidad algo inferior al 50%, porque con el cero Ia apuesta se la lleva la banca, y se pierde con una probabilidad algo mayor que el 50%, También es similar a apostar sobre el resultado de la tirada de una moneda ligeramente sesgada. El segundo juego, o juego B, no es nada habitual, Se juega con dos monedas y se utiliza una u otra dependiendo de Jo que el jugador ha ganado hasta el momento. Si lo que se ha ganado —Io llamaremes el capital— es miltiplo de tres, entonces se juega con una moneda mala, con pocas probabilidades de ganar (del 9,5%); y si no es milti- plo de tres se juega con una moneda buena, en la que la probabilidad de ganar es del 74,5%. ae =. Juego A Juego B . vemoe1 vo \s sect Msnay teknt than gor poor ast “Ge sof es ke gona peder gon a ‘Ambos Juegos, cuyas reglas se representan en la figura 6, son per- dedores. Si jugamos mil veces a cada uno de ellos, A o B, tenemos ana probabilidad muy alta de acabar perdiendo. Sin embargo, si al- ternamos los juegos, la tendencla se invierte: la alternancia de los dos juegos da lugar a una ganancia media positiva, Este comportamiento, a primera vista sorprendente, puede ob- servarse en la figura 7, Se ha realizado una simulacién numérica de los jaegos, haciendo que 5000 jugadores jueguen durante 100 turnos a A,B oa ciertas combinaciones de ambos juegos. Se observa que el apital medio de cada jugador desciende tanto para A como para B, mientras que aumenta en las distintas combinaciones. Los nimeros entre corchetes indican, respectivamente, cudntas veces se juega A ‘0 Ben cada combinaciOn, Por ejemplo [3,2] representa la secuencia AAABBAAABB... Por tiltimo, la combinacién aleatoria se construye eligiendo al azar el juego en cada turno y, como vemos, sigue siendo una combinacién ganadora. El juego se puede analizar matematicamente utilizando la teorfa de cadenas de Markov’ y se puede comprobar que la tendencia de los juegos aisladas se invierte al combinarlos, El andlisis proporciona también una explicacién intuitiva de esta inversién. Supongan que estén jugando a B, Este juego consiste en una moneda buena que se {anza cuando el capital no es maltiplo de 3y otra mala que se lanza cuando el capital es 3, 6, 9, etc, La tendencia ligeramente perdedora de Bes el resultado de una preponderancia del efecto negativo sobre ©|pesitivo, Cuando combinamos A con B, resulta que, a pesar de que Aes perdedor, se incrementa el ntimero de veces que se lanza la mo- neda buena de B (en otras palabras, hace que el capital sea menos vs Miltiplo de tres), dando lugar aun efecto neto positivo. Bl azar Por tanto necesario para obtener el efecto, puesto que, cuando ha- mann Farrondoy Biménez de Cneros, juegos parades naqunastermicas : Revita Eepata de Fa, yo.34, pay 24 (2000). FIG. 7. Ganancia media ‘en os juegos paradojicos, Lee dos jogos Ay B son claramente perdedores mientras que as combina clones son ganadoras, wee H00 Nomero oe tunos blamos de monedas malas o buenas y tendencias ganadoras 0 per- dedoras, nos referimos siempre a tendencias medias, mientras que el capital est4 permanentements sujeto a fluctuaciones. ¥ es gracias estas fluctuaciones que el efecto neto del juego A puede ser gana- dor, a pesar de ser un juego perdedor. En cualquier caso, la paradoja nos muestra que, cuando nos enfrentamos a fenédmenos aleatorios, nuestra intuicién, preparada para un mundo determinista, puede en- gafiarnos ficilmente. La paradoja también puede analizarse como una combinacién de Jas dos caminatas aleatorias que se muestran en Ja figura 8 (i- quierda). El capital acumulado por el jugador es un caminante que se mueve ao largo de una linea horizontal. En cada turno el caminante ‘alta hacia la derecha si el jugador gana, aumentando en un euro su capital, y saltaa la izquierda si pierde. El juego A es equivalente aun caminante que tiene una ligera tendencia a ir hacia la izquierda pero que se comporta igual en todas las casillas de la Ifnea. Por el contra- rio, en el juego B las probabilidades de ganar y perder dependen del capital acumulado hasta el momento, es decir, dependen de la casilla en donde se encuentre el caminante. Si se encuentra en una casilla multiplo de tres, que son las oscuras en la figura 8 (... -6, -3. 0,31 6, .»), tendré una fuerte tendencia a saltar hacia la izquierda. En = resto de casillas saltard con més probabilidad hacia la derecha. Con esta representacién podemos ver que el caminante en el juego B se encontrara predominantemente saltando entre las casillas 2 y 3 0 la 5y66,ete. La alternancia entre el juego By el A permite al caminante salir de estas ¢trampas» y avanzar en media hacia la derecha. Este mecanismo es idéntico al que utilizan ciertos modelos sim- ples de motores moleculares. Un motor molecular es una molécula 0 un complejo molecular capaz de convertir energfa quimica en movi- miento 0 trabajo mecdnico. Hay miles de estos diminutos motores en nuestras células y se encargan de transportar material de un lado a ‘otro de la célula, leer el ADN, bombear 4tomos y moléculas del inte- rior al exterior y otras tareas complejas, En el mundo microscépico enel que operan estos motores diminutos hay una terrible agitacion. iC5mo es posible entonces que puedan realizar flinciones tan espect- ficas y generar movimiento en una direccién dada? A principio de los afios noventa, los fisicos del Instituto Curie de Paris, jacques Prost y Amand Ajdari, propusieron un modelo muy simple capaz de conver- Srfluctuaciones en movimiento dirigido en una direccién, El modelo oe en una particula cargada eléctricamente que se mueve en ae y que, dehido a la agitacion térmica, se comporta como un. dhe rca a eatetI0” Aplicamosa dicha particula un campo eléctrco cléctrce ns ne on Clertas regiones de la linea, En fisica, este campo ‘© S€ puede representar por un potencial o «relieve» que em- ala particulaa los valles, como los. que vemos representados en mie is platens El potencial tiene que ser ademas asimétrico, aos ela rae ames ahora conectamos y desconecta- ameter sucesiva ocurre lo que se muestra en la fl- : cuando el potencial est4 conectado la particula est Puja seater, ‘Solar de ane aminante aleatorbs pars etudare movimiantseriicoepartclas micro “t Bastin, que estudiée!lamade movimiento browniano ens test en 1904 y ‘ni Publics ous resutados en 1905, e oso eaenus minis. Lasleyes Che 1G. €, Al tequlerda vemos la representacién de los juegos parad6jicos como cant ‘antes aleatoris y ala derecha el modelo de motor molecular en el que estén nse dos. En la rfc de la derecha las Ineas gruesas representan el potencial quealecea Inparticula La probabilidad de encontrar a la particula en un punto esta represenéa por les ineas nas. en uno de los valles, y cuando el potencial se desconecta la probit dad empieza a ensancharse. Al conectar de nuevo, la forma del poet cial hace que la probabilidad de encontrar la partfcula ala dered del siguiente maximo del potencial sea mayor que la probabilidadde encontrario ala izquierda del maximo anterior, de modo que la pat ticula tiene una mayor probabilidad de deslizarse al siguiente we hacia la derecha que al de la izquierda, con lo que se genera un” Me eto hacia la derecha, El interés de este modelo es aut eae ihe que sufre la particula son completamente simécict ius Mb corn ants movimiento neto en una direccion oy atohedden n entre la forma del potencial y el 4P4 ain 7 relacién entre el motory los juegos? La figura 82 oi Gainers Se juego A es como el potencial desconet : ana pega ust Morements hacia la tquierda 1 derecha “fia tendencia a perder, es decir, a saltar hacia la #24" lazor en movimiento: modalor e ———————————— —_— por rolado, el juego Bes similar al movimiento del motor molec Feren el potencial con forma de diente de sierra. Finalmente, la al- 1a ancia do 1s dos juegos en a paradeja noes més que el andlogo a wmipcary desconerta”el campo eléctrico, En ambos casos enconira ingrediente basico que genera el movimiento: la alternancia mos el Imre dos sustratos, uno de ellos no simétrico, preguntale a Google la importancia de Dios en la Biblia con los caminantes aleatorios se pueden construir modelos capaces de describir multitud de situaciones, pero también son utiles para explorar redes y estructuras complejas. Una aplicaci6n inesperada consiste en evaluar la importancia de ciertas palabras en un texto 0 de péginas web en internet. ,Gémo podrfamos determinar de mane- i automatica qué palabras son de capital tmportancla en una obra Iteraria? ;Cmo podriamos establecer un ranking de relevanclas me- diante un modelo matematico? Para determinar qué palabras intere~ san y establecer sus relevancias relativas, parece que no quede mas Temedio que penetrar en sus significados y sus interrelaciones. Es obvio que la palabra «evolucién» no tendré la misma relevanciaen un ensayo de biologfa que en una receta de cocina. Centrémonos en la Biblia, Para soslayar la cuestién anterior ne- essitarfamos una especie de mapa conceptual de sus términos rele- Yantes. Un diccionario biblico como el Easton's Bible Dictionary de Matthew George Easton (1823-1894), publicado de forma péstuma * 1897, nos viene al pelo. El Easton's Bible Dictionary consta de "= 3937 términos, Podemos transformarlo en una red de relacio- a ‘donde cada uno de los términos 0 palabras definidas se etiqueta MO un nodo, j = 1, 2,..., n. En la definicién de una palabra/nodo ®Parecen otras palabras/nodos. Si ocurre esto, establecemos enla- Las eyes del oxar 6 —_- —mo_—_ ces drigidos —flechas—~ desde a palabra definida hasta las gy participan en sudefinictOn, Por ejemplo, el mal comprendio mix, rio de la Santisima Trinidad, que enfocado desde la aritmética my, dulo 2 no tiene mayor dificultad, afirma que Dios es un ser inic, que exist simulténeamente como tres personas distintas: el Pad ol Hijo y ol Espiritu Santo, Los tres términos, asi como la palahy Dios», aparecen definidos en el diccionario, En la definicion de p. dre se emplea Dios, asi que en nuestra red seré Padre -> Dios y g mismo sucede con Hijo ~ Dios y Espiritu Santo ~ Dios. En realidad, cada una de estas cuatro palabras necesita de otras palabras para definirse; es decir, posee mas enlaces salientes. Y ademés participa en la definicién de otras palabras con las que se conecta por enls. ces entrantes. De hecho, nuestra red es una maraiia de unos 43 000 enlaces dirigidos. Si queremos establecer un ranking de importancia, parece rie zonable considerar que una palabra es muy importante si recibe muchos enlaces, porque eso significa que es necesaria para defini y sustentar muchas otras palabras del diccionario, Como podiames {intuir, la palabra con més enlaces de entrada es «Dios», hacia la que apuntan 611 palabras distintas. Més sorprendentes resultan la se Gunda, «Rey», con 542 enlaces, y las que le siguen de cerca: «Ciudab> con 530 y «Hebreos con 526. Definir la importancia de una palabra de manera proporcional al niimero de enlaces entrantes que pos? no incluye la influencia o importancia particular de las palabras 4#® Ja sefialan. Definida ast, a importancia serfa una propiedad local os gustarfa que fuera global, democratica y que se tuviera en cuem® toda Ia red para la calificacién de cada palabra. Podriamos defitit la importancia de una palabra proporcionalmente a la suma de Importanclas de las palabras que la enlazan, que la usan en sus niciones. Observemos que caemos entonces en una especie de 4 nicion circular: la importancia de una palabra se asigna a parti" #¢* lozar an movinlento: modelos el importancia de otras palabras, pero no conscemos a priori la impor- tancia de ninguna. ZCOmo resolver esta circulaidad? gs en este punto cuando los caminantes aleatorios nos pueden apudar. Podemos imaginar una serie de caminante,o «peregrine, quesemueven en lard dirigida que hemos construido yque pueden siltar de cualquier nodo ja cualquier nodo j si existe un enlace diri- gido de a i Coloquemos una gran e igual cantidad de peregrinos en tndos los nodos de la red y apliquemos la siguiente dindmica: si un nado) tiene k, enlaces de saliday en un instante tposee p(t) peregr- nos, en el instante +1 se repartirin p,(1)/ k, peregrinos a cada uno de los k, nodos con que se conecta. La cantidad de peregrinos en un todo representa su importancia, Inicialmente todos los nodos tienen Jamisma cantidad de importancia a repartir, el némero total de pe- regrinos dividido entre n. A cada paso de tiempo, cada nodo reparte por igual toda su importancia con los nodos que sefala y reactualiza svimportancia con los nuevos peregrinos que le llegan. Observemos ‘ue se trata de un proceso democratico donde, a cada paso de tiem- Po, cada nodo vota a los demas con el peso de su importancia man- dando mas o menos peregrinos. Nuestro método tiene, no obstante, un pequefio problema. Exis- ten palabras en nuestro diccionario que no utilizan ningin otro tér- mino del mismo en su Propia definicién, es decir, que no poseen en- laces salientes, Hay 52, como por ejemplo «artificer, ;Qué ocurre con MesiTo esquema si tenemos nodos sin salidas? Nuestros peregrinos “ntran y cesan su peregrinaje. Semejantes nodos acttan como acu Muladores de importancia,falseando el ranking y deteniendo el flujo Sbbal. También hay 1230 palabras que no se emplean en ninguna “ficién, es decir, en las que no entra ningin enlace. Slincialmente Hie Peregrinos en sus respectivos nodos, en un solo paso de Po quedarén vacios para siempre. Y en un paso de tiempo pos- ‘t quedaran vacfos aquellos nodos que solo los tuvieran a ellos Las kyesdel azar 66 0 ee a como entradas Existen también subredes en el sistema a ls gy, puede entrar pero no salir 9 con salidas pero sin entrades, que pan ran problemas semejantes. 2Cémo sortear el problema? Se puede evitar todos estos callejones si se permite que los peregrinos se cq, viertan momenténeamente en angeles y se tele-transporten con py, babilidad 1/(n- 1) acualquier nodo de la red. Se puede demostrar matematicamente que, tras un mimero je pasos de tiempo suficientemente grande e independientemente je la distribucién inicial de peregrinos, el nimero de peregrings que entran en un nodo cualquiera coincide con el que sale, Es decir se alcanza un equilibrio o situacién estacionaria y el numero de pere. grinos final nos proporciona el ranking de importancias. Ese nimery de peregrinos en la situaci6n estacionaria también puede calcularse utllizando cadenas de Markov, como en los juegos paradéjicos, Sisesustituye las palabras por paginas web y los enlaces por vit- culos (hiperlinks), el modelo que acabamos de describir es, ni mésni menos, el algoritmo de ranking que hizo famoso al buscador Google Bautizado como PageRank en 1998 por sus creadores, Sergey Bri y Lawrence Page, el algoritmo remedaba el comportamiento de un usuario que, estando en una pagina web, podia seguir navegandos través de uno de sus vinculos o saltar a cualquier otra pagina dela red, igual que nuestros peregrinos saltan de palabra en palabra ®™ el diccionario biblico. Cuando hacemos una biisqueda en Google, ®! ‘orden de aparicién de los resultados es producto del algoritmo Pare Rank que, como en el caso de nuestro diccionario, esté definido ps ‘ada pagina web y condicionado por todas las demés, Desde su nat ae = prone tone diapers oe teaslenleined coin m de sus posiciones en oie lesetin del hopacts de Watase een genio os predictbn dat trabajos cientificos en diferentes disclP! of 0 de trafico rodado, En 2011, el algorit™ azar en moviniert renee empleo par clasificar la relevancia de 20 000 protefnas involucradas yy el cancer de pancreas, revelando el papel determinante de siete 4 anas que indican Ta agresivided del tumor y a ntensidad de a Pr mioterapia recomendada, : Y para acabar, :cudl es finalmente el ranking bili segin este algoritmo? Es «Dios» la palabra msrelevante enta Biblia? Pues ob- tenemos que, efectivamente, «Dics», con importancia 0,0242, es la palabra mas relevante, seguida de «Hebreos (0.0173) y eliombres (0.0167). La interpretacién teolégica delresultado a dejamos en ma- nos de los docentes de las clases de religién, aul Fluctuaciones fatales Hiltimo ejemplo de proceso estocdstico que constituye, como la teo- rade colasy la de caminantes aleatorios, una disciplina matematica por s{ solo, es el llamado proceso de Galton-Watson, el caso més sim- ple de los llamadas procesos de ramificacién. Supongamos que disponemos de un cultiva de bacterias que crece Por divisién de cada uno de los individuos. Cada dia toda bacteria te- ne una probabilidad 1/5 de mortr, una probabilidad 3/5 de duplicarse yuna probabilidad 1/5 de seguir viva sin produdr descendencia. Si inicialmente nuestra colonia esta formada por 1000 bacterias, apro~ ‘umadamente 200 habrén muerto al dia siguiente, 600 se habrin dur Blcado y las 200 restantes simplemente seguirn viva. En total at dia Sigulente, tendremos una poblacién aproximada de ~200 + (2x 600) ; 200 = 1200 bacterias vivas. Es decr, la poblacion cree una media de 20%, Esa tasa de crecimiento se mantendré constant, de modo de segundo dia habré 1440 individuos, el tercer dia 1728,y as = mente, La poblacion crece exponencialmente si nuestrés cae ‘ones acerca de la reproduccién y muerte se sigue” ei mes, por ejemplo, la colonia alcanzarfa més de 200 000 y en un afio habria 10” bacteria. Los niimeros répidamente se hace, “demasiado grandes para un cultivo real, La competencia por los ra. cursos, desde los nutrientes hasta el propio espacio, limitard pronty ese crecimiento explosivo. Claramente, nuestro modelo simplificad s6lo sera valido para poblaciones pequefias y para los primeros dias deevolucién dela colonia, Aun asf, vamos cémo el andlisis del modely es capaz de revelar interesantes consecuencias. Hemos visto que; en media, la poblacién de bacterlas crece con una tasa constante. Dia tras dia la poblaci6n se multiplica por 1,2. La indicacién «en media» es aquf muy relevante, «En media» significa que sélo aproximadamente 1/5 de las bactertas morirén de un dia para otro y s6lo aproximadamente 3/5 se reproduciran, etc. Como vimos en el capitulo 1 al hablar de la interpretacién frecuentista y del teorema central del limite, esos «aproximadamente» indican que siempre habré algunas desviaciones 0 fluctuaciones con respecto a las fracctones 1/5 0 3/5. Vimos también en el capitulo 1 que, en el lanzamiento de una moneda, por ejemplo, las fluctuaciones se he- en menores cuanto mayor es el miimero de tiradas. En el caso de la colonia, serén menores cuanto mayor sea la poblacién de bacterias. Asi, si inicialmente el cultivo es de 1000 bacterias, las fluctuaciones no serén muy relevantes: morirén unas 200 y se reproduciran unes 600. Las pequefias desviaciones con respecto a las 200 que se esper@ que mueran y las 600 que se espera que se reproduzcan no serén significativas. En general, si las poblaciones son grandes, los valores medios 0 esperados serdn casi iguales a los valores reales. Pero, Po el contrario, en poblaciones pequefias las fluctuaciones pueden se de vital importancia. Por ejemplo, :qué ocurre si, inicialmente, disponemos de una tin a bacteria? Al dia siguiente podemos encontrarnos con que nuest? valioso y solitario individuo ha muerto con una probabilidad 1/5 que sigue s6lo con una probabilidad 1/5 0 que se ha reproducido co" —-—_ a una probabilidad 3/5. Si ha muerto, la colonia se habré extinguida irremediablemente. ‘Si se mantiene en solitario, volvemos a estar en el mismo punto de partida. Y si se ha reproducido, podemos man- tener la esperanza de que la colonia siga creciendo en los préximos dias. Ante este dltimo caso, también puede ocurrir queestos dos indi * Numero de FIG. 9. Nueve simutaciones de la evolucién de la poblactén de una colonia ial Oh un nico miembro fundador y con las condiciones de muerte reproduc . ‘titas en el texto. En cinco de las simulaciones la colonia continu ar ects ‘lalmente. Las cuatro restantes sufrieron a extincién. Bn la ampliacion abinie sles puede verse en tine discontina,atrayerria particu ly colle ev {vits.Sélo pueden aprecarse tres porque dos ée ls colonia se exingieron ‘Sthundo dia y sus breves trayectorias coinciden. as eyes del azar 0 aaa vyiduos]a palmen al |dfa siguiente. Eso puede ocurrir con Probabitidag 1/5 x 1/5 = 1/25. Es evidente que los primeros dfas de esta colon; minima son bastante criticos. Los escasos individuos que ja forma, sonlos patriarcas de una familia que, slo al alcanzar un clerto tama. fo, est libre de desaparecer debido a «fluctuaciones fatales», fy figura 9 se puede observar el resultado de nueve simulaciones gue parten deuna poblacién con una solitaria bacteria en las condicione, descritas. Se ha dibujado el tamafio de la colonia, es decir, el dimer total de individuos, en funcién del tiempo para las nueve ‘Simulacio. nes, Sélo en cinco la colonia prospera. En el resto de los casos, la co Jonia se extingue alo largo de los seis primeros dfas. Observemosque estos primeros dias resultan criticos, ya que cualquiera de las nueve colonias corre un gran riesgo de extinguirse, iCual es la probabilidad de que, partiendo de un solo individuo Ja colonia se extinga? En otras palabras, si se repite el experimente de la figura 9 un gran niimero de veces, gqué fraccién de trayectorias acaba tocando el eje horizontal, haciéndose cero? El calculo de esta probabilidad de extincién es un problema muy complicado a primera vista. Si en el primer dia la colonia consta de un solo individuo, ene segundo se habré extinguido con probabilidad 1/5. La probabilidad de que la coloniase | haya extinguido en el segundo dia requiere consi derar todas las posibilidades: o bien el patriarca muere el primer dit (probabilidad 1/5), 0 bien sobrevive al primer dfa pero muere en él Segundo (probabilidad 1/5 x 1/5), o se reproduce el primer dia, pe™® tanto él como su hijo mueren en el segundo (probabilidad 3/5 *3/5 *1/5), Por lo tanto, la probal el segundo dfa es: Et ezaren movimiento: modelos i gE donde se ha colocado entre paréntesis las probablidades de los eos que ocurren en el segundo dia, por razones que se harin ev- fontes aentro deun momento. gate modo de calcular la probabilidad de extincion se complica considerablemente a medida que queremos llevarlo hacia adelante ‘nel tiempo. El arbol de Posibilidades se va ramificando dia tras dia fon tres ramas por nodo. Existe, sin embargo, un método ingenioso pore calular la probabilidad de extincin, es det, la probabildad q deque la progenie de un solo individuo se extingaen algin momento faruro, Como ya hemos visto, en el segundo dia pueden haber ocurri- do tres cosas: que el patriarea haya muerto (probabilidad 1/5), que siga vivo sin reproducirse (probabilidad 1/5) o que se haya reprodu- ido (probabilidad 3/5). Si nos situamos en este segundo di, ,cudles laprobabilidad de extinci6n para cada uno de estos tres escenarios? Siel patriarca ha muerto, la probabilidades 1. Si se ha mantentdo sin reproducirse, la probabilidad de extincién es q por definicién. ¥, por tikimo, si ha tenido descendencia la probabilidad de que se extingan ambas estirpes ser4 q?, porque se tiene que extinguir a descendencia eos dos miembros de esta mini-colonia. Y ahora viene la idea inge- niosa: la probabilidad q de que se extinga la estirpe inicial tiene que ccincidir con la probabilidad de que se extinga toda su estirpe a un primer paso, De modo que: 11, 3, an bese ge Hemos conseguido una ecuacién cerrada para. Lo que en Se hemos hecho para llegar a esta ecuacion es tomar las = p _— Tamas del arbol de posibilidades del que hablébamos aes Cuenta de que cada una se puede tratar como Un ea eee bilidades, Fijense que esta ecuacién es la misma que s see Sustituyendo los dos paréntesis (sobre los que lamnam por qy ¢respectivamente, La — nae mein nueva ' a= 1/3(q= Lestambién solucién, Pero es trivial ¥ no tene ngg significado nt interés en el problema). Es deci, si hiciéramos yy rnimero de simulaciones con las probabilidades de muerte y de nuestra colonia um teri de elas acabarian extispe dose. Piensen ahora que la colonia de bacterias que consta de un Indvideo puede ser una neva mutacin naciente en la biasen ras solitario que se ha inhalado antes de contraer la gripe, opus Ser Imclaso un neutron que surge al azar en un material ratiacing y logra una reaccién en cadena En todos estos casos las fluctuate, Des inicales som criticas. Las fluctuaciones fatales pueden eliminarly mutacién, detener la proliferactén del virus o dejar el efecto del rey. ‘ton en tan sélo unos cuantos destellos de radiacién; aunque en estos dos casos tal vez el adjetivo sfatales», desde nuestro Punto de vista, ‘RO sea justamente el adecuado, sino mas bien Jo contrario. ‘modelo de proliferacién bacteriana que acabamos de analiar ‘% Puede aplicar a toda clase de procesos en donde algo se replica ya ‘San bacterias, individuos de una especie, neutrones en un reactor uclear 0 apellidos en un pals. De hecho, este modelo fue propuesto DOr primera vez por sir Francis Galton (1822-1911) a finales del sige XD para analizar la evolucion de apeliidos de la nobleza britaniay {he resuete al poco tiempo por el matemitico Henry William Watsot {2627-1903). to 1875 pubicaron juntos un artfulotitalado «SO tidad de extincién de las familias». Hoy se conoce el mate Proceso de Galton-Watson e inaugura toda un rea conood _ P*PCe405 de ramifcacién, que aborda problemas donde 39 boblaclnes de elementos capaces de reproducirse.Esosee™** Bits, palabras y adivinanzas iia op caesarean eis biaereelt eye predate aucomr Cmarron Preguntas inteligentes iRecuerdan el juego infantil en el que hay que adivinar un ie conocido mediante preguntas cuyas respuestas son si 0 eC a la mejor estrategia en este tipo de juegos? Curtosamente, beanie delagente encuentra de un modo intuitivo a ee Primeras fases del juego. Se suete comenzar con preguntas que hombre o mujer? Es de este pals oextranjero”, cuesvoees fo a 'aprobabilidad de la respuesta afirmativa es aproximadamen! ala de la respuesta negativa, es decir 1/2. niin qd Como veremos mas adelante, este tipo de preguntas: a Suministran mas informacién sobre et personale, Pero, ee se ralmente «informacion suministrada»? Puede cunt (1916-2001) "a de la informacién, desarroliada por Claude Shannon © ee ‘los afios cuarenta del siglo pasado, se ee dei ena blema: cuantifica la informacion que puede odter ” as lyesdel nar —— pregunta, ola que viaja através de una linea telefénica, o la que contig. ne un fichero informético. La teorfa no s6lo cuantifica la informacign, sino que proporciona herramientas para comprimirla, codificaria, combinar varios mensajes en un solo canal fisico de comunicaciones © corregir los errores en la transmisién de los mismos. La revolucién de las comunicaciones ala que hemos asistido en las tiltimas décadas —internet, la telefonfa mévil, la televisién digital, et-— habria sido imposible sin la teorfa matemética de la informacion. Volvamos al juego de adivinacién. La teorfa de la informacién nos dice que la pregunta Optima es aquella cuya respuesta tiene una probabilidad 1/2 de ser Sl y una probabilidad 1/2 de ser NO. Para convencernos de ello, en lugar de adivinar un personaje, pensemos en descubrir un nimero entre 0 y 7. Veamos qué ocurre si hacemos Preguntas en las que la probabilidad de las dos repuestas es 1/2. Po- driamos comenzar, por ejemplo, preguntando: jes el ntimero oculto mayor o igual que 4? (0 sea, sies 4, 5, 60 7). La repuesta, cualquiera que esta fuese, nos permitiria descartar cuatro mimeros y quedarnos on les otros cuatro como candidatos, La siguiente pregunta tendria ‘que descartar dos ntimeros. Por ejemplo, si nos han respondido que el ndmero es mayor o igual que 4, la segunda pregunta podria ser: 2es 6 0 7? Finalmente, la tercera decidiré entre los dos candidatos Testantes. Con esta estrategia siempre acertamos el niimero oculto Con tres preguntas. Podemos disefiar estrategias que son mejores ara ciertos niimeros. Por ejemplo, comenzar preguntando «es el 7? serfa una estrategia excelente si el niimero pensado es el 7 pero, en caso contrario, practicamente habriamos desperdiciado el turno, Puesto que tras la pregunta s6lo se ha descartado un niimero de los ocho posibles y la incertidumbre inicial apenas ha disminuido. La demostracién general de que la estrategia 6ptima es hacer pre- guntas con respuestas equiprobables requiere algunos conocimien- tos de matematicas y se muestra en un cuadro aparte. Sin embarZ0 Bits palebrary avinanaes ‘a OS laidea fundamental es fécil de entender, La clave es que el nimero de candidatos posibles se divide por dos cada ver que hacemos una de esas preguntas Optimas. Inicialmente el nimero elegido puede ser evalquiera de los ocho, que es 2°. La primera pregunta nos reduce las posibilidades a 4 = 2, la segunda nos deja con 2 = 2! candidatos y la tercera nos sefiala finalmente el nimero elegido, es decir, reduce el numero de candidatosa 1 =2°, FIG. 10. Bsquema de las ‘wes preguntas necesarias ara advinar un nime- mmo Oy? tds posible respuestar a cada ragunia se representan por una flecha negra hacia Ja dereca (Si) o gris hacia Ja equa (NO). 26s 4,5,6 677 bEs 2 6 3? 01234567 Cada pregunta reduce el exponente del nimero de candidatos po- sibles en una unidad y ello sugiere que la cantidad adecuada para cuantificar la incertidumbre del nimero oculto no es el niimero de candidatos, sino el exponente de dicho nimero en base 2. En mate- Imdticas, este exponente se denomina logaritmo en base 2 y se escribe log. Asi, la incertidumbre en un juegoenel quehay Nobjetos a adivi- Nar y todos ellos pueden ser elegidos con probabilidad 1/N se define mediante la formula He=log, 6 ‘Les eyes det azar Ja ——_ y-se mide en bits. SiN = 2 entonces = 1 bit. Recuperamos asta no, cin familiar de ebit» en informética. Un bt es simplemente algo gug puede tomar dos valores, 0 0 1, S{o NO, con igual probabilidad, En nuestro juegocada preguntareduce la incertidumbre del nie. ro oculto. Al principio (N=8) esa incertidumbre es 3 bits, porqueg =7: Y H=log,8=3 bits. Después dela primera pregunta H « log, 4 =2bits, 1a segunda pregunta reduce la incertidumbre a H =1log,2~1 bityla terceraa H =log,1~0 bits. Mateméticamente, podemos escribir esta reduccién paulatina con una férmula muy simple: Flacgte * Hae |g endonde #,_, y H,, son las incertidumbres antes y después de una pregunta e J... es la informacién media suministrada por di- cha pregunta, En nuestro ejemplo de adivinacién, cada respuesta su- ministra 1 bit de informacién, que es precisamente la incertidumbre de la respuesta. La ecuacién anterior es una especie de «conserva- cién de la incertidumbre»: la incertidumbre antes de la pregunta es Jasuma dela incertidumbre de la respuesta y de la incertidumbre del juego después de la misma, . Estos conceptos se pueden extender a situaciones mas generales. Claude Shannon encontré la forma de cuantificar la informacién de Cualquier cantidad aleatoria Si en una situacién —un experimento, un juego de adivinacién, ete— se pueden dar diferentes eventos, 1,2, 3,» con probabilidades p,, p,, Py entonces la incertidumbre de esa situacién en bits es: H=~pylog, p,~ p, log, p, ~ p,log, p, — ‘También se llama entropia de la distribucién de probabilidad P,P P,~. La entropia de Boltzmann (que introdujimos en el capftulo 1) & de hecho un caso particular de esta entropfa de Shannon. Esta for mula, la mds fundamental en la teoria de la informacion y que 2! ‘ts polabrosy advinavsas ares ” ee? _ouanta informacién suministra una pregunta? si hay un elomple farcinants do cémo hacer una teorfacuatlativaa part de nociones cuaitativas y poco practas, este es la lecia de la informe. cién de Shannon. Hemos visto cémo se define la entopia o ceridunie de una cantidad aleatoria y cémo esta incerticumbre se reduce ante sade pregunta que se reeliza. Esta reduccién es precsaments la informacién suministrada por la pregunta, La demostracion general de esta afmacin es la siguiente: imagine- ‘mos que, en el juego de adivinar un ndmero, ta pregunta es «zpertenece 1 ndmero que has pentado a un conjunto A?s. Entonces p fene que ser necesariamente la suma de las probabildades de les elamentos da y 1 — p fa suma de las probablidades da los elomentos que no pertenecen a A. Por tra parte, las probabilidades después de la preguria son les robablidades condicionadas a cada una de las respuesta: sila respuesta es afrmetva, {as nuevas probablidades son , / ps la respuesta es negative as nue- ‘vas probabilidades son p, /(I— p). La incetidumbre media despues de le pregunta es fa media de las Incoridumbres resuitantes sila respuesta os positva y negativa pesadas con sus respectvas prbablidedes i : : : i § Laexpresion ee puede eimpiificar de forma sencila.obleniéndose: Haga Sp 8s Fp. “P Unica a replaces clog nono uncut in ¥ Jp, ~1- p, seloga ala siguiente expresion: Haye -y, Jog, p,+ log, p+(t— p08, (-P) ques =H Sa fecha died beben tbat renters. beabhecreen asseaeee sass dat coer * a Ee largo del capitulo lamaremos férmula de Shannon, es una genera}, zacibn delcaso anterior, en el que las probabilidades son 1/1, ya que una conocida propiedad de los logaritmos es og,(1/.N) = Jog. y, La misma férmula sirve para calcular la informacién suministrad, por una pregunta con varias respuestas posibles 1, 2, 3,.., si cadg una de ellas se obtiene con probabilidad p, p,, p,... En particular, y informacién media suministrada por una pregunta que tiene dos respuestas posibles: Sf con probabilidad p y NO con probabil dad 1-pes Teaas *~Pl08, P-(1~ p}log, (I~ p) En lafigura 11 se muestrael resultado de esta formula en funcién de la probabilidad p. Vemos con claridad que la pregunta que, de me- ia, suministra mis informacion es aquella en la que las dos respues- tas son igualmente probables. En ese caso lainfarmacién es 1 bit.Si la ‘Pregunta no es de este tipo, entonces la informacién media es meno Por ejemplo, si en nuestro juego preguntamos; jes 7 el mimero que ‘has pensado? y la respuesta es afirmativa, la incertidumbre se hace ‘cero, mientras que si es negativa la incertidumbre es H = log,7~2,8 bits. Como ya hemos mencionado, esta Pregunta apenas reduce la in- certidumbre inicial si el ntimero secreto no es 7. Como laprobabilidad de que la respuesta a nuestra pregunta sea afirmativa es sélo 1/8 '2 probabilidad de que sea negativa es 7/8, la incertidumbre media después de realizar la pregunta es 0x 118+2,8x 7/8 ~2,45 bits. La infor- macién suministrada por la Pregunta es precisamente 3-2,45=0,55 bits, como se puede comprobar en la grafica de la figura 11, La teorfa de Shannon nos dice que no merece la pena correr el: riesgo, sinoquede ‘media es mucho més eficaz realizar la pregunta cuyas dos respuesta son igual de probables, Pero la teorfa de la informacién no sélo nos dice cémo debem0s hacer las preguntas sino también cudntas tendremos que hacer. S1€S* ‘Bits palobrosy advinanes ” nes 1G. 1. Cantidad den formacén que suminiea on pregursSi/¥Oe a aut us dela respeentan Siete un probabil Lainformacénmaxima, 1 sealanea cuandotas dos respuestas tienen la tna prbabiidaa 1/2 Un proguns tune espera sone ‘con probabilidad 1/8 y la___. otra con pebabld9¢8 reporons un norma clin de 0.5 bis. informacion (bits) probabilidad tamos ante una situacién cuya incertidumbre es H bits y, si pademos realizar una serie de preguntas S{/NO con probabilidad 1/2 de ser respondidas afirmativamente, es decir, preguntas que suministran 1 bit de informacion, entonces el nimero medio de preguntas necesa- rias para eliminar completamente la incertidumbre sera H. Esta ob- servacién nos conduce a uno de los resultados fundamentales de la teoria: el teorema de codificacién de Shannon. Cédigos Volvamos al juego inicial de adivinacién de un niimero entre ies : ¥retomemos para ello la figura 10, que nos muestra la a Gk Preguntas Optimas que conduce ala adivinacién en tres pas¢ tas ‘nimero del 0 at 7 esta univocamente determinado por lat respuesias alas tres preguntas. Resulta entonces que dichas Take tuyen un cédigo, es decir, una forma de representar los cla de Por eiemplo, et mimero 3 estaria idetifcado por ia secuencis Be Fespuestas No-sf-sf,y o! 6 por SE-SINO. i en lugar de sles Y eo as kyesdel azar ee escribimos, respectivamente, unos y ceros, entonces el 3 es 011y ¢16 110. Bllector con conocimientos de matemdticas reconoceré ense. guida que este cédigo no es més que la representaci6n binaria estin. dar de los mimeros del 0 al7 (en binario, del 000 al 111). ‘Veamos otro ejemplo. Supongamos que la persona que elige el ng. mero secreto tiene cierta preferencia por los mimeros altos y eligee| 6y el7 con probabilidad 1/4, el 4 y el S con probabilidad 1/8, y e) resto, el 0, 1, 2 y 3, con probabilidad 1/16, La incertidumbre de este juego es, de acuerdo con Ja formula de Shannon, it=-abog t- 2h og, t+ biog, w2b eat atlas bie 2Cuél es ahora la estrategia Sptima en el juego de adivinacién? De nuevo, lo mejor es hacer preguntas con respuestas equiprobables. La figura 12 muestra una de estas estrategias éptimas. Obsérvese que todas las preguntas dividen el conjunto de posibles candidatos on dos conjuntos que tienen la misma probabilidad. La codificacién que genera esta estrategia es: 0 = 0000, 1 = 0001, Z = 0010, 3 = 0011,4 = 010, 5 = 011, 6 = 10, 7 = 11. No es casual que los codigos de los mmeros mas probables sean mas cortos. Ocurre as{ en muchos otros c6digos, como el morse, en el que la letra més frecuente en la mayoria de las lenguas indoeuropeas con alfabeto latino, la «e,se representa or un tinico punto, Podemos ahora codificar cualquier cadena de mimeros sin ambigiedad. Por ejemplo: 77315 = 11-11-0011-011. Comprobamos ademds que, a pesar de que hay digits con cédiges de diferente longitud, no son necesarios los guiones para decodificat™ Ta secuencia si la leemos de izquierdaa derecha® * Esto se debea que ninguna de| labras» del e¢ es ra, Se denomsina strep poy lar rsecnatanc oper «ave cafe ea sino par acoder un menaesinanblquead gu: Teosten cde se construyen mediante bles de pepunias S\/NO, ceo os dela figuras 10 y 12 yl de Hina ‘san e6digos prio. Un Helo de cligoqueno es preljoes el céign morse exe que «© 5 ‘Bits poabresy edvieanzas FIG, 12 Esquema de laspreguntas6ptimas ara advioa ve ndimera entre 0y 7 en donde los ‘nimeres no sonigualmen- te probables.Como ena Figea 10, as dos posibes respuestasa cata progut- ta,51 080, serepresentan poruna lecha negra hada Ja derecha (fo grishadia Ja equierda (NO). Esta codificacién parece en principio més larga que la codificacién binaria, porque los mimeros del 0 al 3 estén representados por cade- nas de cuatro bits. Sin embargo, recordemos que el 7y el 6 aparecen mas veces que el 4 0 el 5,0 que el 0, el 1,e12y el 3. La longitud dela cadena codificada utilizando la codificacién binaria habitual es de 3 simbolos por digito. Sin embargo, con la nueva codificacién, lalongitud media por digito es 1 1 xan] = tt 2,75 simbolos Sedat Satu gt 2a20 = ue es precisamente la incertidumbre en bits. Una nueva razén pars Hamar bit a la unidad de informacién: la incertidumbre en ia ‘gual a la longitud del cédigo éptimo, en media Sent T Temos que transmitir mensajes compuestos por clertas Sim eines: ‘ncertidumbre de cada s{mbolo es H bits, entonces, on UNS Les eps el exer incertidumbre de Nuestro pequerto alfebeto se eetda de Stony res = Zea om Oe ome ee, ‘ee acerca bostante al limte dado porte incericumere, 0 Tt codgo eth clanado Dam ve cadabit spree con una peda Tio lo corcana a 1/2 que 86a posible (por 880.08 ot dota). Por samp, primer it 08 con probabiidad 0.59 0 con probabiidad 41 Sid pmer DR Bho, el segundo es 1 con probebilcad 0,25 0:41 «0,61 y0 can pobabiiad 0,16 / 0,81 = 0,39, eC. El cédigo de Huffman Veamoe a proceso de conduc dol ctig0 CON Un elemCtO nel Ue fog rormayes extn trmedon por ste simbots’ A B.C, D. E, FY G. y cade un sreae aparece con dferoré probebiiad Pera consirur ef ccig0,orveng. thos primero en une tabi tad08 oe sibolos da més 8 menos probable, tly ‘Como 90 ve on ls agen. Despube unimot con dos Hineas 108 Gos de probe | faded mea bee y sumeman genes probebsidades, En el empl, urimoe er ioves FG. con probebiicinden repactvas 0.01 ¥ 0.04, y srotamoe ia tore de sur pebeticedes (005) en una nueva casita la Que Se musatr ‘Conn rimaro romana | A parts de entonces. nos olviamos de las cas lls F y G, y sb conssderamos la cesila con la suma. En el siguiente paso toramos a nue las dos candles ahora menos probables, que en esta citn Sptima, podemos convertir un mensaje de longitud n mediante ‘cado $00 la 6 ta letra E. con probebiicied 0,11. y la de la combinacion FG, una cadena de n x H bits. (qo 08 006, Las uence con sendes lineas y anotamos le suma (016) que igo Spt Ucmn eae: es ve incontrar un céiigo 6ptimo es por tanto completamente equiva: / cess forma ycroendo len caotien ILIV Vy, fnaimente, la VI. que es a sume lente a encontrar una estrategia 6ptima en un juego de preguntas SI/ o fri in prebebindades erterores y por tanto tne que ser igual at. NO. La teoria de la informacion nos asegura que esa estrategia Optt- ma consiste en formular preguntas con respuestas equiprobables y, guiados por ese criterio, hemos disefiado las estrategias de las Agu- ras 10 y 12. Sin embargo, cuando el niimero de posibilidades es alto ylas probabilidades no son tan sencillas como en nuestros ejemplos anteriores, es dificil, y en ocasiones imposible, disefar preguntas con respuestas equiprobables. David A. Huffman encontré en 1952, cuando cursaba su doctorado en el MIT, un modo de disefiar cbdigos Optimos que se muestra en el recuadro «El cédigo de Huffman» (en la pag, 82). Las preguntas que genera dicho codigo ne conducen a ‘Une vez complotado of &rbo, et ctcgo se cbienelayendo ls gure de dre Fespuestas exactamente equiprobables, pero se acercan a ello todo che a equorde y seqqendo un 12 las tneas que suber y UO ln que bo} loposibe, Ei obcéoo reautarte en ruesto serrpio es: A= 11,8 = 01.C = 101. D = 100, E=001, F= 0001 y G = 0000, Lalongtut marie do un meraaje pcr letra 8: Correlaci ién de datos jones y compresion de 0,312 + 0,252 40,143 + 0,143 40,113 +0,084 + 0,014 = 2,49 y . Coditicar es convertir mensajes en cadenas de ceros y unos: oe Sodificacién optima es aquella que, de media, consigue las cadenas o sas yes del czar més cortas, Un buen c6digo es por tanto equivalente a un algoritm, de compresién; es deci, es una forma de transformar los datos de fichero informético para que ocupen menos memoria. El cédigo de Huffman es un ejemplo de algoritmo de compresién. Ademés realing tuna compresién sin nérdidas, porque la codificacién es reversible y permite reconstrulr con toda exactitud el fichero original a partir ej fichero comprimido? Imaginen, por ejemplo, un fichero compuesto por los nimeras elegidos en 1000 turnos de nuestro segundo juego de adivinacion, e| correspondiente ala figura 12, Supongamos que el ordenador guarda ese fichero en cddigo binario y que cada dfgito del al 7 necesita tres bits para ser codificado; es decir, el tamafio de nuestro fichero es de 3000 bits." Sin embargo, si utilizamos el cédigo generado enla figura 12, cada digito necesita, de media, sélo 2,75 bits y, por tanto, el tama- fio del fichero serd de 2750 bits. No es una gran reduccién, pero algo hemos ganado, De hecho, es la maxima compresién a la que podemos aspirar puesto que el cédigo es éptimo. Este es uno de los resultados més importantes de la teoria de la informacién: el teorema de codificacién de Shannon, que nos dice que el tamafio mfnimo al que se puede comprimir un fichero es, aprox- madamente, su incertidumbre o entropia. La matizacion «aproxima- damente» es necesaria porque los ficheros tienen un tamaifo finito. Cuanto mas grandes son, més precisa es la afirmacidn del teorema. Qué significa exactamente la entropfa de un fichero, de un com junto de datos o de una cadena de sfmbolos? Cuando los simbolos * Hay algeritmos de conpresién muy canocidos que ne son reversibles y que gon ities slo para cle tetipo de dats amo nse (no msgees en Ere casos en el precede conges se pledenformactn (utes imecperabl) pers qu no afec demasndn nea dl snl? dele tmagen et Rhee comprini 8 ‘Nétese que usamasla plabra ett sql y onl resto dal capitulo, para designar un registro dl fichero que puede ser Oo 1, paraindicar b longitud del fichero y también para medir la incertiéurnir® entropic del empl ene uae de 3000s, ero una entra 27508 ‘Bits plabras yeaininarzas s oo aleatorios e independientes entre sla respuesta es sencilla, Se ‘ot ala fOrmula de Shannon utlizando las probabilidades de apari- we de cada simbolo (que Pueden obtenerse empfricamente a partir spas frecuencias de aparicin si el fichero es grande)y se multplica ttresultado por el ndmero total de simbolosen el fichero.Enel elem jo anterior, ¢l fichero compuesto por 1000 mimeros elegidos en el Juego del figura 12, la fSrmula de Shannon nos da75 bits por sim- bolo y, por tanto, la entropfa total del fichero es 2750 bits, que es el tamafio al que se puede comprimir utilizando la codificacion 6ptima. Pero en la mayoria de los casos los simbolos no son ni aleatorios, ni independientes, Lo primero no es un gran problema porque, si el fichero es suficientemente grande, a efectos de compresién de datos se puede considerar producido por una fuente aleatoria de simbolos con ciertas propiedades estadisticas. Volveremos sobre este puntoen Jas secciones siguientes. El segundo problema es que estos simbo- Jos no van a ser independientes entre sf. En un fichero que contenga un texto en castellano, por ejemplo, después de la letra «q» lo mds probable es que aparezca una eu», Este tipo de ligaduras se llaman genéricamente correlaciones, similares a las que existen entre dos fuentes de datos diferentes y que analizaremos en el capitulo 6. En este caso la correlacién es entre un simbolo y los quelle preceden. La Correlacién puede ser de corto alcance, como la ligadura entre la «q» Ya «i», 0 involucrar partes de un fichero o un texto muy alejadas entre sf, Para tener en cuenta las correlaciones tenemos que aplicar la for- mula de Shannon a bloques de simbolos en lugar de asimbolos a Viduales. Por ejemplo, pensemos en la entropia ce la cadena de Ugitos que siguen la pauta siguiente: 00110011001100110011001100110011... 86 Lasley del ox TS EI Oy el 1 aparecen con la misma frecuencta, Por tanto, si consid. ramos simbolos individuales la entropfa de cada simbolo sera 1 bity, de todo el fichero serd de 1000 bits. Pero esto no es correcto. Si consi. deramos bloques de dos simbolos, vernos enseguida que las probabil. dades de los cuatro posibles bloques son p.,= 2, =1/2¥ p= p,, «0, Si aplicamos la formula de Shannon a estas cuatro probabilidades ob. tenemos una entropia igual a 1 bit por cada dos simbolos y la entro- pia total serd $00 bits. Finalmente, si consideramos bloques de cuatro simbolos, sélo aparece una cadena, la 0011, y por tanto la entropfa es nula. Este ditimo resultado es el correcto, puesto que la cadena no tie- ne aleatoriedad ninguna y admite una descripcién de tamafio muy re- ucido, Basta decir: «Repitase 250 veces la secuencia 0011», ‘Como en el ejemplo anterior, la forma correcta para calcular la entropfa de un fichero o un conjunto de datos es aplicar la formula de Shannon a bloques de tamafio creciente, La formula da entroplas cada vez més bajas que tienden a la entropia real de la cadena. sf se tienen en cuenta las correlaciones en el cdlculo de la entro- Pla. Pero zcémo aprovechamos esas correlaciones en un algoritmo de compresién? Una solucién es seguir la estrategia anterior y utilizar ‘grupos de simbolos como si fueran un solo simbolo, Podemos conside- Tar bloques de, por ejemplo, 8 bits y construir el cédigo de Huffman co- rrespondiente, El problema de este algoritmo es que las correlaciones en un fichero pueden ser mayores que las que se alcanzan con bloques de 8 bits. Pero, cpor qué considerar bloques de tamafio fio? Los cient ficos de la computaci6n Abraham Lempel y Jacob Ziv desarrollaron un algoritmo (LZ) que es capaz de detectar, en principio, correlaciones de alcance arbitrario, La idea fundamental es buscar repeticiones de C3 denas de simbolos en el fichero original. Se puede demostrar que, pa" cadenas muy largas, el algoritmo LZ alcanza el limite minimo impuest por la férmula de Shannon. Es por tanto un algoritmo éptimo, al menos en teorfa, y para cadenas suficientemente largas, ‘ts, palobrasy edvinanzas ——— SSE complejidad algoritmica sn embargo, en muchos casos elalgoritmo LZno alcanzatasas de com- esin 6ptimas. Por ejemplo, es incapaz de comprimir un fchero com- westo por 10s digitos del ntimero w= 3,1415926...De hecho, lo dgites Pr xse comportan a todos los efectos como si fueran alestorios e inde- Savanna pesar de que se pueden generarcon un pequefio programa Ge ordenador. Esta observactén nos conduce a una concusién sorpren- dente: el generador de los digitos de x es en realidad ia mejor compre- sion del fichero que contiene dichos digitos! Da igual lo grande que sea elfichero. Supongamos que generamos digitos que ocupan 1 gigabyte (1B) en el ordenador. El algoritmo LZ sera incapaz de comprimirto y tos devolverd un fichero del mismo tamafio, aproximadamente. Sin em- bargo, el programa que ha generado ese gigabyte no ocupa masde unos pocos centenares de bytes. Puesto que lo puede generar de nuevo con toda fidelidad, podemos considerar ese programa generador como una versién comprimida del fichero de 1 gigabyte (qué es un fichero compri- nnido sino una serie de datos con los que se puede reconstruir fielmente «lfchero original?), Por tanto, el verdadero contenido informacion det fichero de 1 gigabyte con los digitos de 7 es tnicamente de unos cente- Tares de bytes. Es incorrecta la teorfa de Shannon? No. Lo que ocurre ¢S que la teorfa de Shannon se aplica a series de bits aurénticamente dleatorios y sus resultados son dertos sélo de modo probabllisicn En los aftos sesenta del siglo pasado tres matematicos, Ray on Nonoff, Andréi Kolmogorov y Gregory Chaitin, desarrollaron una\ ma Cinante teorfa que generaliza el concepto de informacién 0| se = Cualquierfichero de datos, sin tener en cuenta cémo se ha p nea Definieron el contenido informacional de la cadena (0 Ss ene e 7 ‘lgoritmica) como el tamafo del programa de onto a 7 e | Uefio capaz de reproducir el fichero. ¥ fueron capaces ea mee ue este contenido no depende, salvo una constante finitay ry Las teyes él azar de ordenador o del tipo de lenguaje utilizado para escribir el pro, grama. Por tanto se trata de una definicion universal, que asocia un contenido informacional a cada cadena de datos. Esta teorta ha per. mitido también encontrar por primera vezuna definicién objetiva de alestoriedad, aplicable a cadenas de datos independientemente de modo en quese han generado. Como afirma Gregory Chaitin en la cita con la que se inicia este capitulo, una cadena de datos es aleatorig st su complejidad algorftnica es tan grande como la propia cadena; es decir, si el programa mas corto que genera la cadena es Ja cadena misma, En ese caso, la cadena es incompresible. Por el contrario, si podemos encontrar un programa que genere la cadena y que sea considerablemente mas corto que ella, es decir, sisu complejidad algoritmica no es grande, entonces podremos com- primirla hasta alcanzar dicha complejidad algoritmica. De hecho, el mejor compresor tendrfa que ser capaz.de hallar este programa mis corto capaz de generar la cadena. De esta forma podria comprimirel fichero con los dfgitos de 7, encontrando precisamente el programa que lo gener6. Un compresor asi seria capaz de encontrar cualquier estructura, cualquier pauta en una serie de datos, por oculta que es- tuviera y aunque involucrara correlaciones entre todos los datos de a cadena, Por supuesto, los compresores actuales estan muy lejos de alcanzar el limite impuesto por la teorfa de la complejidad algoritmi- ca. La importancia de dicha teorfa consiste en que extrac lo aleatorio de ese confuso escenario en donde se enfrentan la causalidad y ¢! azar; y lo coloca en uno nuevo donde lo importante es la existencis © no de una estructura interna, La informacién en el lenguaje Como se ha visto, la teorfa de la informacién es muy itil en la com” presién de datos, de hecho es crucial para el almacenamiento y !@ Bits palabras yedlvinanaas al jsion de informacién a través de redes de comunicaciones, {ran ng s6lo la punta del iceberg. La teoria dela informacién es pero es nds amplia y resuelve una cantidad enorme de proble- ome por ejemplo, «multiplexar» o codificar muchos mensajes, er ‘canal fisico de transmisién. Para terminar el capftulo, ae? - centrar nuestra atencion en la forma de comunicacién hu- ree gs ancestral: el lenguaje. Puede la teorfa de a informacion unre a comprender mejor la relacién entre lenguaje e infor- “a re Shannon, en 1950, escribié un interesante articulo so- bre la entropia del inglés medida a partir de dos métodos distintos. primer lugar utilizé el método de los bloques que hemos deserita™ con anterioridad. Si aplicamos la formula de Shannon ala probabili- dad con la que aparece cada letra en un texto, se obtiene que laen- tropia por letra es 4,03 bits. Obsérvese que, en una lengua en donde las 26 letras del alfabeto y el espacio entre palabras aparecieran con lamisma frecuencia, la entropia por cardcter serfa log, 27 = 4,76 ss que es algo superior. Pero un texto en inglés no es un conjunto ie caracteres independiente entre si. Como ya hemos visto, existen trelaciones. Si consideramos bloques de dos letras, se ede elpar ath» es, en inglés, el mas comin de todos (aparece aay te las veces), mientras que el par «qts no aparece nunca. St a an formula de Shannon a pares de letras en lugar de a letras les, la entropfa del inglés se reduce a 3,5 bits. i Cuando en lugar de pares se consideran bloques (10 la entropfa se reduce a 2,8 bits por letra. Podemos ir eeen get ‘ar la formula de Shannon a las palabras os sin See a ne venue ue Pro dane 9 bits por pla Tears tit yas en ings tienen Gue equivale a 1,76 bits por letra (15 palabra Oh proceso ¥ Tongitud media de 5,1 letras). Se puede #6 cuatro letras, 90 Laeaenr —_—__,_,_—_. considerar pares de palabras, y asf sucesivamente, Obsérvese que gg Probabilidades de grupos de palabras dependen ya de aspects gra, maticales y semdnticos de la lengua Es dectr, cuanto més amplig a, el bloque de letras o palabras con el que calculamos la entropfs, mi, caracteristicas de la lengua recoge dicho célculo, ePuede calcularse la entropfa del inglés teniendo en cuenta to- das las posibles correlaciones, es decir toda la estructura semantica y gramatical de la lengua? Shannon se dio cuenta de que es material mente imposible registrar estadisticas de grupos amplios de pals bras, sin embargo, un angloparlante sf ha interiorizado esa estads. tica. A partir de esta idea, coneibié un modo de medir la entropia de} inglés haciendo que un individuo tratara de adivinar una determina. da letra en un texto presentandole las 7 letras que la preceden. Pode- ‘mos entonces codificar la letra por el niimero de intentos necesarios Para adivinarla y considerar la entropfa del inglés igual ala entropla de esta serie de nimeros. Con este procedimiento obtuvo entroplas que decrecen cuanto mayor es el ntimero n de letras precedentes que se le muestran al individuo, Cuando n es 3, la entrop{a es aproxima- damente 3 bits, parecida a la calculada tomando probabilidades de grupos de cuatro letras. Pero contintia descendiendo hasta 1,3 bits cuando se presentan las 100 letras precedentes a la que hay que adi- vinar. Cuando n es mayor de 100, la entropia se mantiene précticr- ‘mente constante e igual a 1,3 bits, que puede considerarse por tanto 'a entropia por letra del inglés. Vemas también que esta entropfa se aleanza para n= 100, es decir, la estructura de la lengua hace que estén relacionadas las letras incluso a una distancia de 100 caracte- res." 4 Esta dstancla puede aumertarconsderiblementeen una novela puesto que sb aparece un PT ‘Sea Pero por mpa)y ene rexparece ras ds pgnas (queso, prolmaden t 7000 caracteres},podremos adivinar ast oa el espacio que le sigue slo sicanocereos os 70 caracteres presedentes Ss Pasgoresy adivanannas: a eo vemos, Ia informacion en el lenguaje es «lo que queda» es eliminan toda clase de correlaciones y redundancias. cuando © cién de un texto viene dada por las elecciones realmen- uslaforms ue hemos realizado al escribirlo; es decir, descontando oars oe constricciones gramaticales y ortograficas. De hecho, toda case tivo de Shannon con personas angloparlantes no logra ¢ eto esta dificil diseccién porque nuestras elecciones al es- Ls i no se dan letra a letra, ni siquiera palabra a palabra. a anemere elegimos en primer lugar la estructura gramatical, torverbotobjeto+complemente-de.tiempo, por elemplo,yluege artis cada lugar con las palabras 0 expresiones adecuadas: ero averiguar el modo en que un individuo almacena y aplica las = gla gramaticales de su idioma es uno de los problemas més comp! i jos de la inteligencia artificial y la lingiifstica, De todos modos, 7 queno sepamos de forma exacta a cantidad de informacion que hay en un texto, la teoria de Shannon es imprescindible para que millones dc ellos se transmnitan cada segundo por todo el planeta. _sypatrand ob (Doe 199) “Toba. Mere An erductiontnIfrnation Teor Imbel Censos, encuestas y estimaciones a probabil de tener un aceldente de rico aumenca cone verpe (ud pases en io calle Por tanta. cuanto més pig circles, menor ese prabobiided de que tengas an accident, £1 3% de los acclfentes morta- Wesinvelucran eguiengue ho bebo Por tanto. ol 67% restate ha ido ‘causade por alguien queno table bebid. Ala sta de esto, est loro que td frm Segura de conducr oc trborracho ya gran velocidad. Andean 7 427 611 178 personas en un mundo en miniatura 48130 de octubre de 2011, con el nacimiento de Danica Mae Camacho en Manila, Filipinas, se alcanz6 la cifra de 7000 millones de habitan- tes» (Fue esta noticia una afirmacién exacta? Obviamente se trata- bade una noticia periodistica «coloreada». Es imposible determinar Quién fue realmente el ciudadano 7000 millones. Las estimaciones estadisticas poblacionales de la ONU determinaron ‘el instante apro- ane en que se esperaba el nacimiento del humano 7000 millones. ‘tonces buscaron el nacimiento més cercano a ese instante en un fo, Ptala nivel mundial y se utiiz6 el dato para «bumanizars Ja in imation estadistica, Una cuestion simbélica discutible pero efectis- esde el punto de vista periodistico. rr Les eyes del azar Fe — uCudntos habitantes pueblan la Tierra en este momento? Son j 17:49 h del 6 de junio de 2016 en el instante en que escribimes t4s lineas. Segiin Worldometers la poblacién mundial actual es « 7 427 611 178 personas. Desde el 1 de enero han nacido 61 838 602 hhumanos y en lo que levamos de dia, 291.096, En esos mismos py, rfodos han muerto 25 896 320 y 121 903 personas, respectivament, {Tienen sentido estos datos con tanta precisi6n? Lo que hace Worlde meters en su pagina web és mostrarnos estimaciones basadas en es. tadisticas y proyecciones de organizaciones como a United Nationg Population Division, en este caso. Obviamente es imposible determi. nar con precisién algo semejante. Pero la filosofia de este grupo de estadisticas es que, al presentar los datos cambiando a tiempo real no sélo obtenemos una cifra sino también la sensacién de cOmo va cambiando en el tiempo, Los demégrafos no s6lo intentan determi. nar el tamafio de la poblacién actual, sino también cémo serd su evo- lucién en el futuro, Es una tarea extraordinariamente complicada y muy delicada, porque de sus estimaciones dependen muchas dec: siones politicas yel futuro de nuestro mundo, Piénsese en los futuros distépicos como la superpoblacién, tan bien planteada en el clésico de ciencia ficcién Cuando el destino nos alcance (Soylent Green, Ri- chard Fleischer, 1973), que nos enfrenta a una Tierra superpoblade en el afio 2022, donde la energia y los alimentos son escasos. 0 ¢ todo lo contrario, como ocurre en Hijos de los hombres (Children of Men, Alfonso Cuardn, 2006) que transcurre en 2027 con una human dad estéril abocada a la extincién, Cuando utilizamos el término «estadistica» solemos hacerlo co? dos significados distintos: o bien en referencia a una colecci6n ded tos («una estadistica»), 0 bien refiriéndonos a la ciencia que tra%# de inferir regularidades 0 propiedades de un fenémeno o poblaciét («la estadistica»). Ambas tienen su correlate técnico: a la primera s° la conoce como estadistica descriptiva y a la segunda como infere™ (Censos,excuestasy eximociones is Se a ja estadistico. La estadistica descriptiva se dedica arecolectar datos. radescribir el mundo. Las listas de némeros nos resultan Aridas muchas veces Opacas, as{ que la presentacién de los datos resulta Tycal Hacer «hablar alos mimeros» es una mezcla de clencia, tec- nologiay arte. Veamos un sencillo ejemplo, Imagine que reducimos la poblacién de la Tierra, mantentendo proporcionalmente sus caracterfsticas, atan sblo 100 habitantes, Nuestro actual mundo en miniatura’? es as(: 61 habitantes son asid- ticos, 13 africanos, 12 europeos, 8 norteamericanos, 5 sudamerica- nos y caribefios y 1 de Oceania, 50 son mujeres y 50 son hombres. 47 viven en ciudades. 12 son discapacitados. 33 son cristianos, 21 son musulmanes, 14 no son religiosos, hay 13 hinduistas, 6 budis- tas y 13 practican otras religiones. 43 viven sin sanidad basica; 18 Viven sin una fuente de agua potable; 14 estén hambrientos 0 des- nutridos; 12 no saben leer. S6lo 1 tiene educacién universitaria. 53 personas luchan para sobrevivir con 1 euro y medio o menos al ia, mientras 20 personas poseen el 75% de las riquezas de todo el mundo. A pesar de las desigualdades y la pobreza, y probable- mente también debido a ello, nuestros gobernantes dedican mas de 875.000 millones de euros a gastos militares. Asf que 20 personas en nuestra aldea viven con miedo a morir por bombardeos, ataques armados, minas terrestres, violaciones 0 secuestros por ‘grupos ar- Mados. La triste conclusi6n de todo esto, querido lector, es que si ‘sted tiene comida en un frigortfico, ropa en un armario, una cama donde dormir y un techo sobre tu cabeza, es mas afortunade que él 75% de la poblacién mundial. ‘Les datos esti tomades del informe sobre el Estado dela Aldea qos Donols Meadows hizo Piblios por primers vexen 1990 y que van atualizindose desde entonces Ver las estadisticas Frotoblemente,cusnde heblamos de 100 personas, en vez de 7000 mi Thus ee oer ms sora son ame ‘mundo en miniatura» es una demostracisn de oémo la buena pre 2 ls datos estadisicos es crucial. Sise desea certficar estas aftmani 139 pueden vitals versiones gréficas de la pagina oficial de The Miniaans art, la web anmada I the weld were a village of 100 people de os some tos HyeBin Pa yJnoo-Young Cha, la pagina The Workdo! 109 de tomy Na Kivong To, por sjomplo, Eatadisticamente vivimos una époce extraone, aria gracias aig Dota y a interot. La infografay las nusvas tesndogias 4d la informacion estén revclucionando los métodos visuales pera comunieay {grandes cantdades de infomacion de manera eficiente,airaciva @ inlucs ‘emocionante. Visite, por ejemplo, la herramienta Google Public Data Expl. "8 muy Intutiva y permite ver todo tipo de estadistcas evolucionand co el iempo. Si quieren ver una demostracion de su creader, Hans Rosig, hagan una bisqueda con su nombre en las TED talks accesibles en intemet Y. ya que estamos, también son muy recomendables las presentaciones €1 ele famoso portal de Chris Jordan (Turning powerful stats into art), éonds ‘manejaestadisticas de grandes niimeros con vasos de pidstico, operacones Ge Graal esética, muertes por tabaco, etc, para ponemnos delante de a ae nc IP Git ‘slmente somos en estos momentos; y de Alisa Miler ‘news distorts our worddview), que usa mapas disiorsionados part ‘mastramos cémo ven el mundo los estadounidenses a part de tas noticias ‘que aparecen en los medios de comunisacién. Estimaci6n: contar sin contarlo todo Cuando pensamos en la estad{stica rdpidamente nos vienen als beza términos como sondeos electorales o estimaciones de porcen's Jes.Pero en realidad la estad{stica ocupa todas las facetas de nuest Vidas. Por ejemplo, nos ayuda a desvelar qué plensan de su future los jévenes (sociologia) o cuales el perfil del consumidor de sn Pr ducto (mercadotecnia); nos aconseja sobre qué podemos hacet P#"* Gensos, encuestas y estimeciones ” ee ragorar nuestros procesos de produccién (control de calidad) o so- pre cada cudnto tiempo debemnos revisar el motor de nuestro coche (paiidad); nos informa de cuénto han crecido los precios est af economia) 0 de cudnta enersiaeléctrica se espera que gastemos la semana que viene con la ola de calor que se espera (predicciones); qos gula para decidir si un nuevo medicamento es mejor que otro ya existente en el mercado (medicina) o qué animales estan en peligro deextincion (ecologia)... Para guiarnos en todas estas complicadas questiones usamos la inferencia estadistica, nombre que se da al pro- ce y resultado de extraer conclusiones de una poblacién a partir de una o mas muestras tomadas de la misma. Por «poblacién» no se entiende sélo seres vivos, sino cualquier coleccién, desde estrellas hasta tomillos; y por «muestras, un subconjunto de esa coleccién. Una de las cuestiones basicas que aborda la inferencia es la estima- ifn: precisar una caracterfstica desconocida de una poblacién a par- Urde los datos obtenidos sobre una muestra. Por ejemplo, cuando se firma que «el 23% de los votos serdn para el partido Patatin» 0 que «el mimero de ballenas jorobadas en la Baja California es apro- ximadamente 1450», scémo se ha alcanzan semejantes nimeros 0 ¢stimaciones? Centrémonos por ejemplo en el caso de los censos de animales. Para realizarlos, desde el siglo xix se usa una técnica bastante inge~ ‘iosa: el método de captura-recaptura, Supongamos que queremos Saber el nimero N de peces que habitan en un pantano, ¢l tamafio de una poblacién. Seleccionamos una muestra, pescando un cierto ¥timero de ellos, digamos 100. Marcamos estos peces capturados de Alguna forma y los soltamos de nuevo en el pantano." Bsperamos sntlempe suficientemente largo como para que los peces ae ‘©Mezclen con el resto —por ejemplo, una semana—, Y VO! vemos @ Xk rmomendsennents pari ou malmante se hace sade descargas lcs Las pees quacan moment ‘ot ena superficie, emarcan seliberan de nev. Las kyesdel azar —~ capturar ahora 150 peces, por ejemplo. De ellos, n estarin ma dos, por ser peces erecapturados», y (150-r), no, Resuta plas, esporar que la proporcin de peces capturados en primera inet que en nuestro ejempla es de 100/N, sea aproximadamente gua proporcién de peces reeapturados que estn marcados; es deci, ay 1/150 » 100/N. Dicho de otra forma, si hay un total de paces y hemos marcado 100, la probabilidad de repescar un pez ya mary do serd: 100/N. Por lo tanto, el niimero medio 0 esperado de peces recapturados seré: n = 150 x (100/N). De modo que a partir den po. demos estimar la poblacién N, despejandola de la ecuacién anterio, Acabamos de construir un estimador de la poblacién N, una receta que nos dice que, si en la primera captura pescamos y marcamos», peces y en la segunda repescamos a, de los cuales n resultan estar marcados, entonces puedo estimar la poblaci6n total de peces con: ya fie Eso nos recuerda que estamos frente a una estimacién de la pobi cién que no tiene que coincidir necesariamente con el valor descon «ido de la poblacién. Dicho de otra manera, si repitiera varias ves el proceso de captura y recaptura podria obtener valores diferent™s de 8 en cada experimento, sin embargo, la poblacién en todos lbs seria siempre N, En la figura 13 vemos un ejemplo concreto de pesca-repesca 4°” de N=19y obtenemos una estimacién de V = 18, Hemos cometido¥? error del 100 x (19-18)/19 = 0,059. Es muy bajo, pero es obvie no siempre serd asf. :Qué error medio podemos esperar? La ticada cuenta de este tipo de cuestiones, Para ello necesitariamos ber como se distribuye nuestro estimador cuando repetinmos ™ veces el proceso de pesca y repesca. Para soslayar la cuesti6n te el estadistico Pere Grima (en su excelente libro La certeza @ (Censos encuestesy etimaciones a Jane mis scan) mot bl m= 3, Enla primera captura (indicads cor = ae suds (linea decay) Remas Meio, =9 lx ces ay = — een del mero taal de eces es =0x9/3= 1 gener ar ns 19 Unarepeindel experiments pb or er smresmacnderene, vyotras ficciones) utiliza un pequeno programa que repite una y ofr ver el experimento de manera numérica, Su poblacién de ream N= 67, pesca siempre n, = 15, los marca y repesca slempre ”, = *9- Cada vez que simula el experimento encuentra un valor den y deter: mina un valor del estimador 1. En el 85% de los casos halla mee entre 45 y 115 peces, y el valor medio de las estimaciones Se Loideal serfa que el valor medio de las estimaciones coincs sven N= 67. Cuando eso no ocurre, como en este c2s0, los “9 al dicen que el estimador es sesgado; una propiedadnodeseable. dificamos el estimador y lo definimos como ms D@ +d) ned el valor lrepetir los experimentos numéricos, comprobaremos me Aber Medio ahora coincide con N= 67. Este estimador es ou ces, ae £1.85%6 de 1as veces obtendremos valores entre 42 y 84 Pores: Adda, este esumador functona mejor 7s Las leyes del axar ee — Estaesla version més simple del método de captura-recapy métedos empleados por ec6logos 0 demégrafos son mucho mi tcados, puesto que suelen contemplar la posibilidad de muetag ag La media muestral es un estimador insesgado Suporgenos une pian compel po = 5 unesnios ena tenga de cro: 6 8,10, 2 14 (on undedes arvana Soot tos una moss de anato 7 de ela phan arash cece Un uncool a spuntamos evar de su cuena yo nee i piace, Desputsslesnamor un sepun uneorio s reagan cinno (epost. wun orcas, sea mone) Acs se ene Pouibies mucstras ede Semen dae Pos tas latorias [Senso enono ds mats L <—e —e— ea eof, [a De OSPR 10 [10,12 fietintos mestas daran, en general f on general, resultados distin. Pani, 2 evaiedad> da valores pademos obtene a dstbcion de PO perme cal Staisio media musi. {Cmo soré? Ena sepura WE Remot calcula la media mice para todas las muestee posses, Censos encvestosy eximaciones 101 eonanegannennneney, ge Regina mens (ee rusia 7s fae a sone wo [te f [0 [ne [a fre Primer esta piemorto 09 10. a de hat of [eeu 6 7 @ 3 i i : i i : : Observemos que todas las muestras son igualmente probebles y puesto ‘que hay 26, la probabilidad de cada una de elias serd 1/25. Hay 5 musstras {que tienen como media muestral X = 10. Luego su probabildad de que nos fenoontramos con esia media muestral en uns muesta lomada a azar e8: (10) = 6/28. Siguiendo el mismo razonamiento, enconiramos que P(9) = (st) = 4/25, P(B) = P(12) = 3/25, P(7)= P{13)= 225 y PIB) =P( 14) = 1/25. En el siguiente grafico hemos planteado esta dstibuctin de probebildad: ‘Se parece a una distribucién normal. No #8 de ertrafar s recorsemos «ue el leorama central del limite que vinos en el copia 1. & teorema ros decia que la distribucion de la media de cantidedos leatodas dérticamento distibuidas se ojuatabe mas y mas @ una normal, mientras més cantidades aleatorias toméramos para hacer la media. Ademés, la media dela cantided ‘lestoria coincidie con la media de la normal. sebsiiee Los leves del azar Conse, encuenasy estmaconer La varianza muestral es un estimador sesgado, pero podemos arreglarlo... Justo con la media muestra, la varianza muestral es el estadlstico més re: CaurTide. Con este estadistico pretendemos estimar la varianza pabiacional, Recomdemmos que a media pobiecional en nuestro sjamplo valia m=(6 +84 10+ 12 + 14Y5 = 10. La vatianze poblacienal, que mide cuén variados son los tamafios de los cvarnos da nuesiros unicornios raspecto « ou media, vale oF= [(6-10) + (BAOF + (10-10P + (12-10} + (14-10) V5 = 8. La varienea ‘muestra para, por ejemrto, la muesira 6,12) es: = (6-9) + [(12.97/2= 9, donde para celouarl utizamos la media muestral (6+12V2 = 9. La varenza ‘muestra mide ia varedad de os datos de la muestia respectoa su media De ‘nuovo, el eetimador depende de la muestra que hayemos seleccionado por azar En la tabla herros calculado Ia varianza mueetral pera todas las mca tras posibies, coms hicimos con las medias muestrales en la taba anterior y 2 su drecha representamos su distibucion de probabiidad Varlanzas muostalos | Sogundo elemento de la musataa eTelolals Primer elemento | 6 | 0 | 1 | «4 | 9 | Gelamuesta [a [1 | 0 | 1] 4] 4 wfs+[apoti ts wfet+yi pols “fetes t«tato ‘pe nuevo, como conocemos la distibucion del estmader podemos cal cunt au esperanza, 1é media de las vafenzas muestles, La sua doe ar ementce do nuestra tabla dWidida entre 25d 4 cra do gue ‘eesba conta meds MCSA, ore no cine con vaca pelocanl resend, que recordeos es 6. En este caso ol estmator 9 seogado, Eso viiica que si intontamos ectimar la varanza potleconal con la vans saearal comatoremos Un aor satemdsco. Puede eneglrsa? Podemos «retocar» el estimador, Utlicomos la «cvasiarsnzes mues- tol 2, dafinida exactamente igual que la vatianza pero dividierdo 90 por et lemefio de fa muestra, sino por el tamato menos uno, Por eam, para la srucstra (6.12) 8s: si= [(6-9F + [12-9¥/(2-1) = 16. El later punde compro- far que con esta modiicacion, af nuevo esimadar es insesgedo: a espe- fanza de la media de la cuasivarianca coincide con la meds de la varionza poblacional. Este retoque en el estimador parece hecko ad hoo, pero en reaidad cxistentScnicas mateméticas (como el métado de fs momentos 0 8 método de maxima verosimulitud, por Citar dos senclos) que nos parmten conetuk tslmadores, Un buen estimador debe tener cletas propiaades deseabion, como la fata de sesgo que hemos visto o que au varanza(recerdemos que 4m estimedor siempre tiene aociada una dtribucion) sea la menes posible coma ccurre con el «Problema de os tanques aermaness. aientos y/o migraciones, Tal y como lo hemos formulado en nuestro ‘lemplo, son necesarias varias condiciones para quela estimaci6n sea valida. En primer lugar, ebviamente el nimerode peces N debe perma heer constante entre capturas, un detalle nada trivial con seres Vives We se reproducen, mueren y se desplazan. Pero si él Jugar de mues- Teo es relativamente estanco y la capturay recaptura s° ee "tiempo relativamente corto, podemos conceder que le poblatén "no habra variado mucho, La cuestin de que tempo de caphire: "eaptura sea eorto entza en conflict com la segunda supsicige NE ‘sara: que las capturas, es decir, las muestras de la pobic, nee ‘We ser completamente aleatorias. Necesitamos que los Pecos 104 Lasleye delazer Se tribuyan homogéneamente por el pantano. Asf que esta aleatori, es en ocasiones dificil de conseguir o puede quedar distorsiona Fazones no imaginadas o esperadas en nuestro muestreo, Elmétodo de captura-recaptura se emplea también en poblaciones ‘humanas. Uno de los pioneros de este método fue Laplace, quien lout. liz6 para estimar la poblacién de Francia a principios del siglo xix Ey epidemiotogia, por ejemplo, la captura-recapturaes también un método muy utilizado para elaborar censos de distintas enfermedades. Pero en el caso de humanos, ,cémo se realizan las «capturas»? Basta cualquier listado de una muestra de los individuos que se quieren «contar», siem- Pre que la muestra sea suficientemente aleatoria. Por ejemplo, Antonia Domingo-Salvany y su grupo de la Universidad Auténoma de Barcelona hhan estimado el numero de heroinémanos en Barcelona utilizando estos métodos. Las tres «capturas» que se realizaron en este caso consistieron en las listas de ingresos en urgencias, solicitud de tratamiento de desin- toxicacién y muerte por sobredosis, respectivamente. Segiin aparecie- Fao no en cada una de estas tres listas, los investigadores asociaron a cada individuo una historia tal y como hemoshecho en nuestro anterior ejemplo, Con estos datos, obtuvieron finalmente la poblacién total de toxicémanos, estuvieran 0 no registrados en alguna de las tres listas, ledad ida por El problema de los tanques alemanes Durante la Segunda Guerra Mundial las matematicas jugaron un pa Pel decisivo, Quizds el caso mas Sonado, debido a su popularizacioa en novelas y cine, sea la participacién de Alan Turing en el centro de criptografia britanico de Bletchley Park para descifrar los cOdigos ‘secretos nazis de las maquinas Enigma. Muchos expertos considera? que gracias a ello la guerra se acorté dos afios, Una historia menos conocida, fuera de los circulos estadisticos, & que los Aliados usaron una sencilla formula para estimar la producclo" (Censos encuestas ystimaciones on el amento aleman, en particular la de sus temidos tanques. La esti- aes etaastica uncion6 muchomejor que las fuentes de inteligencia ac ates, cuya informacion se basaba en el recuento de tanques ET de batalla y el espionaje de factorias de produccién. Enla ta- asic gamsostres valores reales de produccia mensualylas estima: aa ary puestas porlosestadisticsy porlosservidosde nteligenda. eee Jos servicios de inteligencia estimaron que los alemanes Mewan un promedio de alrededor de 1400 tanques por mes desde frie de 1940 septiembre de 1947; la estimacin extadisticaarroiSun pimero medio mensval considerablemente menor: 246, Poco después delaguerra, se tuvo acceso al valor exacto, que resulo se. ;245t Estimaci6n | Servicio de | Vator reat) Tabla 1. Estimaciones ‘sstadistica_| Inteligencia el prodoccion mex ai 1880 | 189 7000 az sual devangues pare no ge 1981 [204 "380 a tos meses entre 1940 1350 me y 1942, obtenas por sto de 1942 | 327 " 1 pr las agencas de fe: shn nical Appreach to Econom imligencen Wor | Neiencte briknica Wes Ree y HBr Journal ofthe America Seti Ar PEAT meetin 4272-91 (1947), auras conocidos después de lagiera. Laestimacién estadistica fue crucial porque proportions ae "maorables sobre donde podria producirse un ataque ya Pouble 1 “ensidad del mismo. gCémo consiguieron semejante estimacio” Sot Astica los Aliados? 1 coronel estadounidense Trevor ae suces0: Tuy bien el secreto, y todavia en 1991 contaba el sigu ‘iso de las au tite pocos aos, en Oriente Mei, cbRve 6 PET A ‘ridades militares israelfes para visitar la lin 6 cudntos Merkava pregunt ules Merkava, En un momento dado, sn era clasificada. tehabian producido y se me dijo que esa informaci6n era ie “Le eyes do asar ee ee ~ Me pareci6 divertido, porque habia un numero de serie en el chan, de cada tanque>, En efecto, los Allados estimaron el niimero de big, ddados alemanes a partir de los nimeros de serie de los tanques nary capturados o destruidos. Pero geémo se estima el niimero total de tanques a partir de ung pequeiia muestra de nimeros de serie? De nuevo, Pere Grima" nog propone el siguiente experimento de corte menos belicista para e. Plicarlo. En una ciudad como Barcelona, los taxis estén numerados correlativamente por licencias desde 1 hasta N (como ocurria con los mimeros de serie de los tanques alemanes). El nimero de licen- cia de un taxi est pintado en la puerta del vehiculo y puede leerse a distancia con facilidad. Supongamos que queremos estimar el ni- mero total N de taxis, a partir de una muestra de n licencias tomadas enla calle al azar, En lenguaje estadistico esto se traduce como que- rer estimar el tamafio de una «poblaciOn» a partir de una «muestra aleatoria sin reposicién». Para tomar valores numéricos concretos, supongamos que N es 41 y que el tamafio de la muestra nes de S licencias, que ordenadas de menor a mayor son: 8, 14, 22, 27 y 35. Si conociéramos la licencia m que ocupa la posicibn media exacta en la poblacién (supuesto que N es impar), entonces el niimero total de taxis seria: N = (m—1)+1+(m 12) = 2m - 1, porque hay m-1 licencias por debajo de la m ym ~ 1 por encima, En nuestro ejemple con una poblacién de W = 41, m es exactamente 21 y, efectivaments, N=2Z x21 ~1=41. En nuestro experimento real con taxis no cone” cemos™m, pero parece razonable aproximarlo a través del estadistice mediana muestral X, el dato de la muestra ordenada que deja (@"" tas observaciones a su izquierda comoa su derecha. En nuestro c35° es ¥=22, valor que est’ por encima de 8 y 14, y por debajo de 27Y 35. A partir de este valor podemos construir un estimador punta eT % Lacertera solu otosfeclones: Los secrets del estadiic, Pere Grima. RBA caKeote ‘mundo es materniico> (2010), Gonsos, encuestayextimaciones m Sa §,-24-I, que para nuestra muestra particular arroja una pobla- ion de N= 2x 22-143. otra opcién es tomar Ja media muestra! ¥ en vez de la media- 1a, Bn nuestro ejemplo la media muestra, la suma de los datos de la muestra dividida entre el tamafion de la muestra, es: y su estimador asociado serfa: N,=2X-1, que sugiere una pobla- déndeN, =2x21,2-1=41,4, Ambos estadisticos parecen razonables aprimera vista, pero puede el lector encontrarles una sencilla pega que los invalide? Supongamos que los datos observados hubieran sido: 2, 10, 15, 25 y 40, La mediana y la media muestral serfan 15 y 18,4, respectivamente, y las estimaciones correspondientes serian: N=2x15-1=29 y WV, =2x184..,1=358. jNuestras estimaciones esta- fan por debajo de 40, uno de los datos de la muestra! Una flagrante contradiccién. iAlternativas? Denotemos los datos de la muestra ordenados de menor a mayor valor como: X,, X,-.- X, Por simetria podemos supo- er que la cantidad de taxis con numero de identificacién por encima de X,, el valor més alto de nuestra muestra, es igual al nimero por debajo de X, ,el valor més bajo. De modo que podemos aventurar que N~X, = X,—1. Esto nos lleva aun tercer estimador: N, = X, + X,—1 ‘ue para nuestro ejemplo nos proporciona: 35 + 8 - 1 = 42 (véase la figura 14, en la pag 108). Podemos sofisticar el argumento anterior: {For qué tomar sola- Mente el valor mAs bajo como referencia? Parece mas razonable es- timar la cantidad de taxis por encima del valor maximo observado X,como el promedio de las distancias entre observaciones (véase la “laura 15, en la pag, 109). Ast, D z0r 100 Lasleyes dela an aannean ae —“— Sad sle00000000000000000000000000 FIG. 14.Los cinco valores dela muestra: 8,14, 22, 27 y 35 estén ordenadosy sea dos como puntos oscuros en lagréfica Puesto que 8 es nuestra valor mis belo y hy valores por deta, poderosestimar, por simetra la poblacdn total Nsumango ry valor mds alto de nuestra muestra, As|N = 35-7 = 42 (adaptado de «La ceneza aber uta y otras ficdones», Pere Grima, 2010). e (4 =1)+(4,- 4%) -1) ++ N-X,= De donde obtenemos un cuarto estimador: N= X,+2*-I,¢ maximo de la muestra més el hueco medio en la muestra. Que para znuestras observaciones nos proporciona: Observemos que ahora ninguno de estos dos estimadores puede caer en la contradiccién de proporcionarnos una estimacién meno que un dato dela muestra. Como N= X, + X,—1, el minimo valor qi Puede tomar el estimador es 1, « X,, en el caso de que X,=!.Y pat? N.=—-X,~1,el minimo valor que puede tomar el estimador es¢! valor mas bajo que puede tener X,,que es ny nos proporcion? Nn tttn lene X, Los estadisticos pueden demostrar (véase el recuadro «Amb™> estimadores parecen razonables, ycon cul nos quedamos?, &” Pag. 110) que este tltimo, justamente el empleado por los Aiat? Para estimar los tanques alemanes a partir de los niimeros aeS*** Fecopilados, es el més adecuado. no. 15.Pedemos estar la canta de taxis por encima el valor mdse 35, como ‘Tovemedio dels istancla entre los valores ordenados de amuestra(Adapado de saeerteza absolute y otras ficcones», Pere Grima, 2010), Por todo lo que hemos visto, estimar el tamafio de una poblacion sumerada a partir de una muestra sin reemplazo es conocido en el mundo anglosajén como el problema de los tanques alemanes. Duran- te la Segunda Guerra Mundial se realizaron estimaciones similares, ~ atilizando los mimeros de serie, con otros pertrechos militares, en particular con los temidos cohetes V-2. El problema, en realidad, sue- le ser mas complicado. Puede ocurrir, por ejemplo, que el minimo valor no sea 1, sino desconocido. O que los elementos de la pobla- cién no tengan la misma probabilidad de ser escogidos en la muestra, como probablemente ocurrié con los tanques, cuya probabilidad de set observados aumentaba con el tiempo en batalla. Pero a idea de fondo para estimar estadisticamente alguna magnitud es la misma, Hoy, por ejemplo, las compafifas usan este método para estimar la Produccién y capacidad de sus competidores. Por ejemplo, los ana listas recolectaron nimeros de serie en foros de internety estimaron {mn alrededor de 9,1 millones el nimerd de iPhones vendidos desde U lanzamiento hasta finales de septiembre de 2008. Por cierto, la tstimacién del ndmero de taxis en Barcelona que hizo Pere Grima a Partir de 20 licencias tomadas al azar fue de 10 989. El valor real en quel momento, consultado en internet, era de 10 481. : i + i Las leyes del azar Ambos estimadores parecen razonables, econ cus) nos quedamos? En nuestro razonamiento para conseguir un buen estimador dt rime taxis hemos legado fnelmente a dos candidatos: mote Bye XeK-1yN Podemos comparartos a través de simulaciones numéiicas. Para elo, 1708 valores N yn, y realizamos el siguiente experimento: ae ‘Tomamos una muestra alestoria sin repeticin de n datos dela poblacién 'N-Esimamos la potlacion @ raves de las formulas de los dos estimadbores, caleuiamos ol ertor que comete cada uno. “ Repetimos muchas veces el experimento y obtenomos esi cisuibucones de probabllidad para 0, y W,. em ‘Apart de elias computarmos sus valores medios (y errores i rores medio) ‘sus varianzas, para determiner la precisi6n de las estimaciones. y etn stad que muse un enor medio yur varanza mia pe. Puede demostrarsa ficiimente que el valor medio de N, y felor medio de fi, y /, cohcide on WV: 68 decir, que sus erores medios son coro: ambos estimadores £oa insesgados. Asi que tencremos que recur a las varlanzas para dessmoatar ae vrezas de les entrar también pueden caearse exacts vai = 2 (Mom)lv ml m2 vanity (=A) "ned (observerros que coinciden para n = 1 y se hacen 0 para n= N). De modo we Veh )a vat. Ape aleacenr ee omen 29 61 quo gana ia competion, Cones ence excines intervalos de confianza supngames av eemos (pmo de eso see pula en np riéaico nacional) que «el consumo de marihuana en nuestro pais ha aumentado en un 0,7%>. :Tiene algin sentido esta frase por si mis- mma? Para que la informaci6n estadistica estuviera completa, deberia aparecer el tamafio de la encuesta y de la poblacién, el margen de error y @1 intervalo de confianza, al menos. Si consultamos el infor- me estadistico de donde el periodista ha sacado el dato, vemos que el margen de error de la estimacién es de un 1%. ,Qué significa? que si bien nuestra estimacién puntual es de 0,7%; en realidad esta- mos diciendo que es un valor comprendido entre -0,3% y 1,7%. {St yolviéramos a realizar el estudio, obtendrfamos la misma estimactén™ puntual? La nocién de intervalo de confianza nos ayuda a responder aesta pregunta, En el informe sobre consumo de marihuana leemos que vale 95%. Eso significa que, si realiz4ramos muchas encuestas en las mismas condiciones, el 95% de las veces obtendriamos una estimacién puntual dentro del intervalo de confianza. As{ que, en realidad, el consumo ha podido tanto crecer como decrecer. 0, dicho de otra manera, si volviéramos a realizar la estad{stica podrfamos encontrar perfectamente que el consumo ha disminuide, por ejem- plo, en un 0,2%. Lo correcto habria sido que la noticia dijera que el consumo de marihuana se mantiene estable. Pero eso no es noticia. No hemos hecho mencién al tamajio de la muestra y de la pobla- cin. $i nuestra poblacién es de un tamafio fijo y deseamos alcan- Zar un determinado margen de error, habré un tamaio de muestra la poblacién fuera 10 veces mayor, para conseguir el mismo margen de error no necesitarfamos una muestra ni mucho menos. 8) tamafio de la muestra ie lapoblacion para mantener el | tamafio de la Minimo que lo consiga. Si también 10 veces mayor, rece mucho mas lentamente que el ™margen de error. De hecho, hay un momento en que ¢ Larieer dear uz ai _ nam nuestra apenas varia por muy grande que sea la poblaciéa, Es ap, contraintuitivo, pero que exploraremes matemsticamente ensepy, da, La analogia no numérica mas empleada es la de la cuchara guy utilizamos para probar si una sopa est salada. Sila cuchara nos per mite probar suficiente sopa como para que el paladar detecte Jaca) no importa lo grande que sea el puchero. No empleamos cucharas més grandes cuando los pucheros son mayores. Lo importante esque la sal esté bien disuelta en el puchero, para que la muestra que recoja Ja cuchara sea representativa, Cuando hacemos una estimacién por intervalos de confianza, ala estimacién puntual que hemos hecho hasta el momento (como el ni- mero de peces en el estanque o el de taxis en la ciudad) debemos afiadir un margen de error. En lugar de indicar simplemente un nico valor como estimacién de! parametro poblacional que deseamos es- timar, lo que hacemos es ofrecer un intervalo en el que se tiene cier- ta probabilidad o confianza de que se encuentre el valor real. ;Cuén grande debe ser el intervalo de confianza? Evidentemente, si dec- mos que el intervalo de confianza va de menos infinito a masinfinito, seguro que acertamos. Pero eso no resulta muy itil. El caso extremo contrario es la estimacién puntual, donde la amplitud del intervalo es nula. La idea es crear unos intervalos de confianza que contengan el parémetro poblacional a estimar en un porcentaje de casos, en los que tomdramos muestras en idénticas condiciones. Es decir, dar una medida de la bondad de la estimacién, de la probabilidad de que e valor real del pardmetro estimado se encuentre dentro del inter" Jo. A esa probabilidad se la denomina conflanza y se suele denotar como 1 - a. Cémo fijamos tal probabilidad? Por cuestiones pre-in- formaticas (hasta hace cuatro dfas se usaban tablas tabuladas par? estos menesteres) normalmente se toman porcentajes del 95%, 99% 0 99,5%. Tienen hasta nombre: confianza casi significativa, confianz# significativa y confianza muy significativa, respectivamente. A su Ve aati jenomina nivel de slgnifcacon aa, que esa prebabldad de que se vametro 0 estima esté fuera de nuestro intervalo de confianza. et ios valores de confianca anteriores, lo ivles de sigifcac6n Peta: 5M, 196 Y 0.5% Tespectivamente s p- 200 u w+ 20a intervalos de conflanza? Supongamos, Itura media de una poblacién. Sabe- ici6n normal, con cierta media 4Cbmo se determinan los i que queremos determinar Ia al mos que la altura sigue una distribu ee uy cierta desviacién tipica 0, que para simplicar eee 46 Tenemos una muestra simple sin pe eS de tamafio n; es decir, disponemos de n alturas er abe la poblacién. Utilizaremos como estimador pare triage eel nal la media muestral ¥. Como vimos en él ca aa central del i{mite nos asegura que la media oe ea dias muestrales p(x) coincide con la media i oe ‘que nuestro operador es insesgado);ytambienals ne media muestral ¥ es a7. 0 Jo que es 10 dor ane ®8 a / VN . Sabemos entonces que nuesit0 * “ agar desl pte doer del mes pondremos conocidas.’ Yo nermal es desconaceriay usar en ‘Won que puade jestincarse tedricamente. lees del azar m4 Las ley MO ‘como una normal de media wy desviacién tipica 0 /V/N y ey de aqu{ que podemos determinar el intervalo de confianza, ‘Supongamos que deseamos tener una confianza casi si; es decir, que 1 - a = 95%, Para una distribucién gaussiana, la prong, bilidad de que un valor aleatorio esté alrededor de la media con wy margen de error de +20 es justamente el 95%, Por tanto, en Auestry caso el intervalo de confianza serd entonces: (r~2/Vn, F+2Mny ‘como se muestra en Ja imagen. Observemos que, debido a la raiz de n, a medida que aumenta el tamaio de la muestra la amplitud del intervalo disminuye, As, Para l -a= 95%, tendrfamos que para una media muestral =~ 10, varianza poblacional a = 4y tamafio muestral n =12, el intervalo de Confianza seria (8.87<<11,13). (Si cambiamos el tamaito muestral 20, el intervalo disminuye pasandoa ser. (9,12 1/2; es decir, que acierta con maa pata 's esperada por pura casualidad. Observemas ave ® Me quivalentea lanzar una monedaal aire 10 veces: a : aos ‘La hipétesis nula es que la moneda no est truc 120 (as yesde azar que la moneda esté sesgedaa favor de las caras Enel caso dela, 4e té, parece razonable rechazar la hipétests nula, Por qui La Probe, bilidad de que lareinaacertara por chiripa era (1/2)""= 1/1074" frente 2 1023/1024 de no acertar y, sin embargo, la reina acerts, Vamos a. cémo se sustenta esta intuicién mediante un contraste de hipstests, \o primero que necesitamas es un estadlstco de pruehe, queen nuestro caso seré el niimero de aclertos de la rena. Vlo sepundo saber cémo se distribuye este estadistico. Puesto que estamos frente 4 un experimento con una probabilidad p de éxito y 1 ~p de face $0, egin explicamos en el capitulo 2, la probabilidad del nimero ge aclertos de la reina se distribuiré como una binomial de p = 1/2 y N10; es decir: 1) (AYA a0) pry" ate (¥) (2)(3) = (®) (4) ta reina acerté,=10 , y la probabilidad de ese suceso, efectiva: mente, es 1/1024. Dividiremos la posible cantidad de aciertos de la reina, de 0 a 10, en dos regiones: la regién de aceptacién, donde se Producen y= 7 aciertos 0 menos, y la regién critica 0 de rechazo, donde se producen més de 7 aciertos. De modo que si la reina acier- {a m2 7 aceptaremos la hipotesis nula y si n> 7 1a rechazaremos a favor de la hipétesis alternativa. Observemos que el nimero critico 1, = 7 ha sido escogido por sentido comin, pero arbitrarlamente. Ve- remos més adelante cémo se soslaya esta arbltrariedad, aunque et Tealidad sélo de manera aparente, ‘Si aceptamos la hipétesis nula y realmente es correcta, o silat chazamos y la correcta es la hipétesis alternativa, estaremos hacien- do las cosas bien. Pero, obviamente, podemos cometer también dos errores: rechazar la hipétesis nula, cuando realmente la acierta £12 cias a un golpe de suerte; 0 concluir que ha sida por chiripa, cuando enrealidad la reina tiene un paladar prodigioso. Al primero, rechazat Delos datora tides resis nula cuando es cierta, see lama error de tipo Alsegune yhip6 tar a hipOtesis nula, cuando realmente a reina tiene un pala- ae acer natural, se 10 conoce como error de tpo I 1a probahihded tat ee ‘un error de tipo I sedenomina nivel de significacién aie Saal que introdujimosen el capitulo anterior: En nuestro ejemplo: c= Plerror de tipo) = P(Rechazar H,|H, 8 cesta} @ rer T0=112" § (") (1/2)" ~0055 icos di i ula, p= 1/2, seesté pro- La le nen 0 oo por tanto es poco probable que comes tamos un error de tipo |. En nuestro ejemplo hemos fete = aie de significacion esate reer a rer " G tt * habitual es determinar i win de aceptacion de la regién de rechazo de aoe fijando previamente el nivel de significacién ons eae habriamos definido un nivel de significaci6n previo ou través de él habriamos encontrado el valor critica x) ee el namero de aciertos de la reina fue »=10> he cluir que rechazamos to hipdtesis aula. ce aimee tvidencia de que p > 1/2, Fero observemo® cee 0 hea tamente que la reina disponga de un palacar Teroéle haya soplao Podrfa ocurrir que el mayordomo que me wus nares 27% Conscienteo inconscientemente el resulta? et arg terrestres dominan su mente y poseen la tec Aiscernir estos detalles del el acter ive 0b: a jar esia pro 2 de decision, aideeaeer estamos estableciendo et 1a hipétesis terminando previamente qué probabil pando entonces con un ni ‘aso, este valor es pequefo,

You might also like