Download as pdf or txt
Download as pdf or txt
You are on page 1of 42

Tema 4. La reconstrucció filogenètica.

4.1. L'homologia com guia per a reconèixer les


relacions filogenètiques.
4.2. Tipus de caràcters i estats del caràcter.
4.3. La perspectiva filogenètica de la biologia.
4.4. Què és un arbre filogenètic?
4.5. Inferència i interpretació d'arbres filogenètics .
4.6. Mètodes bàsics de reconstrucció
filogenètica.
4.7. Filogènies moleculars.
4.8. Dificultats i aplicacions de la reconstrucció
filogenètica.
Tema 4. La reconstrucció filogenètica.
01. Presentació tema 4 primera part.
02. Presentació tema 4 segona part.
03. Presentació tema 4 tercera part.
04. Presentació tema 4 quarta part.
05. tema04 La reconstrucción filogenética FGC
06. tema04 Reconstrucción árboles evolutivos
ANAL EVOL Freeman
07. Chapter 27_Phylogenetic reconstruction.
Evolution BARTON
08. How to read a phylogenetic tree.
McLennan2010
09. Reconstrucción árboles filogenéticos VARGAS
Y ZARDOYA
4.6. Mètodes bàsics de reconstrucció filogenètica.
Com s’obté un arbre evolutiu?
En principi la cosa sembla simple, els tàxons més relacionats, que fa menys
que van divergir d'un ancestre comú, hauran de compartir un major nombre
de caràcters (morfològics i moleculars)

Caràcter: variable independent els possibles valors de la qual són els estats mútuament
excloents del caràcter. Poden ser morfològics (presència o absència d'una estructura,
color dels pètals, etc.) o moleculars (seqüències de DNA, de proteïnes, etc.)
Matriu de dades: assigna un estat del caràcter a cada tàxon

Caràcter 1 2 3 4 5 6 7 8 Posició 123456789


Tàxon 1 1 0 1 0 1 1 1 1 Tàxon 1 AAGAGTGCA
Tàxón 2 0 1 1 0 1 0 0 1 Tàxon 2 AGCCGTGCG
Tàxon 3 1 0 1 0 1 1 0 0 Tàxon 3 AGATATCCA
Tàxon 4 1 1 1 1 0 0 0 0 Tàxon 4 AGAGATCCG

Lluís Pascual, 2016 04-59


4.6. Mètodes bàsics de reconstrucció filogenètica.
A partir de les matrius de dades podem quantificar la semblança o les diferències
(distància) entre tàxons i reconstruir l'arbre filogenètic. I a partir de l'arbre
filogenètic es pot proposar la classificació dels organismes. Això és el que van
proposar Sneath i Sokal: l'anomenada escola fenética o Taxonomia numèrica.

Exemple: seqüències de la proteïna citocrom c

Humà GAVGKGKKIFIMKCSQCHTVGKGGKHKTGPNLHGLFGRKTQGAPGYSYTAAN
Macaco GAVGKGKKIFIMKCSQCHTVGKGGKHKTGPNLHGLFGRKTQGAPGYSYTAAN
Cavall GAVGKGKKIFVQKCAQCHTVGKGGKHKTGPNLHGLFGRKTQGAPGFTYTDAN

Humà KNKGISWGEDTLMGYLENPKKIPGTKMIFVGIKKKEERADLIAYLKKATNE
Macaco KNKGITWGEDTLMGYLENPKKIPGTKMIFVGIKKKEERADLIAYLKKATNE
Cavall KNKGITWKEETLMGYLENPKKIPGTKMIFAGIKKKTERGDLIAYLKKATNE

Distàncies aminoacídiques: Espècie Humà Macaco Cavall


Humà 0 1 12
Macaco 1 0 11
Cavall 12 11 0

Lluís Pascual, 2016 04-60


4.6. Mètodes bàsics de reconstrucció filogenètica.

Exemple: distàncies a partir de les seqüències de la proteïna citocrom c


Espècie Humà Macaco Cavall
Humà 0 1 12
Macaco 1 0 11
Cavall 12 11 0

1 Humà Humà Cavall


1 11
Macaco Cavall
0 Macaco
11 0
11
0 1
Cavall Macaco Humà

A B C
L'arbre que concorda amb una menor distància (més semblant) entre
espècies que fa menys temps que han divergit és l'A, que a més concorda
amb les dades del registre fòssil.
Lluís Pascual, 2016 04-61
4.6. Mètodes bàsics de reconstrucció filogenètica.

No obstant això, de vegades la


cosa es complica, ja que els
caràcters ens poden “enganyar''
Recordem que segons Willi
Hennig la similitud o semblança
entre caràcters pot ser deguda a
tres causes:
1) Descendència a partir d'un ancestre comú recent: Homologia derivada
compartida (o sinapomorfía).
2) Descendència a partir d'un ancestre comú llunyà: Homologia ancestral
compartida (o simplesiomorfía).
3) Convergència evolutiva: Analogia (o homoplàsia).

D'elles, l'única similitud que ens dóna informació correcta del procés
cladogenètic i, per tant, de les relacions filogenètiques és l’Homologia derivada
compartida o sinapomorfía.
Lluís Pascual, 2016 04-62
4.6. Mètodes bàsics de reconstrucció filogenètica.

Com detectar cada tipus de similitud?


L'escola cladista o de la sistemàtica filogenètica va proposar dos
procediments:
1) Per diferenciar les homologies de les homoplàsies: el criteri
de màxima parsimònia.
2) Per diferenciar les homologies ancestrals de les derivades:
determinar per a cada caràcter l'estat ancestral i el derivat.
Això s'aconsegueix comparant els caràcters amb els del
registre fòssil, veient que ocorre amb el caràcter durant el
desenvolupament embrionari (ontogènia), o bé comparant els
caràcters amb els d'espècies de referència externa
(outgroups).

Lluís Pascual, 2016 04-63


4.6. Mètodes bàsics de reconstrucció filogenètica.
En canvi, la fenètica o taxonomia numèrica proposa
utilitzar totes les similituds per obtenir aproximacions
filogenètiques que permeten obtindre una classificació
dels éssers vius objectiva i repetible.

Per tal motiu, van proposar:


Considerar quants més caràcters millor (>100)
Donar la mateixa importància a tots els caràcters
Obtenir una mesura quantitativa de la similitud
(coeficients) o de la diferència (dissimilitud i distància)
entre individus, espècies o tàxons (OTUs, unitats
taxonòmiques operatives) basada en tots els caràcters.
Utilitzar procediments matemàtics i estadístics per
l’anàlisi de les similituds entre OTUs (procediments
d’agrupament).
Lluís Pascual, 2016 04-64
4.6. Mètodes bàsics de reconstrucció filogenètica.
Algorismes per la reconstrucció
d’arbres filogenètics
• Mesura de distàncies. Trobar l'arbre filogenètic que siga
consistent amb les dades de distància evolutiva entre les
seqüències.

• Màxima parsimònia. Trobar l'arbre filogenètic en què es necessita


el menor nombre de "passos" per generar les seqüències.

• Màxima probabilitat. De totes les possibles combinacions d'arbres


filogenètics per a un grup de seqüències trobar aquell amb la major
probabilitat tenint en compte la factibilitat dels esdeveniments
evolutius necessaris per produir l'arbre.

• Bayesià: S'utilitza el teorema de Bayes per calcular l'arbre amb la


major probabilitat, utilitzant una estratègia de mostreig de les
probabilitats a priori.

Algorisme:
Conjunt de regles per a resoldre un problema en un nombre finit de passos.

Lluís Pascual, 2016 04-65


4.6. Mètodes bàsics de reconstrucció filogenètica.
• Podem classificar els mètodes de reconstrucció
filogenètica en base al tipus de dades que utilitzen
(caràcters discrets vs. distàncies) i si fan servir un
mètode algorítmic o un mètode de recerca basat en
un criteri d'optimització per trobar la topologia òptima
sota el criteri seleccionat
Tipo de datos
Distancias caracteres discretos
agrupamiento

UPGMA
algoritmo de
Método de reconstrucción

Neighbor X
joining

Máxima
optimización
Criterio de

Evolución parsimonia
mínima Máxima
verosimilitud

Lluís Pascual, 2016 04-66


4.6. Mètodes bàsics de reconstrucció filogenètica.
Mètodes basats en caràcters
Els mètodes filogenètics basats en caràcters infereixen la filogènia a
partir de la comparació de les característiques dels organismes
analitzats, basant-se en les següents premisses:
1) Els canvis heretables (morfologia, seqüències, etc.) produeixen
canvis en les propietats dels organismes (diferents estats del
caràcter).
2) Els canvis ocorreguts en els caràcters al llarg de l'evolució es
poden deduir de les similituds i diferències entre organismes, el
que proporciona la base de la inferència filogenètica.
3) La utilitat dels canvis d'estat depèn que siguen realment deguts a
similitud per descendència (homologia) i que no es tracte de
similitud deguda a canvi evolutiu convergent o reversible
(homoplàsia).
La diferenciació entre homoplàsia i homologia és el problema
principal de tota inferència filogenètica basada en caràcters que els
diferents mètodes tracten de resoldre. Lluís Pascual, 2016 04-67
4.6. Mètodes bàsics de reconstrucció filogenètica.

Els mètodes filogenètics basats en caràcters utilitzen directament


la matriu de dades (N x M, on N són els organismes, espècies,
tàxons, gens, etc. i M els caràcters).
Aquests mètodes tracten de buscar la combinació d'estats dels
caràcters dels nodes interns d'un arbre que millor expliquen els
estats dels caràcters presents en els nodes externs (observats en els
organismes, espècies, tàxons sota anàlisis), minimitzant la
homoplàsia.
S'ha proposat diferents mètodes basats en l'anàlisi dels canvis
d'estat dels caràcters.
Tots ells són mètodes d'optimització que requereixen analitzar
tots els arbres possibles per a determinar el millor (òptim) que
compleix un criteri d'optimització.
Lluís Pascual, 2016 04-68
4.6. Mètodes bàsics de reconstrucció filogenètica.

Mètode de màxima parsimònia:


- Utilitza el criteri de màxima parsimònia: l'arbre òptim és el que
requereix un menor nombre de canvis d'estat per a un conjunt de
caràcters.
- L'arbre que requereix un menor nombre de canvis és el que
requereix el major nombre de canvis homòlegs i el menor de
canvis homoplàsics per a explicar l'evolució dels caràcters, ja que
el canvi homòleg ocorre una sola vegada en l'evolució però
l‘homoplàsic, més d'una vegada.
- El principi de parsimònia es relaciona amb el postulat del filòsof
medieval Guillem d’Ockham (conegut com ‘navalla d’Ockham’): la
millor hipòtesi és la més simple.

Lluís Pascual, 2016 04-69


4.6. Mètodes bàsics de reconstrucció filogenètica.
Els mètodes de parsimònia s’apliquen per igual a qualsevol tipus de
caràcters, encara que la naturalesa dels caràcters i els mecanismes de
mutació que expliquen la transició d’estats dels caràcters poden diferir.
Veiem un exemple:
3 hipòtesis alternatives 1 Gat 2 Gos
per a les relacions entre
4 mamífers:

3 Rata 4 Ratolí
1 Gat 3 Rata Arbre 1 Gat 2 Gos
((1,3),(2,4))

2 Gos 4 Ratolí 4 Ratolí 3 Rata


Arbre Arbre
((1,2),(3,4)) ((1,4),(2,3))
Lluís Pascual, 2016 04-70
4.6. Mètodes bàsics de reconstrucció filogenètica.
Matriu de caràcters:
PARSIMÒNIA
1 Gat ACCCCTTC
2 Gos ACCCCATA
3 Rata ACTGCTTC
4 Ratolí ACTGCTAA
Tres possibles arbres:
(1,2),(3,4)
(1,3),(2,4)
(1,4),(2,3)

1 3 1 2 1 2

2 4 3 4 4 3

Lluís Pascual, 2016 04-71


4.6. Mètodes bàsics de reconstrucció filogenètica.
1 Gat ACCCCTTC
PARSIMÒNIA
2 Gos ACCCCATA
3 Rata ACTGCTTC
4 Ratolí ACTGCTAA
(1,2),(3,4) 0
(1,3),(2,4) 0
(1,4),(2,3) 0

1A 3A 1A 2A 1A 2A

2A 4A 3A 4A 4A 3A

Lluís Pascual, 2016 04-72


4.6. Mètodes bàsics de reconstrucció filogenètica.
1 Gat ACCCCTTC
PARSIMÒNIA
2 Gos ACCCCATA
3 Rata ACTGCTTC
4 Ratolí ACTGCTAA
(1,2),(3,4) 001
(1,3),(2,4) 002
(1,4),(2,3) 002

1C 3T 1C 2C 1C 2C

C T

2C 4T 3T 4T 4T 3T

Lluís Pascual, 2016 04-73


4.6. Mètodes bàsics de reconstrucció filogenètica.
1 Gat ACCCCTTC
PARSIMÒNIA
2 Gos ACCCCATA
3 Rata ACTGCTTC
4 Ratolí ACTGCTAA
(1,2),(3,4) 0011
(1,3),(2,4) 0022
(1,4),(2,3) 0022

1C 3G 1C 2C 1C 2C

C G

2C 4G 3G 4G 4G 3G

Lluís Pascual, 2016 04-74


4.6. Mètodes bàsics de reconstrucció filogenètica.
1 Gat ACCCCTTC
PARSIMÒNIA
2 Gos ACCCCATA
3 Rata ACTGCTTC
4 Ratolí ACTGCTAA
(1,2),(3,4) 001101
(1,3),(2,4) 002201
(1,4),(2,3) 002201

1T 3T 1T 2A 1T 2A

2A 4T 3T 4T 4T 3T

Lluís Pascual, 2016 04-75


4.6. Mètodes bàsics de reconstrucció filogenètica.
1 Gat ACCCCTTC
PARSIMÒNIA
2 Gos ACCCCATA
3 Rata ACTGCTTC
4 Ratolí ACTGCTAA
(1,2),(3,4) 0011011
(1,3),(2,4) 0022011
(1,4),(2,3) 0022011

1T 3T 1T 2T 1T 2T

2T 4A 3T 4A 4A 3T

Lluís Pascual, 2016 04-76


4.6. Mètodes bàsics de reconstrucció filogenètica.
1 Gat ACCCCTTC
PARSIMONIA
2 Gos ACCCCATA
3 Rata ACTGCTTC
4 Ratolí ACTGCTAA
(1,2),(3,4) 00110112 6
(1,3),(2,4) 00220111 7
(1,4),(2,3) 00220112 8

1C 3C 1C 2A 1C 2A

C A

2A 4A 3C 4A 4A 3C

Segons el criteri de màxima parsimònia el millor arbre


(òptim) és el (1,2),(3,4) perquè requereix menys canvis.
Lluís Pascual, 2016 04-77
4.6. Mètodes bàsics de reconstrucció filogenètica.
S1 ACCCCTTC PARSIMÒNIA
S2 ACCCCATA De l'exemple anterior es deduïx que:
S3 ACTGCTTC • Els caràcters constants s'han
S4 ACTGCTAA d'ignorar sempre ja que no
(1,2),(3,4) 00110112 6 impliquen cap canvi (cost 0) en
(1,3),(2,4) 00220111 7 qualsevol arbre.
(1,4),(2,3) 00220112 8 • Els caràcters no informatius
CCIICNNI s'ignoren per a determinar el millor
arbre, ja que impliquen el mateix
nombre de canvis en tots els arbres,
C = Caràcter constant però si que es considera el seu cost.
I = Caràcter informatiu
N = Caràcter NO informatiu

Només cal considerar els CARÀCTERS INFORMATIUS, aquells


en els quals almenys dos estats del caràcter apareixen dos o
més vegades.
Lluís Pascual, 2016 04-78
4.6. Mètodes bàsics de reconstrucció filogenètica.
SIMILITUD i DISTÀNCIES
Avantatges de la conversió de la matriu de caràcters en distàncies
Per a certs tipus de dades és l'únic mètode disponible.
Són mètodes ràpids amb algoritmes de computació simples, alguns
mètodes permeten obtenir filogènies d'un gran nombre de tàxons.
Inconvenients de la conversió de la matriu de caràcters en distàncies
 Es perd informació, ja que donades unes distàncies ajustades a una
filogènia no és possible determinar els canvis dels caràcters implicats.
 De les dades es pot determinar les distàncies però de les distàncies
no es deriven els canvis implicats.
 Únicament a través de l’anàlisi de caràcters podem identificar els
caràcters informatius amb els canvis diagnòstics (‘signatures?)
 No es pot realitzar una anàlisi simultània de diferents tipus de
caràcters que requereixin un tractament diferent al transformar-los en
distàncies. Per exemple, no podem considerar substitucions
nucleotídiques i ‘indels’ simultàneament en l’estima de distàncies 04-79
4.6. Mètodes bàsics de reconstrucció filogenètica.
DISTÀNCIES
- Com distància filogenètica entenem la quantitat de canvi evolutiu
ocorregut per a un conjunt de caràcters entre tàxons.
- En matemàtiques, la distància és la diferència de valors d'un conjunt
de variables que defineixen les coordenades de punts en un espai n-
dimensional.
- Les distàncies additives són aquelles que s'ajusten a un arbre, en
aquest cas les distàncies són la suma dels valors de les branques que
connecten dos nodes, aquest tipus de distàncies compleixen una sèrie
de propietats.
- Les distàncies no additives s'ajusten a altres representacions gràfiques
com una xarxa (network), però no a un arbre. Si s'ajusten a una xarxa,
les distàncies no additives seran la suma dels valors de les branques
que connecten dos nodes, però en aquest cas no compliran les
propietats de les distàncies additives.
- Un tipus de distàncies additives, que a més compleixen una sèrie de
propietats afegides, són les distàncies ultramètriques que s'ajusten a
un arbre ultramètric, en els quals la distàncies entre un node intern i els
nodes externs que connecta són iguals, es a dir, en el cas d’arbres
filogenètics es equivalent a assumir que el canvi evolutiu al llarg del
temps es constant. 04-80
Lluís Pascual, 2016
4.6. Mètodes bàsics de reconstrucció filogenètica.
Qualsevol distància additiva ha de cumplir les següents propietats:
No negativitat d(a,b) ≥ 0
Simetria d(a,b) = d(b,a)
Desigualdtat triangular d(a,c) ≤ d(a,b) + d(b,c)
Diferenciació d(a,b) = 0 sólo si a = b
A més a més compleixen la regla dels quatre punts (o dels veins):

A a c C dAB + dCD ≤ dAC + dBD dAB + dCD ≤ dAD + dBC


x dAC + dBD = dAD + dBC = a + b + c + d + 2x
b d D dAC + dBD = dAD + dBC = dAB + dCD + 2x
B
En el cas de les distàncies ultramètriques compleixen les anteriors propietats i la
regla dels quatre punts com distàncies additives que són, però a més compleixen
la propietat dels 3 punts:
Per a qualsevol parell de nodes externs, les distàncies
d de les branques que els connecten al node intern comú
c són iguals.
a b Propietats additives: dAB = a + b; dAC = a + d +c; dBC = b +d +c
Propietats ultramètriques: a = b i a + d = b + d = c
A B C
Lluís Pascual, 2016 04-81
4.6. Mètodes bàsics de reconstrucció filogenètica.
Arbres ultramètrics: mètodes d’agrupament (clustering): UPGMA
- A partir d'una matriu de distàncies van agrupant els tàxons que presenten menor
distància entre ells ja que, assumint una taxa de canvi constant (ultrametricitat), seran
els que han divergit més recentment.
- En reconstruir l'arbre es van ajustant les distàncies empíriques a ultramètriques forçant
que compleixin les propietats de la ultrametricitat. Si les distàncies empíriques no són
ultramètriques, la reconstrucció filogenètica serà incorrecta.
Mètodes d’agrupament: UPGMA (Unweighted pair grouping method by the aritmetic
mean), WPGMA (Weighted pair grouping method by the aritmetic mean), SL (single
linkage) y CL (complete linkage).

matriu de distàncies 1ª unió Si min dij = dAB


A B C a
A
B dAB
C dAC dBC b B
D dAD dBD dCD dAB/2
Aditivitat dAB = a + b dAB = 2a = 2b
dij: distància d’i a j basada en les
Ultrametricitat a = b a = b = dAB/2
diferències entre estats del caràcters
Lluís Pascual, 2016 04-82
4.6. Mètodes bàsics de reconstrucció filogenètica.
Arbres ultramètrics: mètodes d’agrupament (clustering): UPGMA
2ª unió Si min dij = d(AB)C A
(AB) C
C d(AB)C B
D d(AB)D dCD
C
d(ij)k = (dik + djk)/2 per a UPGMA d(AB)C/2

A l'hora d'estimar la distància d'un grup respecte als altres grups o


tàxons (parell AB a C en l'exemple), si les distàncies fossen
estrictament ultramètriques dAB i dBC haurien de ser iguals, si no ho
són és a causa de homoplàsia, per la qual cosa es força que ho
siguen, i aquí és on difereixen els 4 mètodes, el UPGMA pren la
mitjana no ponderada d'elles, WPGMA la mitjana ponderada,
‘single linkage’ la mínima d'elles i ‘complete linkage’ la màxima.
Lluís Pascual, 2016 04-83
4.6. Mètodes bàsics de reconstrucció filogenètica.
Arbres ultramètrics: mètodes d’agrupament (clustering): UPGMA

A
Arbre final amb
les distàncies de dAB/2 B
les branques C
d(AB)C/2
D
d(ABC)D/2
d(ABC)D = [dAD + dBD + dCD]/3 (en el cas d’UPGMA)
d(ABC)D = [(dAD + dBD )/2+ dCD]/2 (en el cas de WPGMA)
d(ABC)D = min [dAD + dBD + dCD] (en el cas de Single Linkage)
d(ABC)D = max [dAD + dBD + dCD] (en el cas de Complete Linkage)

Lluís Pascual, 2016 04-84


4.6. Mètodes bàsics de reconstrucció filogenètica.
Arbres ultramètrics: mètodes d’agrupament (clustering): UPGMA
A - GCTTGTCCGTTACGAT A B C D E
B – ACTTGTCTGTTACGAT
B 2
C – ACTTGTCCGAAACGAT
D - ACTTGACCGTTTCCTT C 4 4
E – AGATGACCGTTTCGAT D 6 6 6
F - ACTACACCCTTATGAG E 6 6 6 4
F 8 8 8 8 8
A B C D E
B 2
C 4 4
D 6 6 6
E 6 6 6 4
F 8 8 8 8 8
Lluís Pascual, 2016 04-85
4.6. Mètodes bàsics de reconstrucció filogenètica.
Arbres ultramètrics: mètodes d’agrupament (clustering): UPGMA

dist(A,B),C = (distAC + distBC) / 2 = 4


dist(A,B),D = (distAD + distBD) / 2 = 6 A,B C D E
dist(A,B),E = (distAE + distBE) / 2 = 6
dist(A,B),F = (distAF + distBF) / 2 = 8 C 4
D 6 6
E 6 6 4
F 8 8 8 8

A,B C D E
C 4
D 6 6
E 6 6 4
F 8 8 8 8
Lluís Pascual, 2016 04-86
4.6. Mètodes bàsics de reconstrucció filogenètica.
Arbres ultramètrics: mètodes d’agrupament (clustering): UPGMA
A,B C D,E
C 4
D,E 6 6
F 8 8 8

AB,C D,E

D,E 6
F 8 8

ABC,DE

F 8
Lluís Pascual, 2016 04-87
4.6. Mètodes bàsics de reconstrucció filogenètica.

Lluís Pascual, 2016 04-88


4.6. Mètodes bàsics de reconstrucció filogenètica.
Arbres ultramètrics: mètodes d’agrupament (clustering): UPGMA
Els mètodes d’agrupament fallen quan les taxes Matriu de distàncies
evolutives no són constants
A B C D E
B 5
C 4 7

Arbre real D 7 10 7
E 6 9 6 5
F 8 11 8 9 8

Topología
Topologia
incorrecta
Raíz

Arbre UPGMA

Lluís Pascual, 2016 04-89


4.6. Mètodes bàsics de reconstrucció filogenètica.

Lluís Pascual, 2016 04-90


4.6. Mètodes bàsics de reconstrucció filogenètica.
Arbres additius: mètode d’arbre únic per anàlisi de quartets
N’hi ha diferents mètodes que no assumeixen ultrametricitat. Anem a veure un
d’ells, el Neighbor-Joining com exemple.
Aquest procediment utilitza la propietat dels 4 punts de les distàncies additives
per identificar els veïns més pròxims:

A a c C
x
B b d D

dAC + dBD = dAD + dBC = a + b + c + d + 2x = dAB + dCD + 2x

Per tant, dAB + dCD < dAC + dBD


i, dAB + dCD < dAD + dBC

A-B y C-D són veïns A-C, B-D, A-D y B-C no ho són


Lluís Pascual, 2016 04-91
4.6. Mètodes bàsics de reconstrucció filogenètica.
Arbres additius: mètode d’arbre únic per anàlisi de quartets
Per determinar la topologia de l'arbre additiu, s'agrupen els
tàxons en tots els quartets possibles i es calculen per a cada
quartet les tres sumes de distàncies dos a dos i es determina
que suma és la menor, el que identifica als dos parells de veïns
més pròxims.
El parell de tàxons que apareix recolzat com veïns en totes les
combinacions és el primer a agrupar.
Un cop agrupat es recalculen les distàncies del primer parell de
tàxons a tots els restants taxons (mitjana com es feia en el
UPGMA), i es tornen a calcular, de tots els quartets possibles,
que és el següent parell recolzat com veïns.
Així successivament fins que queden agrupats tots els tàxons.
Un cop s'ha determinat la topologia, se li s'ajusten les distàncies
pel mètode de Fitch-Margoliash o de mínims quadrats, per
obtenir l'arbre.
Lluís Pascual, 2016 04-92
4.6. Mètodes bàsics de reconstrucció filogenètica.
Arbres additius: mètode Neighbor-Joining (NJ) d’arbre únic
2 3
1 1 4
3
8 X 4 Y X 5
7 2
5 8 6
6 7
Saitou i Nei van demostrar que la suma de les llargàries de les branques del nou arbre que
agrupa el parell 1 i 2 (S12) ve donada per:
N
1 1 1 dij= Distància entre i i j
S12 = ∑
2( N − 2) k =3
( d1k + d 2k ) +
2
d12 + ∑ d ij
N − 2 3≤i ≤ j ≤ N segons la matriu de
distàncies
Si calculem els valor S per a tots els possibles arbres que agrupen totes les combinacions
de parells de tàxons (S12, S13, ……., S78), Saitou i Nei van demostrar que el parell de tàxons
que minimitza aquest paràmetre són els veïns més pròxims.

Lluís Pascual, 2016 04-93


4.6. Mètodes bàsics de reconstrucció filogenètica.
Arbres additius: mètode Neighbor-Joining (NJ) d’arbre únic
Una vegada identificats els veïns més pròxims, aquests s’agrupen i s’eliminen de l’arbre
per tornar a començar un nou càlcul amb el node intern, Y, que els connecta:

1 3 4 3 4

Y X 5 Y X 5
2
8 6 8 6
7 7
Per poder fer això hem de recalcular les llargàries de les branques d’1 a Y (L1y) i de 2 a Y (L2Y),
i les distàncies del node Y als restants tàxons (dYk), que Saitou i Nei demostren que venen
donades per:

1 N 1 1 N 1 N 1 1 N
L1Y = ∑
N − 2 k =3
d1k + d12 −
2

N − 2 k =3
d 2 k L2Y = ∑
N − 2 k =3
d 2 k + d12 −
2

N − 2 k =3
d1k

Lluís Pascual, 2016 04-94


4.6. Mètodes bàsics de reconstrucció filogenètica.
Arbres additius: mètode Neighbor-Joining (NJ) d’arbre únic
Es comprimeixen 1 i 2 en Y, i es segueix aplicant el procediment,
recalculant les distàncies dels restants tàxons al nou node Y, que
es tractarà com un taxó més, segons l'eqüació:

1
dYk = (d1k + d 2 k − d12 )
2
k
1 k

d1k dYk
d12 Y Y

d2k
2
Lluís Pascual, 2016 04-95
4.6. Mètodes bàsics de reconstrucció filogenètica.
Arbres additius: mètode Neighbor-Joining (NJ) d’arbre únic
Exemple agafat de l’artícle original de Saitou i Nei (1987)

Lluís Pascual, 2016 04-96


4.6. Mètodes bàsics de reconstrucció filogenètica.
Arbres additius: mètode Neighbor-Joining (NJ) d’arbre únic
Exemple agafat de l’artícle original de Saitou i Nei (1987)

Cicle 1 Cicle 2 Cicle 3

Cicle 4 Cicle 5 Cicle 6


Lluís Pascual, 2016 04-97
Lluís Pascual, 2016 04-98

You might also like