Professional Documents
Culture Documents
Fylogeni & Fylogenetiske Karakterer
Fylogeni & Fylogenetiske Karakterer
Fylogeni & Fylogenetiske Karakterer
karakterer
Søren Rosendahl,
Økologi & Evolution, Biologisk Institut
Evolutionsbiologi 2024
Denne forelæsning:
Influenza A HIV
Hvordan måles lighed imellem arter
• Homologe karakterer (characters): karakterer
med samme oprindelse (f.eks. karakteren tær).
• Homologe karaktertilstande (character states):
Karaktertilstande med samme oprindelse
(f.eks. antallet af tær)
Oprindelig karaktertilstand a: 0
Art 1 og 3 har en
symplesiomorfi
a: 0→1
Oprindelig karaktertilstand a: 0
a: 0→1
Tilbageskift a: 1→0
•Homologe karakterer:
karakterer med samme oprindelse (f.eks. karakteren tær).
•Homologe karaktertilstande:
Karaktertilstande med samme oprindelse.(f.eks. antallet af tær)
Human TCTTCGAGGAAGGAGTTGAGGCATTTTTGGCTGAACATTCAGCACAGAAGA
Mouse TCTTCGAAGAAGGAGTTGAGGCATTCTTGATTGAGCACTCGGCACAGAAGA
Dog TCTTGGAAGAAGGAGTTAAGGCATTTTTGGCTGAACACTCAGCACAGAAGA
Elephant TCTTGGAAGAAGGAGTTAAGGCATTTTCGGCTGAACACTCAGCACAGAAGA
karakter karaktertilstande
Det er vigtigt at sekvenserne er alignet når vi
skal bruge dem som fylogenetiske karakterer
10 20 30 40
....|....|....|....|....|....|....|....|
Hsap_Afrika TGCCTCGGCTCTTTACCTGCCCCCCTCCCTCGCGTGTCGC
Hsap Europa TGCCTCGGATCTTTACCTGCCCCCCTCCCTCGCGTATCGC
Neander TGCCTCGGATCTTTGCCTGCCCCCCCTCCTTGCGTATCGC
Denisova CGCTTCGAATCTCCACCTATCCCCCTTCCTTGCGTACCGC
10 20 30 40
....|....|....|....|....|....|....|....|
Hsap_Afrika TGCCTCGGCTCTTTACCTGCCCCCC TCCCTCGCGTGTCGC
Hsap Europa ........A................ ..........A....
Neander ........A.....G..........C T...T....A....
Denisova C..T...AA...CC....AT..... .T...T....AC...
Alignment
Oprindelig
sekvens
mutation
deletion
insertion
Afledt
sekvens
Det kan være mere problematisk at
aligne sekvenser fra meget forskellige
organismer
1 1 0 1
0 1 0 1
0 0 1 1
0 0 1 0
Parsimoni
1. Tegn et træ
2. Placer alle karakterskift på træet
3. Tæl antallet af karakterskift
4. Tegn et nyt træ
5. Placer alle karakterskift på træet
6. Tæl antallet af karakterskift
7. Tegn et….
1 1 0 1
Hår
2 par 0 1 0 1
lemmer
0 0 1 1
Ben skelet
Gæller 0 0 1 0
4 ændringer
1 1 0 1
0 1 0 1
0 0 1 1
Hår
0 0 1 0
2 par lemmer 0 0 0 0
Gæller
(forsvinder)
Ben skelet Så er fisk tættere
beslægtet med mus
Hvirveldyr
eller med hajer?
Karakter baserede træer laves ved at finde den
bedste model og visualisere denne som et træ
Vælg det
Analyse korteste træ
Visualisering
Prøv forskellige
modeller
(træer)
Data
Sekvens alignment
Fylogenetisk træ
Hvilke kriterier bruger vi til at finde det
‘bedste’ træ:
• Parsimoni
• Minimum evolution
• Maximum likelihood
• Bayesian inference
Maximum Likelihood
TACGT
T t2 C TACCA
t5
CAGGT
A t3 A
GAGCT
t1 t4
Nucleotide frekvens G
T Gren længde
Substitutions rate
fraktionen af 1
nucleotider som er
ændringer 0,2
modellen, er raten
1
par: A, T, C, og G 0,2
transversion
transition
More komplekse modeler
• Kan inkludere forskellige rater for
forskellige substitutioner
• Kimura 2-parameter modellen antager
forskellige hypppighed af transitioner
og transversioner
Hvilken model skal jeg bruge?
Table. Maximum Likelihood fits of 24 different
nucleotide substitution models
Model #Param BIC AICc lnL
HKY+G 194 8508,50 6742,35 -3176,60795
TN93+G 195 8518,94 6743,70 -3176,274718
HKY+G+I 195 8519,74 6744,49 -3176,672415
TN93+G+
I 196 8529,92 6745,58 -3176,211346
HKY+I 194 8530,49 6764,35 -3187,605683
GTR+G 198 8539,17 6736,63 -3169,722664
TN93+I 195 8541,06 6765,82 -3187,336927
T92+G 192 8543,36 6795,41 -3205,14654
Hasegawa-Kishino-Yano
Vi kan også beregne et træ. Det kalder
vi en algoritmisk metode:
Data
Parvis afstands
matrix
Sekvens alignment
Fylogenetisk træ
Her er fire sekvenser med 9 variable sites:
3 8 10 12 13 15 1718 24
A: GTT ACG ACT GAC TGA TGA CGT ACG AAC ATT
B: GTC ACG ACT AAC TGA TGA CGT ACG AAC ATT
C: GTC ACG ATT GAT TGA TAA CGT ACG AAC ATT
D: GTC ACG ATT GAT CGG TGG CGT ACC AAC ATT
Ved at sammenligne sekvenserne parvis
kan vi lave en Afstandsmatrix
3 8 10 12 13 15 1718 24 27
A: GTT ACG ACT GAC TGA TGA CGT ACG AAC ATT
B: --C --- -C- A-C T-A -GA --- --C --C ---
C: --C --- -T- G-T T-A -AA --- --C --C ---
D: --C --- -T- G-T C-G -GG --- --C --A ---
Relative afstande
(antal substitutioner
Absolutte afstande per længde)
A B C D A B C D
A A
B 3 B 0.1
C 5 4 C 0.17 0.13
D 8 7 5 D 0.27 0.23 0.17
Neighbor joining træ
Neighbor joining er en metode til at beregne et
træ. Man får derfor kun ét træ ud af en
afstandsmatrix
A B C D A C
2
A 0 3 5 8 1.75 1.25
1
B E F
B 3 0 4 7
4
C 5 4 0 5
D 8 7 5 0
∑ 16 14 14 20 D
Der findes grundlæggende to måder at
lave fylogenetiske træer på:
Homo sapiens
Neanderthal
Chimpanser
Gorilla
Orangutan
Udfordringer for fylogenetiske metoder
A B C A B C
A 0 A 0
B 5 0 B 3 0
C 5 2 0 C 6 7 0
To fælles A B C C A B
mutationer
To haplotyper
dannet efter
en mutation
0.050
Afvigelser fra træstruktur: Horisontal
gen overførsel
1 2 3 4 5