Professional Documents
Culture Documents
Medicinsk Genetik
Medicinsk Genetik
Medicinsk Genetik
Indhold 5
Forord 10
stamtrssymboler 12
Menneskets genom 15
Indledning 15
Det personlige genom og artens
genom 15
Generelt om arvemateriale 17
Cellecyklus 55
Mitosen 57
Meiosen 58
Meiosens faser i relation til
gametogenesen 60
Mitokondriernes forhold ved
celledelinger 61
Genetisk variation 65
DNA-replikation 18
Indledning 65
Arvematerialets funktion 20
Mutationers opsten 65
Proteinkodende gener 21
Mutationstyper 66
Transkription og posttranskriptionel
Genetiske markrer og
modificering 28
Den genetiske kode 33
Translation og posttranslationelle
modifikationer 33
Ikkekodende RNA 36
markranalyser 77
Normal variant eller patogen
mutation? 78
Beskrivelse af sekvensvariation p DNAog proteinniveau 79
Cytogenetik og
Mitokondrie-DNA (mtDNA) 47
kromosomsygdomme 83
Betydning og perspektiver 51
25139-book.indb 5
09/12/11 11.02
| INDHOLD
Mikrodeletionssyndromer og molekylr
cytogenetik 100
Referencer 103
Folkesygdomme 150
Psykiatriske sygdomme 152
Indledning 195
Afslutning 199
25139-book.indb 6
09/12/11 11.02
| INDHOLD
Indledning 231
Sygdomsmnstre 210
Onkogener 233
Sygdomsforlb 210
Caretakers 236
Screening 211
Specifikke biokemiske/
molekylrgenetiske analyser 214
Prnatal diagnostik 214
Neonatalscreening 214
Dit 215
stamcelledefekt 237
Arvelighed ved de hyppigste former for
cancer 237
Monogen/syndromal arvelig disposition
for cancer 241
Enzymhmning 215
Risikoklassifikation: 242
Medikamentel reduktion af
Onkogenetisk udredning og
substrat 216
Medikamentel eliminering af
biprodukter 216
Vitaminer 216
Substitution 216
Medikamentel bedring af
enzymfunktion 217
Transplantation 217
Forebyggende foranstaltninger 218
Dysmorfologi 219
Isolerede misdannelser 223
Malformationssyndromer 224
Opslagsvrker 230
rdgivning 248
Den onkogenetiske konsultation 251
Litteratur 253
Cancercytogenetik 255
Indledning 255
De kromosomale sygdomsmekanismer
ved cancer 258
Hvordan opstr gentagne specifikke
kromosomforandringer? 259
Cancerstamcellen og dens betydning for
tumorudvikling 263
P hvilket tidspunkt i livet opstr
kromosomforandringer? 263
Er de erhvervede kromosomforandringer
tilstrkkelige til neoplastisk
udvikling? 264
25139-book.indb 7
09/12/11 11.02
| INDHOLD
at pvise neoplasi-relaterede
forandringer? 264
De maligne hmatologiske
sygdomme 265
Normal hmopoiese 265
Er abnorm hmopoiese tilstrkkeligt til
at medfre leukmi/lymfom? 267
Korrelation mellem morfologi, fnotype
og kromosomale rearrangementer. 269
lymfom 278
Modne T-celle- og NK-celleneoplasier 278
Aggressiv NK-celle-leukmi 278
Anaplastisk storcellet lymfom (ALCL),
ALK-positiv vs. ALK-negativ 278
Hodgkin-lymfom 278
cancercytogenetikken 280
Neurologiske og neuromuskulre
sygdomme 285
Indledning 285
MPD) 272
Misdannelser 286
Kromosomsygdomme 286
Mitokondriesygdomme 286
Indledning 307
Intelligenskvotient 308
(myelomatose) 277
8
25139-book.indb 8
09/12/11 11.02
| INDHOLD
Genterapi 317
MLPA 340
Introduktion 317
Array-teknologier 344
Risici 323
Array-CGH 345
Fremtidige udviklinger og
SNP-array 346
perspektiver 323
Litteratur 325
Molekylrgenetisk diagnostik
metoder og teknikker 327
Indledning 327
Ekspressions-array 347
Nye sekventeringsteknologier 349
jebliksbillede af NGS (Next Generation
Sequencing) 349
Forfatteroversigt 359
Fragmentanalyse 332
Heteroduplex 333
SNP-analyse 334
Dynamiske mutationer 337
Ordliste 363
Stikordsregister 397
25139-book.indb 9
09/12/11 11.02
Forord
Nr man taler om menneskets arvelighedsforhold i et lgeligt perspektiv, skelner man gerne
mellem tre genetiske discipliner: humangenetik,
medicinsk genetik og klinisk genetik. Human
genetik er lren om menneskets arvemasse og
variationen heri. Medicinsk genetik er lren om
arvelige faktorers betydning for opstelsen af
sygdomme hos mennesket, og endelig kan man
definere klinisk genetik som den disciplin der
omhandler den praktiske udmntning af den
medicinsk genetiske viden i diagnostik og genetisk rdgivning. Denne lgelige udfordring
krver dels kendskab til de kliniske manifestationer af genetiske sygdomme, dels udvikling og
anvendelse af laboratoriediagnostiske analyser.
Det er formlet med nrvrende lrebog er at
give en indfring p dansk i nogle af de vigtigste
anvendelsesomrder inden for medicinsk og klinisk genetik, og ved udarbejdelsen af bogen har
fokus vret p klinisk relevans, samtidig med at
det biologiske og teoretiske fundament forklares.
Den primre mlgruppe for denne bog er medicinstuderende p 1. og 2. del, men det er vores
hb at bogen ogs vil finde anvendelse i det
postgraduate forlb, herunder i speciallgeuddannelserne.
Humangenetikken er en forholdsvis ung videnskabelig disciplin der, ligesom anden genetik, har sit grundlag i de arvelighedslove den
strig-ungarnske munk og naturforsker Gregor
Mendel opstillede i midten af 1860erne. Uden
at kende til det fysiske grundlag for arvematerialet beskrev han nedarvningsmnstrene for dominante og recessive egenskaber hos rteplanter,
og sluttede at de skyldes distinkte arvelige enhe-
10
25139-book.indb 10
09/12/11 11.02
| FORORD
De senere rs nrmest eksplosive udvikling inden for den humane og medicinske genetik
ndvendiggr en hyppig opdatering af lre
bger i faget. Den foreliggende 2. udgave af
Medicinsk Genetik er bde ajourfrt og udvidet i forhold til frste udgave. Bl.a. er der i 2.
udgave tilfjet et egentligt metodekapitel samt
en omfattende ordliste, og samtlige kapitler er
revideret og opdateret i overensstemmelse med
den udvikling faget har gennemlbet siden frste udgave kom i 2006. Bogen er tilstrbt at
vre pensumdkkende for undervisningen i
genetik p det medicinske studium i Danmark.
Oktober 2011
Sren Nrby og Peter K.A. Jensen
11
25139-book.indb 11
09/12/11 11.02
Stamtrssymboler
12
25139-book.indb 12
09/12/11 11.02
| STAMTRSSYMBOLER
13
25139-book.indb 13
09/12/11 11.02
25139-book.indb 14
09/12/11 11.02
Kapitel 1
Menneskets genom
Indledning
Levende organismer bestr af celler. Som en helt
central del af deres biologi har organismerne p
Jorden gennem rmillioners evolution udviklet
et molekylrt lager af information der styrer de
overordnede processer i cellerne. Den enkelte
organismes liv afhnger af at cellerne kan opbevare og afkode denne information samt viderefre den nr cellerne deler sig. For artens eksistens er det endvidere ndvendigt at informationen viderefres fra generation til generation.
Det er det biologisk arv drejer sig om, og denne
information betegnes genetisk information. De
molekyler der brer den genetiske information,
betegnes det genetiske materiale eller arvematerialet, og det samlede molekylre lager af genetisk information betegnes cellens/organismens
arvemasse eller genom. Efter en generel introduktion om genomet vil dette kapitel gennemg dels dets molekylre struktur og funktion,
dels dets organisering i cellerne.
drierne (det mitokondrielle genom, mitokondriegenomet, s. 47ff.), Fig. 1.1. En persons nuklere genom udgres af kromosomernes
DNA-molekyler og er derfor diploidt (s. 55).
Dertil kommer mitokondriegenomet (mitokondrie-DNA, mtDNA) som i en celle foreligger i et meget varierende antal kopier, idet bde
antallet af mitokondrier, og antallet af mitokondrie-DNA-molekyler per mitokondrie, varierer
fra celle til celle.
Boks 1.1 Opdagelsen af DNA
I slutningen af 1860erne lagde schweizeren Johann
Friedrich Miescher (1844-95) grunden til udforskningen af nukleinsyrer med sin opdagelse af det der
skulle vise sig at vre DNA. Han studerede hvide
blodlegemer under et studieophold i den tyske universitetsby Tbingen. Udgangsmaterialet var pusfyldte bandager fra universitetshospitalets kirurgiske
afdeling. Herfra isolerede han cellekerner og ekstraherede en hidtil ubeskrevet hjmolekylr og fosforrig sur komponent som han navngav Nuklein (lat. nucleus, kerne). Senere foretog han, i hjembyen Basel,
yderligere ekstraktioner af det samme stof, denne
gang fra laksesd. Mieschers elev Richard Altmann
(1852-1900) forbedrede ekstraktionsmetoden og indfrte betegnelsen Nukleinsure (nukleinsyre) for den
oprensede komponent. Omkring r 1900 havde man
afklaret at nukleinsyre bestr af tre forskellige stofgrupper: fosfat, kulhydrat og nitrogenholdige baser.
Se mere om opdagelsen af DNA p http://www.karger.com/gazette/71/miescher/art_03.html
15
25139-book.indb 15
09/12/11 11.02
Cellekernen
(det nuklere
genom)
Mitokondrie
(mitokondriegenomet)
Menneskecelle
klere genoms vedkommende sige 24 DNAmolekyler som reprsenterer dem der er indeholdt i menneskets 24 forskellige kromosomer:
knskromosomerne X og Y samt de 22 autosomer (kromosomerne 1-22 inkl.) (Fig. 1.2 og
Kap. 4, s. 83). Dette betegnes det haploide
genom (haploid = med t kromosomst, s.
55).
En detaljeret kortlgning af det haploide humane genom, i form af fastlggelsen af basesekvenserne for de 24 kromosomale DNA-molekyler, blev ivrksat i 1990 med det store internationale Human Genome Project (HGP) og formelt erklret for afsluttet i april 2003, prcis 50
r efter gennembruddet med afklaringen af
DNAs dobbelthelix-struktur (Boks 1.4). Der
resterer endnu (2011) 6-7 % af det i alt ca. 3,1
mia. basepar lange genom, som det ikke er lykkedes at sekventere frdigt. Dette skyldes tekniske vanskeligheder, idet de pgldende DNAsegmenter hovedsageligt bestr af hjt repeteret
DNA, dvs. mange kopier af gentagne sekvenser.
Figur 1.2.Kromosombestningen hos en kvinde med normal karyotype (46,XX); se ogs Figur 4.1 og Boks 4.2. Prparatet er bndfarvet (Giemsa-farvning), med kromosomspecifikke lyse og mrke bnd langs de enkelte kromosomer, hvilket
muliggr den parvise anordning af kromosomerne. Tallene angiver de enkelte autosomale kromosompar 1-22, bogstaverne X og Y angiver pladserne for knskromosomerne.
16
25139-book.indb 16
09/12/11 11.02
GENERELT OM ARVEMATERIALE
Generelt om arvemateriale
Arvemateriale bestr af molekyler tilhrende
stofgruppen kernesyrer (nukleinsyrer). Det er
kdemolekyler (polymerer) opbygget af enheder betegnet nukleotider. Der skelnes mellem to
slags nukleinsyre: deoxyribonukleinsyre, ogs
kaldet DNA (eng. tidligere Deoxyribose Nucleic
Acid, nu deoxyribonucleic acid), og ribonukleinsyre,
ogs kaldet RNA (eng. tidligere Ribose Nucleic
Acid, nu ribonucleic acid). Alle cellulre organismer fra de simpleste bakterier til de mest
komplekse planter og dyr, herunder mennesket
har nukleinsyren DNA som arvemateriale.
Blandt virus, som er biologiske strukturer med
arvemateriale, men ikke selvstndigt levende
organismer, har mange arter ligeledes DNA som
arvemateriale (DNA-virus), andre har RNA
(RNA-virus).
17
25139-book.indb 17
09/12/11 11.02
HOCH2 O
H
H
OH
H
OH OH
Ribose
B
HOCH2 O
OH H
HC
C
N
Deoxyribose
O
HC
OH
H
5'
3'
G
U
A
U
C
C
A
U
A
G
O
H3C
NH
C
C
HC
C
N
NH
C
Uracil
Thymin
Figur 1.3.Strukturelle forskelle mellem DNA og RNA. A. RNA indeholder kulhydratet ribose, mens DNA indeholder
2-deoxyribose. B. RNA indeholder basen uracil, DNA basen thymin (5-methyluracil). C. RNA-molekyler er polynukleotider
ligesom DNA-molekyler, med nukleotiderne koblet sammen af 3,5-fosfodiesterbindinger. I modstning til DNAet er cellernes RNA-molekyler i udgangspunktet enkeltstrengede, men det er essentielt for deres funktion at de kan baseparre
dels med sig selv, dvs. intramolekylrt som p skitsen her, dels med andre RNA-molekyler.
DNA-replikation
Forud for en celledeling sker der en opformering af cellens DNA (Kap. 2, Fig. 2.1). Denne
proces, DNA-replikation, initieres ved bestemte
replikationsstartsekvenser (origins of replication)
og bestr af flgende trin:
1. Adskillelse af molekylets to strenge ved
brydning af baseparrenes hydrogenbindinger. Dette trin katalyseres af to typer af protein: helikaser og enkeltstrengsbindende
proteiner der hhv. bner dobbelthelixen og
holder den ben.
2. Syntese af korte RNA-strenge med DNAenkeltstrengene som skabeloner. For
RNA-syntese med DNA som skabelon
glder flgende baseparringsregler: guanin
parrer med cytosin, thymin i DNA parrer
18
25139-book.indb 18
09/12/11 11.02
DNA-REPLIKATION
O
O
H O
H C2 C 3H
1
4
C H H C
O 5
CH2
G
O
OH
O
A
T
5
T A
A
C
C G
T
H C
1
C H
2
H
HO
H
2
H C
1
C H
O
OH
C G
A T
A
CH2
O
5
C H
4
H 3C
O
H C
1
C H
2
H
CH2
O
5
C H
4
H 3C
O
T
5
O
P
T
H C
1
C H
2
H
HO P
O
N
N
N
N
N
N
O
Thymin
H
CH2
H O
2 3
H C C H
1
4
C H H C
O 5
CH2
A
O
O
3
C H
4
H C
5
CH2
HO
Hydrogenbindinger
C H
H C
3
O
C G
A T
C G
G C
T
C G
CH2
Adenin
Cytosin
N
H
Guanin
Figur 1.4.Et DNA-molekyles struktur. A. Til venstre er vist en modeltegning af et dobbeltstrenget DNA-molekyle (en
DNA-dobbelthelix). Det bestr af to DNA-strenge (polynukleotider) snoet omkring en flles akse s de danner en hjredrejet spiral. Strengene holdes sammen af hydrogenbindinger mellem baserne. Til hjre er vist den detaljerede opbygning
af de to polynukleotider, hvor nukleotiderne i hver DNA-streng er koblet sammen med 3,5-fosfodiesterbindinger, og baserne (A, G, C og T) er kovalent bundet til deoxyriboses carbonatom 1 og derudover via hydrogenbindinger til basepartneren i den anden streng. Pilene angiver strengenes orientering 53 og viser at de to strenge er modsat orienterede
(antiparallelle). B. DNAs to slags basepar: Adenin (A) danner par med Thymin (T), Cytosin (C) med Guanin (G) vha. hydrogenbindinger. Der er to hydrogenbindinger mellem A og T, og tre hydrogenbindinger mellem G og C.
med adenin i RNA, og adenin i DNA parrer med uracil i RNA. Den korte RNAstrengs rolle er at fungere som startmolekyle, primer, for den efterflgende DNA-
25139-book.indb 19
09/12/11 11.02
3. Syntese af nye DNA-strenge sker med udgangspunkt i RNA-primerne og med DNAenkeltstrengene som skabeloner. Her glder
DNA-baseparringsreglerne, og trinnet katalyseres af enzymet DNA-polymerase. Syntesen af en nukleinsyrestreng sker i retningen
53.
4. Afslutningsvis nedbrydes RNA-primerne, og
de derved opstede huller i DNA-strengene udfyldes med deoxyribonukleotider.
Processen katalyseres af DNA-polymerase.
Resultatet af DNA-replikationen er to dobbeltstrengede DNA-molekyler med samme
struktur som modermolekylet. I dattermolekylerne stammer den ene streng sledes fra modermolekylet, mens den anden er nysyntetiseret. DNA-replikationen karakteriseres derfor
som semi-konservativ.
Cellerne har flere forskellige DNA-polymeraser. I cellekernen foretages DNA-replikationen
af dels DNA-polymerase (der indgr i et multimert kompleks med DNA-primasen, se pkt. 2
ovenfor, og overtager syntesen efter denne), dels
DNA-polymerase der hurtigt aflser DNApolymerase . Mitokondrierne har deres egen
polymerase: DNA-polymerase (se s. 122).
dobbeltstrengede struktur med komplementre basesekvenser angav samtidig en umiddelbar mulighed for den opformering af molekylet til to prcise
kopier som arvematerialet skal kunne gennemg.
Efter dette gennembrud blev det efterhnden alment
accepteret at arvematerialet er DNA.
Arvematerialets funktion
Traditionelt beskrives arvemassen som bestende af diskrete strukturelle og funktionelle enheder kaldet arveanlg eller gener (Boks 5.1). Vi
vil derfor tage udgangspunkt i denne beskrivel-
20
25139-book.indb 20
09/12/11 11.02
PROTEINKODENDE GENER
Genom
DNA
Transkriptom
Transkription
Replikation
RNA
Proteom
Translation
Protein
Ikkeproteinkodende
funktionelt RNA
Figur 1.5.Skitse der viser flowet af den genetiske information i en celle. Genomet er cellens samlede genetiske information, transkriptomet er cellens samlede transkripter, og proteomet er den samlede gruppe af proteiner cellen syntetiserer. Angende ikkeproteinkodende funktionelt RNA se Tabel 1.4.
gen af genomets opbygning og funktion vil derfor tage udgangspunkt i de proteinkodende gener og deres ekspression, dvs. hvordan de kommer til udtryk. Nyere forskning har vist at den
vrige del af genomet indeholder mange ikkeproteinkodende gener hvis genprodukter (ikkekodende RNA, s. 36) er strkt involveret i bl.a.
reguleringen af de proteinkodende geners ekspression. Denne gruppe af ikkekodende RNA
forventes at f stor betydning i den fremtidige
medicinske verden. I analogi med termen genom der betegner en celles/organismes arvemasse,
har man indfrt termerne transkriptom og proteom til at betegne en celles/organismes samlede
st af hhv. transkripter og proteiner. Mens alle
kroppens somatiske celler grundlggende har
samme genom, har de ca. 200 forskellige celletyper, som udgr kroppens forskellige vv og organer, i lbet af deres differentiering udviklet
hver deres transkriptom og proteom som basis
for deres karakteristiske struktur og funktion.
Proteinkodende gener
Den information der ligger i et proteinkodende
gen, er information om det pgldende proteins
aminosyresekvens. Der er tale om en fuldstndig
grundlggende information idet et proteins
aminosyresekvens afgr proteinmolekylets rumlige struktur og derigennem dets funktion. At
denne sekvensinformation kan rummes i genets
DNA (og i det tilsvarende RNA-transkript),
skyldes at der er en simpel, liner relation mel21
25139-book.indb 21
09/12/11 11.02
mRNAets translation; dels for hvilket nukleotid translationen starter ved dvs. hvor den proteinkodende sekvens begynder dels for om
translationen initieres hyppigt eller sjldnere (se
22
25139-book.indb 22
09/12/11 11.02
PROTEINKODENDE GENER
Promotorsekvenser
Transkriptionsstart
Transkriptionsstop
Exon 1
Exon 2
Exon 3
intron 1
-30
+1
TATA Cap ATG
box site startcodon
5'
3'
intron 2
-75
CCAAT
box
3'
5'
TAA
stopcodon
C
A
AAGGTGAGT
AATAAA
signal for trimning
og polyadenylering
(Y)n NYAGG
Konsensus-sekvenser for
5'- (donor) og 3'- (acceptor)
splejsningssignaler
Transkription
og capping
Cap Exon 1
5'
UTR
intron 1
Exon 2
intron 2
Exon 3
3'
UTR
Figur 1.6.Et proteinkodende gens struktur. Som eksempel er her vist en skitse af -globin-genets struktur, med regulatoriske promotorsekvenser lokaliseret opstrms for de proteinkodende sekvenser der begynder ved ATG.
afsnittet Translation og posttranslationelle modifikationer, s. 33). Derudover kan 5 UTR indeholde sekvenser der fungerer som bindingssteder for proteiner af betydning for mRNAets
stabilitet. 3 UTR indeholder dels en skaldt polyadenyleringssekvens, dels mlsekvenser for
mikro-RNA-betinget regulering af mRNAets
translation og evt. nedbrydning (se afsnittene
Transkription og posttranskriptionel modificering s. 28 og Mikro-RNA, s. 36).
De proteinkodende gener optager ca. 45 % af
genomet, men det er bemrkelsesvrdigt at det
er introns det meste, idet genernes samlede
exons, det man betegner organismens exom (jf.
genom, transkriptom og proteom), kun udgr
ca. 2 % af genomet. Den direkte proteinkodende
del af genomet udgr sledes mindre end 2 %.
I de resterende 98 % af genomet forekommer
der imidlertid tusindvis af DNA-segmenter
som sekvensmssigt er nrt beslgtede med
proteinkodende gener, men som pga. forskellige
23
25139-book.indb 23
09/12/11 11.02
skeldystrofi og Beckers muskeldystrofi. Et andet muskelprotein, titin, har med sine ca. 38.000 aminosyrerester rekorden som det strste protein der kodes for
i genomet. Genet, TTN, er p knap 300 kb og har det
strste antal exons (363), hvoraf en er den strst
kendte (lidt over 17 kb).
Pseudogener
Pseudogener er generelt ikkefunktionelle DNAsegmenter som ligner funktionelle gener. Man
skelner mellem processerede (eng. processed, forarbejdede) og ikkeprocesserede pseudogener. De
to typer pseudogener adskiller sig fra hinanden i
bde struktur og tilblivelse. Forskellen er den at
et ikkeprocesseret pseudogen minder meget om
det tilsvarende funktionelle gen idet det har en
tilsvarende exon/intron-struktur samt regulatoriske sekvenser som fx promotoren. Det antages
da ogs at vre opstet ved duplikation af det
funktionelle gen og efterflgende inaktiveret af
mutationer i DNA-sekvensen, jf. pseudogenerne
i globin-genklyngerne (Fig. 1.9). Hvis der kun er
tale om kopi af en mindre del af det funktionelle
gen, fx en enkelt exon, taler man om et genfragment.
Et processeret pseudogen indeholder hverken
intron- eller promotor-sekvenser. Det antages
derfor at vre dannet skaldt revers transkription, dvs. ved transkription af mRNA til DNA,
og efterflgende integrering af DNA-kopien i
genomet. Det kan i nogle tilflde ske at et processeret pseudogen transkriberes fordi det tilfldigvis er blevet sat ind tt p en promotor. I s
tilflde betegnes pseudogenet et retrogen. Det
autosomale gen for enzymet fosfoglyceratkinase
(PGK2) p kromosom 6p er formentlig et sdant retrogen. Det er interessant at ekspressionsmnstret for dette gen er meget forskelligt fra
det oprindelige X-bundne gens (PGK1). PGK2
udtrykkes kun i testes, mens PGK1 udtrykkes i
alle vrige vv. Den testisspecifikke ekspression
Kromatid
Centromer
Telomer
B
100-300 kb
Subtelomer
region
Telomerassocierede
repeats
12 kb
Telomer
5
3
..... AGGGTTAGGGTTAGGGTTAGGGTTAGGGTTAG
..... TCCCAATCCCAATCCCAATCCCAATCC
3
5
Figur 1.7. A. Skitse af et metafasekromosom. Kromosomet bestr af to kromatider der holdes sammen i den
region der betegnes centromeret. Regionerne i enderne af
kromatiderne betegnes kromosomets telomerer. B. Skitse
af et kromatids telomerregion. De terminale afsnit med ca.
12 kb DNA udgr telomeren. Centromert herfor ligger en
region med 100-300 kb DNA bestende af telomer-associerede repeats (Tabel 1.6), og yderligere centromert herfor ligger den skaldte subtelomerregion, en region der er
forholdsvis rig p gener. C. Skitse af et kromatid med angivelse af den ene telomerregion og et udsnit af det telomere DNAs basesekvens. DNAet bestr af et par tusind
tandemrepeterede enheder seks basepar (indrammet).
24
25139-book.indb 24
09/12/11 11.02
PROTEINKODENDE GENER
5
3
3
5
EVI2B
OMG
EVI2A
5kb
-globin-genklyngen
Kromosom 11p
5
0
20
40
3
60 kb
25
25139-book.indb 25
09/12/11 11.02
Tabel 1.1 Det haploide humane genom. DNA-indhold samt antal gener i hvert kromosom.Fra National Center for
Biotechnology Information (NCBI), Human Genome Project, oktober 2010
Kromosom
Mb DNA
% af genomet
Antal gener/Mb*
% af gener i alt
247
8,0
4.220
17,1
13,1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
X
Y
243
199
191
181
171
159
146
140
135
134
132
114
106
100
89
79
76
64
62
47
50
155
58
3.080
7,9
6,5
6,2
5,9
5,6
5,2
4,7
4,5
4,4
4,4
4,3
3,7
3,4
3,3
2,9
2,6
2,5
2,1
2,0
1,5
1,6
5,0
1,9
100,0
1.491
1.550
446
609
2.281
2.135
1.106
1.920
1.793
379
1.430
924
1.347
921
909
1.672
519
1.555
1.008
578
1.092
1.846
454
32.185
6,1
7,8
2,3
3,4
13,3
13,4
7,6
13,7
13,3
2,8
10,8
8,1
12,7
9,2
10,2
21,2
6,8
24,3
16,3
12,3
21,8
11,9
7,8
10,45
4,6
4,8
1,4
1,9
7,1
6,6
3,4
6,0
5,6
1,2
4,4
2,9
4,2
2,9
2,8
5,2
1,6
4,8
3,1
1,8
3,4
5,7
1,4
100,0
Figur 1.10.Transkription og translation. A. Skitse af transkription af DNA, dvs. syntese af RNA med den ene DNA-streng
som skabelon (template). Syntesen foretages af en RNA-polymerase der rekrutteres til opgaven af specielle proteiner kaldet
transkriptionsfaktorer. Den sker i retningen 53, dvs. komplementrt til 35-retningen p den DNA-streng der fungerer
som template. B. Skematisk afbildning af princippet i translation af messenger-RNA (mRNA). Tre p hinanden flgende baser
i mRNA (en triplet) udgr en kodeenhed (codon) for en given aminosyre, jf. den genetiske kode (Tabel 1.2), og basesekvensen
afkodes i en ubrudt lseramme af ikkeoverlappende codons i retningen 53, begyndende ved startcodon (AUG, koder for
aminosyren methionin). Afkodningen formidles af aminosyrespecifikke ladede tRNA-molekyler vha. disses anticodon som
baseparrer med den tilsvarende codon (se flere detaljer i delfigur d samt i afsnittet tRNA, s. 34), og trin for trin kobles
aminosyrerne sammen ved etablering af peptidbindinger under dannelse af det pgldende polypeptid/protein. C. Skitse af
et translationsforlb. Translationen formidles af ribosomer, og man definerer tre delprocesser i translationen: initiering, elongering og terminering. Hvert af disse trin formidles og reguleres af forskellige proteiner samt af ribosomalt RNA, herunder
katalytisk aktivt rRNA (ribozym). Se flere detaljer i afsnittet Translationen, s. 35. D. tRNA-molekylers struktur, her illustreret
ved tRNA for aminosyren fenylalanin (tRNAPhe), dels i stiliseret todimensionel struktur (skaldt klverbladsform), dels p
skitseret naturtro tredimensionel form. Acceptor-armen (3-enden af molekylet) tilhftes den specifikke aminosyre, jf. anticodon (her 3-AAG-5 der kan parre med de to fenylalanincodons, se Tabel 1.2. I RNA kan G parre med bde C og U). De tomme
felter i klverbladsformens basesekvens angiver modificerede nukleotider af forskellig slags.
26
25139-book.indb 26
09/12/11 11.02
A. Transkription
RNA
3'
5'
3'
5'
3'
DNA-dobbelthelix
B. Translation
Methionin
Glycin
Serin
Glycin
Isoleucin
Alanin
Polypeptid
5'
Codons
C
3'
mRNA
C. Translationsforlb
Ribosom
5' A U G
U A C
Ribosom
G G C
U C C
A U G
Met
Met
1. Initiering
Ribosom
G G C
C C G
U C C
A G G
Gly
Ser
A G U
U C A
Phe
U C C 3'
U A A
Leu
Met Ser
2. Elongering
3. Terminering
1. Klverbladstruktur
C
G
G
A
U
U
U
A 3'
C
C
A
C
G
C
U
U
A
A
C U
G A C A C
C
C
A
G
C
C U G U G
U
A G Variabel loop
G
G
U
C
5' G
G A
G
Loop 1
G G A
C U C
G A G C
A
C Loop 2 A
U
G A A
Anticodon
Loop 3 G
54
Loop 3
64
5'
76
4
72
69
20
12
Variabel loop
44
3'
Acceptorende
Loop 1
26
38
32
Anticodon-loop
(Loop 2)
Anticodon
27
25139-book.indb 27
09/12/11 11.02
Transkription og posttranskriptionel
modificering
CAT 0
3
0,5
1,0
1,5
2,0 kb
TATA
HPRT
2 3
78 9
25
50 kb
GC-rig
Faktor VIII
1
0
2-6
7 - 13
50
14
100
15 - 22
23 - 25
150
26
200 kb
TATA
Figur 1.11.Skitser af tre forskellige proteinkodende gener. Bemrk de forskellige strrelsesskalaer (hhv. ca. 2 kb, 50
kb og 200 kb) og exon/intron-fordelinger. Genernes exons er nummererede. CAT, TATA og GC-rig angiver regulatoriske elementer i genernes promotorregioner, jf. Fig. 1.6.
28
25139-book.indb 28
09/12/11 11.02
Figur 1.12. Modelskitse af initieringskompleks ved transkription af et proteinkodende gen. Figuren illustrerer binding
af generelle transkriptionsfaktorer og RNA-polymerase II (den muselignende figur) til genets promotorregion (med TATAboks) samt stimulering af komplekset ved yderligere tilknytning af et aktivatorprotein, bundet til en enhancer-sekvens i
stor afstand fra promotorregionen, men bragt i fysisk nrhed af denne ved slyngedannelse (looping) af DNAet. Noget
tilsvarende glder for silencer-sekvenser og dertil knyttede transkriptionshmmende proteiner.
promotorregionen. Det er bindingssteder for skaldte specielle transkriptionsfaktorer som interagerer med RNA-polymerase-komplekset i
promotorregionen. At dette kan lade sig gre,
selv over store afstande, skyldes DNA-molekylernes fleksibilitet (looping, se Fig. 1.12). P den
mde kan de DNA-bundne specielle transkriptionsfaktorer fysisk n proteinkomplekset i promotorregionen og dermed pvirke rekrutteringen af RNA-polymerasen i positiv eller negativ
retning, dvs. fungere som det der betegnes en
hancers (positive; eng. forstrkere) hhv. silencers
(negative; eng. (lyd)dmpere).
Det er promotorerne der afgr hvilken DNAstreng der bliver skabelon for RNA-syntesen,
samt hvor syntesen skal begynde (transkriptionsstart, Fig. 1.6 og 1.12). Mange af de proteinkodende gener hos mennesket har to eller flere
alternative promotorregioner, typisk forskellige
mht. binding af vvs- og udviklingsstadiespecifikke transkriptionsfaktorer. Der er fx beskrevet
mindst 8 forskellige promotorer i dystrofin-genet, DMD (Fig. 1.13, Boks 1.6), hvor den promotor der er lokaliseret nrmest genets 3-ende
Capping og polyadenylering
Straks efter transkriptionens start modificeres
transkriptets 5-ende ved pstning af et guaninribonukleotid hvis 5-fosfat bindes til
transkriptets 5-fosfat hvorved 5-enden fr en
fri 3-OH-gruppe, ligesom 3-enden. Dette endestillede specielle nukleotid, der derefter metyleres i guanindelens position 7 (m7GpppN)2,
betegnes cap (eng. kasket). Etableringen af capen
kaldes capping og er et srkende for RNA syntetiseret af RNA-polymerase II. Capen beskytter molekylet mod enzymatisk nedbrydning og
har endvidere betydning for initieringen af
translationen.
2 m7G = 7-methyl-guanosin; p = fosfat; N = 5-nukleosidet
(base+ribose) i det umodificerede primre transkript.
29
25139-book.indb 29
09/12/11 11.02
0
L1 C1
M1 P1
Dp427
500
2
CNS
1000
10 15 20
30 40
Dp260
G
2000
1500
45
Dp140
50
55
60
Dp116
kb
70
79
Dp71
Figur 1.13.Alternative promotorer. Skitse af dystrofin-genet (DMD) med angivelse af de otte forskellige promotorer
som betinger genets cellespecifikke ekspressionsformer. verste delfigur viser promotorernes positioner i det over 2.000
kb store gen. Pilene angiver transkriptionsstart og -retning. Bogstavsymbolerne angiver det vv den pgldende promotor er aktiv i: L lymfocytter, C hjernebark (cortex cerebri), M muskelceller, P purkinjeceller (lillehjernen), R retina, CNS
centralnervesystemet, S schwannske celler. G str for generel og er aktiv i mange andre celler end skeletmuskelceller
(hjerne, retina, nyre, lever, lunge samt hjertemuskelceller). Den nederste delfigur viser en skitse af genet med exons og
introns indtegnet sammen med de fire af promotorerne fra verste delfigur. Det er den aktive promotor der afgr transkriptionsstart. Dp-symbolerne refererer til de forskellige genprodukters strrelse i kDa (kilodaltons). Jo lngere inde i genet
transkriptionen starter, jo mindre bliver genproduktet.
Efter afslutningen af transkriptionen modificeres ogs transkriptets 3-ende idet den frnvnte polyadenyleringssekvens i 3 UTR
(hyppigst sekvensen 5-AAUAAA-3, Fig. 1.6)
binder et enzymkompleks der formidler fraspaltning af den sidste del af transkriptet, ved
klvning af molekylet ca. 30 nukleotider nedstrms for polyadenyleringssekvensen, og efterflgende polyadenylering. Polyadenylering bestr i en forlngelse af transkriptet ved syntese af
en 3-hale p ca. 200 adeninribonukleotider,
poly(A). Poly(A)-halen er af betydning for stabiliteten af mRNAet samt for dets transport ud af
kernen og efterflgende translation (se afsnittet
Translationen, s. 35).
Ligesom et gen kan have flere forskellige promotorregioner, kan det have mere end t polyadenyleringssignal, og alternativ polyadenylering
er endnu en mde hvorp forskellige celler kan
danne forskellige mRNA-molekyler ud fra
samme gen.Typisk er der tale om alternative polyadenyleringssekvenser i 3 UTR og dermed
om dannelse af mRNA-molekyler med forskellige lngder af denne sekvens. Dette kan have
betydning for hvilke mikro-RNAer der kan
30
25139-book.indb 30
09/12/11 11.02
1 2
Pr-mRNA
1 2 3
13
31
25139-book.indb 31
09/12/11 11.03
-tropomyosin-gen
A
3
5
5
3 DNA
Transkription + splejsning
5
Muskel-mRNA
3 Glat muskel-mRNA
3 Fibroblast-mRNA
3 Fibroblast-mRNA
5
3
pA2
pA1
Gl. thyroidea
1
Calcitoningenet
Hjerne-mRNA
5a 5b
Neuronalt
vv
Neuronalt vv
Gl. thyroidea
Differentiel splejsning
og polyadenylering
mRNA
Cap
1 2 3
PolyA
Cap
1 2 3 5a 5b
PolyA
Translation
Polypeptidforstadium
Post-translationel
klvning
Polypeptid
Calcitonin
CGRP
Figur 1.15.Skitse af alternativ splejsning med cellespecifikke splejsningsmnstre. A. Skitse af genet for proteinet
alfa-tropomyosin og dets forskellige cellespecifikke alternativt splejsede primre transkripter. I skitsen angiver de helt
lyse felter genets introns. Den isoform af proteinet der syntetiseres i muskelceller, er involveret i muskelkontraktion, mens
de andre celletypers isoformers rolle er uklar. De sm pile angiver polyadenyleringssekvenser. B. Cellespecifik alternativ
polyadenylering og splejsning af calcitoningenets transkript. pA1 og pA2 angiver polyadenyleringssekvenser der anvendes
i hhv. gl. thyroidea og nervevv. Det funktionelle protein, calcitonin, som syntetiseres i gl. thyroidea kodes af exon 4,
mens genproduktet CGRP (calcitonin-gen-relateret protein) i nervevv kodes af 5-delen af exon 5 (5a).
RNA-editering
Ved RNA-editering (RNA editing) forstr man
en enzymatisk betinget deaminering af bestemte
baser i visse transkripter. Lrebogseksemplet er
deaminering af et ganske bestemt cytosin (C) til
uracil (U) i mRNA for apolipoprotein B (apoB).
Dette protein syntetiseres i leveren og i tarmepitel. I leveren har proteinet en lngde p 4.563
aminosyrer, mens det i tarmepitel kun er knap
halvt s langt. Forklaringen er at der ved RNAeditering i tarmepitelet skabes et translationsstop tidligt i apoB-mRNA idet der sker en dea-
32
25139-book.indb 32
09/12/11 11.03
Frste base
Anden base
Tredje base
Translation og posttranslationelle
modifikationer
Ribosomer
Den mRNA-baserede proteinsyntese finder
sted p cytoplasmatiske organeller der betegnes
ribosomer. Det er store ribonukleoproteinkomplekser (ca. 70 % RNA og 30 % protein) som
hver bestr af en lille og en stor underenhed (su
bunit). Den type RNA der indgr i ribosomerne,
betegnes ribosomalt RNA (rRNA). Mitokondrierne har deres eget translationsapparat som
vil blive omtalt p s. 48 i afsnittet mtDNAmolekylet og dets funktion. Den flgende beskrivelse glder translationen af nuklert kodet
mRNA.
33
25139-book.indb 33
09/12/11 11.03
Trebogstavkode
tbogstavkode
Alanin
Ala
Arginin
Arg
Asparagin
Asn
Asparaginsyre
Asp
Cystein
Cys
Fenylalanin
Phe
Glycin
Gly
Glutamin
Gln
Glutaminsyre
Glu
Histidin
His
Isoleucin
Ile
Leucin
Leu
Lysin
Lys
Methionin
Met
Prolin
Pro
Selenocystein
Sec
Serin
Ser
Threonin
Thr
Tryptofan
Trp
Tyrosin
Tyr
Valin
Val
Der indgr fire forskellige slags rRNA i ribosomerne, betegnet hhv. 5S, 5,8S, 18S og 28S
rRNA. Tre af disse (28S, 5,8S og 5S rRNA)5
indgr, sammen med ca. 50 forskellige proteiner,
i ribosomets store subunit, og det fjerde (18S
rRNA) indgr, sammen med ca. 30 forskellige
proteiner, i den lille subunit.Vha. udtalt intramolekylr baseparring er rRNA-molekylerne fol-
tRNA
5 S str for Svedberg som er enheden for sedimentationsrate ved ultracentrifugering. Raten afhnger bl.a. af molekylernes strrelse. De fire rRNAer er hhv. ca. 120, 160,
1.900 og 4.700 nukleotider lange. Theodor Svedberg
(1884-1971) var en svensk kemiker; han fik nobelprisen i
kemi i 1926, bl.a. for sin opfindelse af ultracentrifugen.
34
25139-book.indb 34
09/12/11 11.03
Translationen
Det er altafgrende for translationen at den begynder det rigtige sted i mRNA-sekvensen, dvs.
ved den proteinkodende sekvens startcodon. Et
segment af en nukleotidsekvens kan i princippet
lses i tre forskellige lserammer, men kun n af
dem er rigtig, nemlig den der er defineret af
startcodon (som flge heraf har nysyntetiserede
polypeptider methionin som N-terminal aminosyre, Fig. 1.10B og C).
Translationen af mRNA sker fra startcodon i
retningen 53, og proteinsyntesen tilsvarende i
retningen fra N-terminal aminosyre (fri aminogruppe) mod C-terminal (fri carboxylgruppe).
Den AUG-triplet der er startcodon, er oftest den
35
25139-book.indb 35
09/12/11 11.03
Posttranslationelle modificeringer
Efter translationen sker der forskellige former
for kemiske ndringer af polypeptidet, skaldte
posttranslationelle modificeringer, som er ndvendige for at opn det modne slutprodukt, fx et
aktivt enzym. Ud over fraspaltning af den Nterminale methionin kan der vre tale om fraspaltning af et lngere N-terminalt peptid, idet
en rkke proteiner syntetiseres som lngere
forstadier til det endelige funktionelle protein,
fx med en N-terminal sekvens der har den
funktion at f proteinet importeret til mitokondrierne eller eksporteret fra cellen. Andre vigtige posttranslationelle modificeringer kan best i
tilhftning af fx kulhydratgrupper (glykosylering) eller fosfatgrupper (fosforylering) eller i
oxidering af aminosyrer, fx lysin og prolin i collagen til hhv. hydroxylysin og hydroxyprolin, eller to cysteiner under dannelse af en disulfidbro.
I tilflde af at der pga. codon- eller splejsningsmutation syntetiseres et protein med en
forkert aminosyresekvens, vil proteinmolekylet
evt. vre ustabilt, fx fordi det ikke kan danne den
normale stabile rumlige struktur, og hurtigt blive
nedbrudt via et af cellens kvalitetskontrolsystemer, se ubikvitinylering Fig. 13.1, s. 234.
Ikkekodende RNA
Man har lnge kendt til gener i det nuklere
genom hvis slutprodukter er funktionelle ikkeproteinkodende RNA-molekyler (skaldt ikkekodende RNA, ncRNA; eng. non-coding RNA).
Fx rRNA og tRNA der har centrale funktioner
i protein-syntesen (Fig. 1.10), samt snRNA og
snoRNA der indgr i modningen af primre
transkripter, hhv. pr-mRNA og pr-rRNA
(Tabel 1.4). Inden for de seneste 10 r har man
karakteriseret nye former for ncRNA som er
vigtige aktrer i reguleringen af genekspression.
Det har vist sig at 90 % eller mere af det humane genom transkriberes, og at de nyopdagede transkripter omfatter tusindvis af ikke-
Mikro-RNA
Mikro-RNA (miRNA, miR) er samlebetegnelse for korte ncRNA-molekyler p 20-23 nt
som er involveret i regulering af genekspression
p det posttranskriptionelle niveau. Det er sm
interfererende RNA-molekyler (siRNA, eng.
small interfering RNA) der virker ved at en sekvens p 6-8 baser (kaldet seed-sekvensen, eng.
seed, fr, kim) i molekylets 5-ende baseparrer
med komplementre sekvenser i mRNAs 3
UTR.
Et givet mikro-RNA kan have flere mRNAml, og resultatet af dannelsen af miRNA/
mRNA-komplekserne er typisk det at translationen af det pgldende mRNA standser, evt.
at mRNAet nedbrydes. P den mde kan
mange geners ekspression reguleres p en gang.
Man har pvist ca. 900 mikro-RNA-gener i
det haploide genom, men forskningsfeltet er i
rivende udvikling, og det sknnes at der er
mindst 1.000. Mange af generne transkriberes af
RNA-polymerase II, ligesom de proteinkodende gener, hvorfor det primre transkript (primiRNA) undergr bde capping og polyadenylering; andre transkriberes af RNA-polymerase
III, den samme RNA-polymerase som transkriberer tRNA- og 5S rRNA-generne.
Ved udtalt intern baseparring danner et primiRNA en dobbeltstrenget struktur med loop
(hrnlestruktur) der i cellekernen processeres
til et kort dobbeltstrenget miRNA-forstadium,
pr-miRNA, som eksporteres til cytoplasmaet.
36
25139-book.indb 36
09/12/11 11.03
IKKEKODENDE RNA
Repetitivt DNA
Over halvdelen af genomet udgres af gentagne
DNA-sekvenser (repetitivt DNA) som enten
kan vre moderat eller kraftigt repeterede. De
inddeles i tre overordnede grupper: 1) intersper
sed repeats (Tabel 1.5), hvor de individuelle repeterede enheder er fordelt over hele genomet
p en tilsyneladende tilfldig mde, 2) tandem-repeteret DNA (Tabel 1.6), hvor de repeterede enheder ligger i forlngelse af hinanden
i blokke af forskellige lngder, og 3) segmentale duplikationer.
37
25139-book.indb 37
09/12/11 11.03
Undergrupper
Antal
typer
Funktion
Genorganisation
Ribosomalt RNA
(rRNA)
120-4700 nt
Mitokondrielle,
12S rRNA og
16S rRNA
1 af hver
To nabogener i mtDNA
(Fig. 1.17)
Cytosoliske
5S RNA, 5,8S RNA,
18S RNA, 28S RNA
1 af hver
rDNA-klynger p de
akrocentriske kromosomers korte arme
Transfer RNA
(tRNA)
70-80 nt
Mitokondrielle
22
Enkeltkopi-gener.
Cytosoliske
49
700 tRNA-gener og
-pseudogener fordelt
over genomet
Sm nuklere RNAer
(snRNA)
60-360 nt
Splejsosom-familie:
U1,U2,U4,
U5, U6, U11, U12
Ikke splejsosomassocieret: U7
mange
Modning af histon-pr-mRNA
Enkeltkopi-gener
C/D-klassen
(bestemte sekvenser flles)
246
Beliggende i introns af
proteinkodende gener
Sm nukleolre RNA er
(snoRNA)
60-300 nt
Beliggende i introns af
proteinkodende gener
Sm Cajal-legeme-RNAer
(scaRNA)
25
Beliggende i introns af
proteinkodende gener
RNA-ribonukleaser
Enkeltkopi-gener
H/ACA-klassen
(bestemte sekvenser flles)
Mikro-RNA (miRNA)
22 nt
1000
Piwi-associeret RNA
(piRNA)
24-31 nt
89 individuelle
grupper
>15.000
89 genklynger fordelt i
genomet
Mange
?>10.000
Involveret i gen-regulation i
somatiske celler
Mange genklynger
fordelt i genomet
Mange
>3.000
Involveret i gen-regulation
og mono-allel ekspression (Xinaktivering, imprintning)
Enkeltkopi-gener,
TERC
Telomerase-komponent til
telomer-syntese
Enkeltkopi-gen p 3q26
BC200
Enkeltkopi-gen p 2p16
38
25139-book.indb 38
09/12/11 11.03
IKKEKODENDE RNA
Undertype
Strrelse p repeat-enhed
SINEs:
Short Interspersed
Nuclear Elements
Alu
MIR-familier
LINE-1 (Kpn)
LINEs:
Long Interspersed
Nuclear Elements
LINE-2
LINE-3
LTR-elementer:
Long Terminal Repeats ERV klasse I
ERV(K) klasse II
ERV(L) klasse III
MaLR
Andre DNAtransposoner
hAT
Tc-1
PiggyBack
Uklassificeret
Antal kopier
% af genomet
1.090.000
468.000
10
2
516.000
5-13
315.000
37.000
2,1
0,2
Middelstrrelse 1,3 kb
Middelstrrelse 0,5 kb
112.000
8.000
83.000
240.000
0,2
4
294.000
195.000
75.000
2.000
60.000
2,5
Varierende, men
middelstrrelse mske 0,25 kb
Middelstrrelse mske 0,4 kb
Interspersed repeats
0,8
25139-book.indb 39
09/12/11 11.03
Satellit 1 (AT-rigt)
Satellit 2 og 3
Strrelse
p repeatenhed
5-171 bp
Kromosomal lokalisation
6-64 bp
Telomer-familie
Hypervariabel familie og telomer-associerede repeats
6 bp
9-64 bp
Alle telomerer
Alle kromosomer, ofte tt p telomerer
1-4 bp
40
25139-book.indb 40
09/12/11 11.03
IKKEKODENDE RNA
pervariable minisatelliter rundt omkring i genomet, ofte nr telomererne. De frste hjvariable DNA-markrer man anvendte i retsgenetiske
undersgelser (DNA-profilanalyser), var minisatellitter som udgjorde restriktionsfragmentlngdepolymorfier, RFLPer (se afsnittet Genetiske
markrer og markranalyse, s. 77).
Mikrosatellit-DNA bestr af korte blokke
hvor den repeterede enhed oftest er 1-6 bp i
lngden. Det er karakteristisk for mikrosatellitterne at antallet af repeterede enheder kan ndres i forbindelse med skred under DNA-replikationen (replication slippage, Fig. 3.7) eller som
flge af en skv overkrydsning (Fig. 3.8). En
medicinsk srlig vigtig type af mikrosatellitter
er dem med en repeteret enhed p 3 bp, de skaldte trinukleotidrepeats, se afsnittene Repeatsygdomme (s. 287).
Den store variation i lngden af mange miniog mikrosatellitblokke gr dem til vigtige genetiske markrer (se Boks 3.2).
Mindre DNA-sekvensvariationer
cinsk vigtige i forbindelse med de skaldte trinukleotidrepeatsygdomme, mens mikrosatellitter med tetranukleotidrepeats har fundet stor
praktisk anvendelse som markrer inden for
retsgenetikken (DNA-profilanalyse) og ved
koblingsanalayse (s. 135 og Fig. 5.3A).
Indels: Insertion-deletion-polymorfier kan vre
af forskellig strrelse, typisk 100-1.000 bp, og
opstr som oftest som flge af insertion eller
deletion af en transposon. I skrivende stund har
man identificeret over 30.000 indels. De findes
spredt i genomet, i geners introns og exons samt
i deres promotorregioner. Dette betyder at de
kan pvirke genekspressionen samt proteiners
struktur og/eller funktion.
Enkeltnukleotid-polymorfier (SNPer, snips),
er, som navnet siger, DNA-sekvensvariationer
der omfatter et enkelt basepar, hvor der kan
vre substitution, insertion eller deletion. Man
har nu identificeret mere end 10 millioner
SNPer fordelt over genomet, og de er blevet
katalogiseret i en offentligt tilgngelig SNPdatabase. For r tilbage etableredes et internationalt konsortium med det forml at kortlgge
enkeltnukleotid-variationer i forskellige befolkningsgrupper, til brug for bl.a. undersgelser over deres evt. association med fnotypiske,
herunder sygdomsrelaterede, forandringer. Man
har i projektet bl.a. typet over 1 mio. SNPer i
DNA-prver fra individer i Afrika, USA, Kina
og Japan. Analyserne viste at der i hovedparten
af nukleotidpositionerne generelt set ikke er
stor variation, men at der i ca. 1 ud 300 bp forekommer hyppige variationer. Disse variationer
skyldes ikke nymutationer, men er opstet i lbet af menneskets evolution. I store populationsbaserede studier genomdkkende associationsstudier (genomewide association studies,
GWAS, s. 134) har man brugt dem som markrer til pvisning af en evt. genetisk kompo41
25139-book.indb 41
09/12/11 11.03
nent i udbredte sygdomme som diabetes mellitus, astma, Crohns sygdom og cancer (se Kap.
6).
Strukturelle genomiske variationer
42
25139-book.indb 42
09/12/11 11.03
Kromatider
13
12
11.2
11.1
11.1
11.2
12
21.1
21.2
21.3
22
23
q 24
9,5 Mb
6,0 Mb
7,0 Mb
25
8,0 Mb
600 nm
2 nm
4,5 Mb
5,5 Mb
3,0 Mb 1,5 Mb
8,5 Mb
8,0 Mb
4,5 Mb
7,5 Mb
600 nm 600 nm
Nukleosom
30 nm
Scaffold
Linker
DNAdobbelthelix
10 nm
30 nm
Kromatinfiber
10 nm
Figur 1.16. Pakning af DNA i cellekernen; fra dobbelthelix til metafasekromosom. Tegningen viser et idiogram af kromosom 17 i G-bndfarvning (400-bnds oplsning). Til venstre for kromosomet er anfrt bndnummereringen, og til hjre
for de omtrentlige lngder af DNA-segmenterne i de enkelte lyse og mrke bnd. Til hjre for idiogrammet er vist en
stiliseret tegning af DNAet i kromosomets to kromatider, til illustration af at hvert kromatid indeholder en enkelt DNAdobbelthelix. I kromatiderne er DNA-dobbelthelixerne pakket som illustreret i tegningens nederste del. Den omtrentlige
pakkeratio (lngdeforholdet mellem pakket og upakket DNA) er 1:10 for 10 nm-fiberen, 1:36 for 30 nm-fiberen og 1:
>10.000 for metafasekromosomet.
43
25139-book.indb 43
09/12/11 11.03
44
25139-book.indb 44
09/12/11 11.03
dring i cellerne under deres differentiering. Dette medfrer et stadig mere begrnset mnster i
hvilke gener der udtrykkes, og som kan modificeres af miljfaktorer. En celles epigenom kan
defineres som kombinationen af alle de kromatinmodifikationer der forekommer i den givne
celletype, og som bestemmer dens unikke genudtryk. Epigenomer er foranderlige gennem fx
vvs og organers udvikling, pvirkelige af miljfaktorer, ndret ved visse sygdomme og kan
vre forskellige selv hos individer med samme
genotype (bl.a. enggede tvillinger). I Tabel 1.7
er der givet en oversigt over de epigenetiske modifikationer histon-modifikationer og DNAmetylering som har betydning for aktive og
mindre aktive gener. Noget tyder p at processerne for DNA-metylering og histon-acetylering er koblede, men den nrmere biologiske
betydning heraf er endnu ikke klarlagt.
Histonmodifikationer betydning for kromatinkonformation og genekspression
Det er en ndvendig, men ikke tilstrkkelig, betingelse for at der kan ske genekspression at kromatinet findes i form af eukromatin. Det er bestemte modifikationer af histonerne som bestemmer kromatinets konformation. Histonerne kan
modificeres ved acetylering, metylering (mono,
di og tri) samt fosforylering. Det er en kombination af disse som bestemmer om kromatinet bestemte steder i genomet er i en ben eller i en
lukket form, men generelt set har eukromatin
(aktive gener, Tabel 1.7) hyperacetylerede histoner, mens heterokromatin er hypoacetyleret. Der
findes store familier af enzymer som er ansvarlige
for histon-modifikationerne.
Aktive gener
Inaktive gener
DNA-metylering
Hypometylering af promotor-regionen
Hypermetylering af promotor-regionen
Histon-acetylering
Acetylerede histoner
De-acetylerede histoner
45
25139-book.indb 45
09/12/11 11.03
Genernes ekspression eller aktivitet bestemmes af den mde hvorp nukleosomerne er pakket i hjereordens strukturer, dvs. den overordnede kromatinkonformation. Der findes to basale varianter: heterokromatin som er en lukket inaktiv konformation, og eukromatin som
er en ben potentielt aktiv konformation
(Boks 1.8). Heterokromatin kan vre konstitutivt, hvilket betyder at det bevarer den lukkede
struktur under hele cellecyklus. Dets DNA bestr isr af segmenter af repeterede DNA-sekvenser med kun f gener imellem. Heterokromatin kan ogs vre fakultativt, hvilket betyder
at den lukkede konformation er reversibel som
det for eksempel kan ses ved det inaktive Xkromosom fra den ene generation til den nste.
DNA-metylerings betydning for genekspressionen
DNA-metylering er den bedst beskrevne epigenetiske mekanisme til regulation af genekspressionen. Hos mennesket er der nsten udelukkenede tale om metylering af cytosin i C5-positionen i cytosin-guanin-sekvenser (CpG, s. 67).
Der findes omkring 30.000 steder i genomet
hvor der i et DNA-segment p 1-2 kb er en
ophobning af CpG-dinukleotider, skaldte
CpG-er. De forekommer ofte i husholdningsgenernes promotorregioner (s. 28) hvor de typisk er umetylerede i alle celletyper. G e n e re l t
kan det siges at ekspressionen af gener korrelerer
omvendt med hvor mange metylerede cytosinbaser der er i og omkring de regulatoriske omrder af genet. Aktive gener har f eller ingen
metylerede cytosiner (hypometylering) i deres
promotorregion, mens inaktive gener har mange metylerede cytosin-baser i og omkring promotorregionen (hypermetylering).
I normale celler foregr DNA-metylering
isr i d genomiske omrder som har repeterede
sekvenser ssom satellit-DNA, SINEs og LINEs
samt ved geners promotorregion og deres exon
1. Der findes ogs spredte CpG-sekvenser i
46
25139-book.indb 46
09/12/11 11.03
MITOKONDRIE-DNA (MTDNA)
Mitokondrie-DNA (mtDNA)
En somatisk celle indeholder flere hundrede,
evt. afhngigt af celletypen flere tusind mitokondrier, som igen hver isr indeholder op til
10 molekyler mtDNA. Der kan sledes forekomme mange tusind kopier af dette molekyle i
hver celle. For de modne knscellers vedkommende forholder det sig sdan at en gcelle indeholder op mod 100.000 mitokondrier, mens
en sdcelle i sit langt mindre cytoplasma-volumen kun indeholder 50-100 mitokondrier som
yderligere under normale forhold nedbrydes
efter befrugtningen.
47
25139-book.indb 47
09/12/11 11.03
Dette er baggrunden for at mitokondrieDNA nedarves via gceller, dvs. i rene kvindelinjer skaldt maternel arvegang (Kap. 5).9
Den forholdsmssigt hyppige forekomst af
sygdomsfremkaldende (patogene) mutationer i
mtDNA gr at ogs denne strrelsesmssigt beskedne del af genomet har betydelig medicinsk
vigtighed. Der er da ogs i det seneste rti sket
en strk stigning i antallet af patienter hvor man
har pvist en mtDNA-mutation som rsag til
deres sygdom, typisk af neuromuskulr art (s.
121). Det er derfor vigtigt at man som lge er
fortrolig med mitokondrie-DNA og patogene
mtDNA-mutationers kliniske manifestationer,
ligesom det ved udredning af familieanamnese
og fortolkning af stamtrer er vigtigt at vre
opmrksom p om de foreliggende oplysninger
er forenelige eller uforenelige med maternel arv
(se Kap. 5, Figur 5.1e og 5.1f).
Boks 1.9. Mitokondriers evolutionre
baggrund
Mitokondriers grundlggende molekylrbiologi
minder meget om forholdene hos bakterier og menes at afspejle at mitokondrierne er evolutionre
rester af en bakterieart som i eukaryoternes (de kerneholdige organismers) tidlige evolution blev optaget i en eukaryot og indgik i et symbiotisk forhold
med denne. Under rmillionernes udvikling af denne
symbiose menes strstedelen af den pgldende
bakteries genom gradvist at vre blevet overfrt til
eukaryotens cellekerne. En lille del af vores kernegenom er sledes efter al sandsynlighed fhv. mitokondriegenommateriale.
48
25139-book.indb 48
09/12/11 11.03
MITOKONDRIE-DNA (MTDNA)
Kontrolregionen
Val
12S
Phe
OH
16S
Cytb
Thr
Pro
H-strengen
Glu
ND6
Leu (UUR)
ND5
ND1
IIe
Met
Gln
ND2
Leu (CUN)
Ser (AGY)
His
Ala
Asn
Cys
Tyr
Trp
OL
CO I
ND4
L-strengen
Ser (UCN)
Asp
Lys
CO II
Arg
Gly
ND4L
ND3
CO III
ATPase 6
ATPase 8
Figur 1.17.Genetisk kort over menneskets mitokondrie-DNA (mtDNA). Det ringsluttede DNA-molekyles to strenge,
H- hhv. L-strengen, er tegnet som to koncentriske cirkler. Molekylets 37 gener er markeret som kasser (rRNA- og protein
generne) hhv. sm udfyldte cirkler (tRNA-generne) beliggende p den af de to strenge der er template ved syntesen af
genets funktionelle RNA-transkript. Gensymboler: 12S og 16S er generne for mitokondriernes to rRNA-molekyler, hhv. 12S
rRNA og 16S rRNA. ND1-ND6 er gener for subunits i enzymkomplekset NADH-dehydrogenase, COI-III er generne for subunits i enzymkomplekset cytokrom c-oxidase, ATPase6 og ATPase8 koder for subunits i ATP-syntase, og Cytb for cytokrom
b. De sm tRNA-gener er markeret med trebogstavkoden for den tilhrende aminosyre (Tabel 1.3). Leucin-tRNA (Leu) og
serin-tRNA (Ser) har hver to forskellige gener sv.t. deres to codon-familier (Tabel 1.2), jf. codon-angivelserne i de anfrte
parenteser (R = purin, Y = pyrimidin, N = purin el. pyrimidin). OH og OL angiver replikationsstart for hhv. den tunge og den
lette streng. Kontrolregionen er ikkekodende, men indeholder foruden OH separate transkriptionsstartsekvenser for de
to strenge samt to regioner med hjvariable sekvenser. Molekylets basepar nummereres fortlbende fra basepar nr. 1 (i
kontrolregionen) og frem, i retningen mod uret (pilen). (Adapteret fra Attardi G. The elucidation of the human mitochondrial genome. A historical perspective. BioEssays 1986;5:34-9).
Tabel 1.8Den genetiske kode for menneskets mtDNA.Forskelle fra standardkoden, Tabel 1.2
Codon
Standardkoden
mtDNA
AUA
Ile
Met
UGA
Trp
AGA
Arg
Stop
AGG
Arg
Stop
49
25139-book.indb 49
09/12/11 11.03
Sekvensvariation i mtDNA
Ved rutinemssig mtDNA-analyse vil man hos
de allerfleste personer kun pvise n mtDNAsekvens. Denne homogene tilstand betegnes homoplasmi; dette til forskel fra den sjldnere situation hvor der pvises to forskellige sekvenser,
skaldt heteroplasmi.
P populationsniveau er der til gengld tale
om en betydelig sekvensvariation mellem tilfldigt udvalgte individer; jo fjernere beslgtet
kvindelinjerne er, des strre er sekvensvariationen.
Den langt overvejende del af sekvensvariationen mellem individer er uden fnotypiske konsekvenser og betegnes derfor som normalgenetisk variation. Strstedelen af den normalgenetiske variation forekommer i to ca. 400 bp store
segmenter af kontrolregionen kaldet hypervariable regioner. Dertil kommer en del polymorfier i den kodende del af mtDNAet samt dn
lejlighedsvise variation der skyldes patogene
mutationer (disse vil blive omtalt i Kap. 5, se afsnittet Mitokondriesygdomme, side 121ff.).
Haplotyper og haplogrupper
En persons mtDNA-sekvens betegnes ogs vedkommendes mtDNA-haplotype. I forbindelse
med kortlgning af fordelingen af haplotyper
blandt Jordens forskellige etniske grupper har
man defineret en snes forskellige hovedgrupper
af haplotyper, kaldet haplogrupper. Disses sekvenser har kunnet indpasses i et sammenhngende overordnet stamtr for nutidsmenneskets
mtDNA med rdder i et flles stam-mtDNA
hos en kvinde i Afrika for anslet 150.000200.000 r siden, populrt kaldt den mitokondrielle Eva.
50
25139-book.indb 50
09/12/11 11.03
BETYDNING OG PERSPEKTIVER
Kromosomalt
DNA
Cellekernen
Mitokondrie
mtDNA
KerneTranskription proteiner
snRNA
cDNA
Transkription
Andre
proteiner
mRNA
rRNA
tRNA
rRNA
tRNA
mRNA
Ribosomproteiner
N
Protein
N ..... C
Eksport til andre
celler/vv
Translation
C
OXPHOS
Figur 1.18.Gen-ekspression i en celle, hhv. nuklere gener (kromosomalt DNA i cellekernen) og mitokondrielle gener
(mtDNA i mitokondrierne). I cellekernen dannes et primrt transkript som i cellekernen processeres til det funktionelle
RNA-molekyle. Bemrk at et transkript kan reverstranskriberes til DNA af viralt eller cellulrt kodet revers transkriptase.
DNAet kan efterflgende integreres i det kromosomale DNA. Mitokondrierne syntetiserer deres egne rRNA- og tRNAmolekyler samt mRNA til syntese af 13 proteiner der indgr i syntesen af ATP (den oxidative fosforylering, OXPHOS). De
mitokondrielle DNA- og RNA-polymeraser samt ribosomale proteiner, enzymerne i de mitokondrielle stofskifteprocesser
trikarboxylsyrecyklus, fedtsyreoxidationen og urinstofcyklus samt hovedparten af proteinerne i den oxidative fosforylering
kodes af nuklere gener og syntetiseres af cytosoliske ribosomer, hvorefter de importeres af mitokondrierne.
angiver posttranslationelle modifikationer ssom fx glykosylering og fosforylering.
Betydning og perspektiver
Allerede i 1969, dvs. 20 r fr det humane
genomprojekt (Human Genome Project, HGP)
blev sat i gang, foreslog den amerikanske kardiolog og humangenetiker Victor McKusick (Boks
1.11) at menneskets gener skulle kortlgges.
Han sammenlignede en kortlgning af menneskets arvemasse med 1500-tallets banebrydende
studier af menneskets anatomi og foruds at den
ville f en tilsvarende revolutionerende betydning for lgevidenskaben.
51
25139-book.indb 51
09/12/11 11.03
tropologi og arkologi (revolutionerende analyser af gammelt DNA). Dertil kommer biologisk grundforskning i almindelighed, hvor de
seneste rtiers eksponentielt voksende kortlgning af diverse biologiske arters genomer med
detaljerede molekylre data kraftigt har underbygget og detailbelyst dn biologiske evolution
som Charles Darwin (1809-82) for over 150 r
siden argumenterede solidt og modigt for. Sammenligninger med basesekvenser og aminosyresekvenser i hhv. gener og proteiner hos andre
arter er blevet vigtige i vurderingen af de sekvensvariationer der pvises ved DNA-analyse
af patienter og risikopersoner i den kliniske genetik (s. 79).
Analyser af individuelle genomer for tusindvis
af sekvensvariationer i form af SNPer og kopitalsvarianter i genomdkkende associationsstudier (GWAS, genomewide association studies, se
Kap. 6), mhp. afklaring af det genetiske grundlag
for en lang rkke komplekse sygdomstilstande,
har i de senere r sendt laviner af resultater ud i
faglitteraturen. Sidelbende har den teknologiske udvikling inden for molekylrgenetikken
bragt sekvensanalyse af hele genomet hos enkeltpersoner inden for praktisk rkkevidde12.
Med den voldsomme gning i mngden af molekylrgenetiske data bliver det en kmpe udfordring at fortolke den diagnostiske relevans af
dels de mange associationer mellem markrer
og sygdom der pvises ved de nvnte associationsstudier, dels de talrige sekvensvarianter som
genomsekventeringerne vil byde p.
Efter afklaringen af genomets struktur er den
store udfordring forstelsen af dets funktion. De
grundlggende principper og molekylrbiologiske detaljer i genekspression transkription
og translation er for lngst blevet udredt, men
12 Det forudses at en sdan analyse inden lnge vil kunne
udfres for under 10.000 kr. og p mindre end en uge. Til
sammenligning kostede tilvejebringelsen af den frste
genomsekvens 2,7 milliarder US dollars og tog 13 r.
52
25139-book.indb 52
09/12/11 11.03
BETYDNING OG PERSPEKTIVER
53
25139-book.indb 53
09/12/11 11.03