Medicinsk Genetik

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 49

Indhold

Indhold 5

Cellecyklus, mitose og meiose 55


Indledning 55

Forord 10
stamtrssymboler 12
Menneskets genom 15
Indledning 15
Det personlige genom og artens
genom 15
Generelt om arvemateriale 17

Cellecyklus 55
Mitosen 57
Meiosen 58
Meiosens faser i relation til
gametogenesen 60
Mitokondriernes forhold ved
celledelinger 61
Genetisk variation 65

DNA-replikation 18

Indledning 65

Arvematerialets funktion 20

Mutationers opsten 65

Proteinkodende gener 21

Mutationstyper 66

Transkription og posttranskriptionel

Genetiske markrer og

modificering 28
Den genetiske kode 33
Translation og posttranslationelle
modifikationer 33
Ikkekodende RNA 36

markranalyser 77
Normal variant eller patogen
mutation? 78
Beskrivelse af sekvensvariation p DNAog proteinniveau 79

DNAets organisering i cellekernen


kromatin og kromosomer 43

Cytogenetik og

Mitokondrie-DNA (mtDNA) 47

kromosomsygdomme 83

Betydning og perspektiver 51

Indledning: Den cytogenetiske


analyse 83
Den normale
kromosomsammenstning 83
Kromosomafvigelser 85

25139-book.indb 5

09/12/11 11.02

| INDHOLD

Mikrodeletionssyndromer og molekylr
cytogenetik 100
Referencer 103

Prnatal genetisk diagnostik 173


Formlet 174
Organisationen af den prnatale
genetiske diagnostik 174

Arvegange, monogene sygdomme og


mitokondriesygdomme 105
Dominans og recessivitet 108
Afvigelser fra klassiske
nedarvningsmnstre 116
X-bundet recessiv sygdom 119
Mitokondriesygdomme 121
Patogen mutation eller normal
variant? 124

Metoder til udtagning af ftalt vv 175


Diagnostisk ultralydscanning af
fosteret 177
Sygdomme og misdannelser der kan
pvises ved prnatal genetisk
diagnostik 178
Prnatal screening for Downs syndrom
(risikovurdering) 182
Indikationer for prnatal genetisk
diagnostik 186

Genetisk epidemiologi 127


Hvad er genetisk epidemiologi? 127
Genetisk-epidemiologiske metoder 127
Populationsgenetik 141

Rdgivning ved prnatal genetisk


diagnostik 189
Resultater af prnatal genetisk
diagnostik 190
Primplantationsdiagnostik 191

Multifaktoriel arv 147


Kvantitativ arv 147
Trskelmodellen 148

Prnatal genetisk diagnostik i


fremtiden 192
Supplerende litteratur 193

Folkesygdomme 150
Psykiatriske sygdomme 152

Postnatal genetisk screening 195

Bipolr affektiv sindslidelse 154

Indledning 195

Atopiske sygdomme 156

Teoretiske overvejelser 195

Inflammatoriske tarmsygdomme 157

Overordnede etiske overvejelser 196


Typer af postnatal screening 197

Genetisk rdgivning 163

Afslutning 199

Hvad er genetisk rdgivning? 163


Genetisk rdgivning i specielle
situationer 167
Specielle aspekter ved genetisk
rdgivning 168

25139-book.indb 6

09/12/11 11.02

| INDHOLD

Arvelige stofskiftesygdomme 201

Cancergenetik arvelig disposition

Genetisk og biokemisk patologi 202

for cancer 231

Abnorm kompartmentalisering pga.

Indledning 231

defekt membrantransport 207


get enzymaktivitet 208
Debutalder 210

Arvelig cancerrisiko 232


Cancer opstr ved en
flertrinsproces 233

Sygdomsmnstre 210

Onkogener 233

Sygdomsforlb 210

Tumorsuppressorgener (gatekeepers) 235

Dysmorfe trk 211

Caretakers 236

Screening 211

Cancer kan betragtes som en

Specifikke biokemiske/
molekylrgenetiske analyser 214
Prnatal diagnostik 214
Neonatalscreening 214
Dit 215

stamcelledefekt 237
Arvelighed ved de hyppigste former for
cancer 237
Monogen/syndromal arvelig disposition
for cancer 241

Enzymhmning 215

Risikoklassifikation: 242

Medikamentel reduktion af

Onkogenetisk udredning og

substrat 216
Medikamentel eliminering af
biprodukter 216
Vitaminer 216
Substitution 216
Medikamentel bedring af
enzymfunktion 217
Transplantation 217
Forebyggende foranstaltninger 218
Dysmorfologi 219
Isolerede misdannelser 223
Malformationssyndromer 224
Opslagsvrker 230

rdgivning 248
Den onkogenetiske konsultation 251
Litteratur 253
Cancercytogenetik 255
Indledning 255
De kromosomale sygdomsmekanismer
ved cancer 258
Hvordan opstr gentagne specifikke
kromosomforandringer? 259
Cancerstamcellen og dens betydning for
tumorudvikling 263
P hvilket tidspunkt i livet opstr
kromosomforandringer? 263
Er de erhvervede kromosomforandringer
tilstrkkelige til neoplastisk
udvikling? 264

25139-book.indb 7

09/12/11 11.02

| INDHOLD

Hvilke cytogenetiske metoder er bedst til

Follikulrt lymfom, diffust storcellet

at pvise neoplasi-relaterede

B-lymfom, mantle-celle lymfom,

forandringer? 264

Burkitts lymfom og MALT-

De maligne hmatologiske
sygdomme 265
Normal hmopoiese 265
Er abnorm hmopoiese tilstrkkeligt til
at medfre leukmi/lymfom? 267
Korrelation mellem morfologi, fnotype
og kromosomale rearrangementer. 269

lymfom 278
Modne T-celle- og NK-celleneoplasier 278
Aggressiv NK-celle-leukmi 278
Anaplastisk storcellet lymfom (ALCL),
ALK-positiv vs. ALK-negativ 278
Hodgkin-lymfom 278

Myeloproliferative neoplasier 270

Solide tumorer 279

Kronisk myeloid leukmi (CML) 270

Fremtidige perspektiver for

Myeloide og lymfoide neoplasier med

cancercytogenetikken 280

eosinofili og aberrationer i PDGFRA,


PDGFRB eller FGFR1 272
Myelodysplastiske syndromer/

Neurologiske og neuromuskulre
sygdomme 285

Myeloproliferative sygdomme (MDS/

Indledning 285

MPD) 272

Misdannelser 286

Myelodysplastiske syndromer (MDS) 273

Kromosomsygdomme 286

Akut myeloid leukmi (AML) og

Mitokondriesygdomme 286

relaterede precursor-neoplasier 273


Akut lymfatisk leukmi (precursor
lymfoide neoplasier) 275
B-celle-lymfoblastleukmi (B-ALL)/

Sygdomme med monogen


arvegang 286
Repeatsygdomme 287
Parkinsonisme 302

lymfom (B-LBL), uspecificeret 275


B-celle-lymfoblastleukmi (B-ALL)/

Mental retardering 307

lymfom (B-LBL) med gentagne

Indledning 307

genetiske forandringer 275

Intelligenskvotient 308

T-celle-lymfoblastr leukmi (T-ALL)/


lymfoblastisk lymfom (T-LBL) 276
Modne B-celle-neoplasier 276
Kronisk lymfatisk leukmi (CLL)/Small
lymphocytic lymphoma 276
Plasmacelle-neoplasier

Genetiske rsager til mental


retardering 309
Generelt om udredning og
gentagelsesrisiko ved mental
retardering 314
Litteratur 315

(myelomatose) 277
8

25139-book.indb 8

09/12/11 11.02

| INDHOLD

Genterapi 317

MLPA 340

Introduktion 317

MLPA methyleringsstatus 342

Generelle principper 317

Array-teknologier 344

Risici 323

Array-CGH 345

Fremtidige udviklinger og

SNP-array 346

perspektiver 323
Litteratur 325
Molekylrgenetisk diagnostik
metoder og teknikker 327
Indledning 327

Ekspressions-array 347
Nye sekventeringsteknologier 349
jebliksbillede af NGS (Next Generation
Sequencing) 349
Forfatteroversigt 359

Fragmentanalyse 332
Heteroduplex 333
SNP-analyse 334
Dynamiske mutationer 337

Ordliste 363
Stikordsregister 397

25139-book.indb 9

09/12/11 11.02

Forord
Nr man taler om menneskets arvelighedsforhold i et lgeligt perspektiv, skelner man gerne
mellem tre genetiske discipliner: humangenetik,
medicinsk genetik og klinisk genetik. Human
genetik er lren om menneskets arvemasse og
variationen heri. Medicinsk genetik er lren om
arvelige faktorers betydning for opstelsen af
sygdomme hos mennesket, og endelig kan man
definere klinisk genetik som den disciplin der
omhandler den praktiske udmntning af den
medicinsk genetiske viden i diagnostik og genetisk rdgivning. Denne lgelige udfordring
krver dels kendskab til de kliniske manifestationer af genetiske sygdomme, dels udvikling og
anvendelse af laboratoriediagnostiske analyser.
Det er formlet med nrvrende lrebog er at
give en indfring p dansk i nogle af de vigtigste
anvendelsesomrder inden for medicinsk og klinisk genetik, og ved udarbejdelsen af bogen har
fokus vret p klinisk relevans, samtidig med at
det biologiske og teoretiske fundament forklares.
Den primre mlgruppe for denne bog er medicinstuderende p 1. og 2. del, men det er vores
hb at bogen ogs vil finde anvendelse i det
postgraduate forlb, herunder i speciallgeuddannelserne.
Humangenetikken er en forholdsvis ung videnskabelig disciplin der, ligesom anden genetik, har sit grundlag i de arvelighedslove den
strig-ungarnske munk og naturforsker Gregor
Mendel opstillede i midten af 1860erne. Uden
at kende til det fysiske grundlag for arvematerialet beskrev han nedarvningsmnstrene for dominante og recessive egenskaber hos rteplanter,
og sluttede at de skyldes distinkte arvelige enhe-

der, Elemente; det vi kalder arveanlg eller gener.


Mendels arbejder forblev dog i mange r stort
set upagtede, men omkring r 1900 blev de
genopdaget, samtidig med at man nu fik fastere
grund under fdderne med hensyn til arveanlggenes lokalisation i cellen.
Siden opdagelsen i 1953 af arvemassens molekylre struktur (DNA-molekylets dobbeltspiral,
den skaldte Watson-Crick model) har udviklingen i vor viden om menneskets arvemasse
vret i en konstant ekspansiv fase. Denne udvikling nede et forelbigt klimaks i oktober
2004 med offentliggrelsen af den fuldstndige
kemiske opbygning af menneskets arvemasse, i
form af basesekvensen i menneskets DNA. Den
medicinske genetik anses i dag for en kerne
disciplin inden for biologi og lgevidenskab.
Den har muliggjort en fundamental ny indsigt i
rsag og patogenese ved arveligt betingede sygdomsprocesser, og fagets potentiale giver grundlag for meget store forventninger til den nre
fremtid. Hvis patienterne og deres familier til
fulde skal hste fordelene af vores voldsomt forgede genetiske viden er det helt ndvendigt, at
lger tilegner sig en forstelse af genetikkens
grundbegreber og den rolle som genetiske faktorer spiller for individets udvikling samt for opstelsen af sygdom.
Genetik som videnskab er baseret p en kraftfuld teori med stor forklaringsstyrke. Nglebegrebet er enheden et gen, navngivet af den danske plantefysiolog og genetiker Wilhelm Johannsen i 1909. Genet er enheden for oplagring,
viderefrelse samt omstning af den information, der er lagret i arvemassen, omend gen-be-

10

25139-book.indb 10

09/12/11 11.02

| FORORD

grebet har underget en ndvendig udvikling i


takt med kortlgningen af arvemassens struktur
og funktion. Andre genetisk vigtige grundbegreber, ligeledes indfrt i den internationale terminologi af Wilhelm Johannsen, er genotype (anlgsprg) og fnotype (fremtoningsprg).
I mange r udgjordes kerneomrdet for den
medicinske genetik af et raritetskabinet af monogene sygdomme som fx dvrgvkst, bldersygdom og seglcelleanmi; tilsammen nok et
stort antal sygdomme, men hver for sig ganske
sjldne. Det er siden blevet klart, dels at flertallet
af de almindeligt forekommende sygdomme
som reforkalkning, sukkersyge, cancer og skizofreni har meget vsentlige genetiske rsagskomponenter, dels at de genetiske sammenhnge i disse tilflde kun sjldent er s simple som
for de klassiske arvelige sygdomme. I mange
tilflde spiller genetiske faktorer en afgrende
rolle for tilbjeligheden til at udvikle en given
sygdom; i andre tilflde er genetiske faktorer
vsentlige elementer i organismens forsvar mod
at udvikle sygdom. Den medicinske genetik har
traditionelt vret tttest associeret med pdiatri, men som en flge af fagets udvikling er den
i dag relevant for alle lgevidenskabelige specialer, herunder ikke mindst neurologi, hmatologi, kardiologi, psykiatri og onkologi; hertil kommer obstetrikken som den kliniske genetik har
et nrt samarbejde med om fosterdiagnostikken.
Den videnskabelige udvikling inden for humangenetik og medicinsk genetik har p en bemrkelsesvrdig hurtig mde givet afkast til den
kliniske genetik. Sledes frte opdagelsen af enzymdefekten ved Fllings sygdom (fenylketonuri) i 1950erne umiddelbart til den frste
succesrige behandling af en arvelig sygdom.
Opdagelsen af menneskets kromosomtal i 1956
frte til diagnosen af den frste kromosomsygdom i 1959 (trisomi 21 ved Downs syndrom).
Et nyt gennembrud kom da prnatal diagnostik
af kromosomsygdomme og visse arvelige stof-

skiftesygdomme blev mulig i slutningen af


1960erne. Med udviklingen af rekombinant
DNA-teknologi og DNA-diagnostik i 1970erne og 1980erne kunne genetisk rdgivning nu
i mange tilflde baseres p sikre diagnoser og
ikke blot p udsagn om sandsynligheder og risiko. De seneste r har vi vret vidne til den
spde begyndelse af genterapi og mske af
strre praktisk betydning udviklingen af nye
lgemidler baseret p viden om sygdomsgener.
De nye muligheder for anvendelsen af forskningsresultaterne fra genetikken kan i befolkningen udlse svel skrkscenarier som urealistiske forventninger. Derfor er det vigtigt at der
til stadighed fres en bred debat om den nye
genetiks muligheder og de etiske aspekter heraf. Misbrug er altid en mulighed, men et demokrati med ben dialog er den bedste garant
herimod. Der er et stort behov for information
og uddannelse, bde af lgmand og professionelle. Vi hber at denne bog vil kunne bidrage
hertil.

De senere rs nrmest eksplosive udvikling inden for den humane og medicinske genetik
ndvendiggr en hyppig opdatering af lre
bger i faget. Den foreliggende 2. udgave af
Medicinsk Genetik er bde ajourfrt og udvidet i forhold til frste udgave. Bl.a. er der i 2.
udgave tilfjet et egentligt metodekapitel samt
en omfattende ordliste, og samtlige kapitler er
revideret og opdateret i overensstemmelse med
den udvikling faget har gennemlbet siden frste udgave kom i 2006. Bogen er tilstrbt at
vre pensumdkkende for undervisningen i
genetik p det medicinske studium i Danmark.
Oktober 2011
Sren Nrby og Peter K.A. Jensen

11

25139-book.indb 11

09/12/11 11.02

Stamtrssymboler

12

25139-book.indb 12

09/12/11 11.02

| STAMTRSSYMBOLER

13

25139-book.indb 13

09/12/11 11.02

25139-book.indb 14

09/12/11 11.02

Kapitel 1

Menneskets genom
Indledning
Levende organismer bestr af celler. Som en helt
central del af deres biologi har organismerne p
Jorden gennem rmillioners evolution udviklet
et molekylrt lager af information der styrer de
overordnede processer i cellerne. Den enkelte
organismes liv afhnger af at cellerne kan opbevare og afkode denne information samt viderefre den nr cellerne deler sig. For artens eksistens er det endvidere ndvendigt at informationen viderefres fra generation til generation.
Det er det biologisk arv drejer sig om, og denne
information betegnes genetisk information. De
molekyler der brer den genetiske information,
betegnes det genetiske materiale eller arvematerialet, og det samlede molekylre lager af genetisk information betegnes cellens/organismens
arvemasse eller genom. Efter en generel introduktion om genomet vil dette kapitel gennemg dels dets molekylre struktur og funktion,
dels dets organisering i cellerne.

Det personlige genom og artens genom


Nr man ser bort fra nggede tvillinger (og
andre flerlinger udviklet fra samme befrugtede
g), har vi hver vores eget personlige genom.
Det er sammensat af det arvemateriale vi har
fet fra vores biologiske forldre gennem de to
knsceller hvis fusionsprodukt vi er udviklet fra
(Kap. 2). Arvematerialet bestr af nukleinsyren
DNA (Boks 1.1. og 1.2). I cellerne er arvemassens DNA fordelt p dels cellekernen (det nuklere genom, kernegenomet), dels mitokon-

drierne (det mitokondrielle genom, mitokondriegenomet, s. 47ff.), Fig. 1.1. En persons nuklere genom udgres af kromosomernes
DNA-molekyler og er derfor diploidt (s. 55).
Dertil kommer mitokondriegenomet (mitokondrie-DNA, mtDNA) som i en celle foreligger i et meget varierende antal kopier, idet bde
antallet af mitokondrier, og antallet af mitokondrie-DNA-molekyler per mitokondrie, varierer
fra celle til celle.
Boks 1.1 Opdagelsen af DNA
I slutningen af 1860erne lagde schweizeren Johann
Friedrich Miescher (1844-95) grunden til udforskningen af nukleinsyrer med sin opdagelse af det der
skulle vise sig at vre DNA. Han studerede hvide
blodlegemer under et studieophold i den tyske universitetsby Tbingen. Udgangsmaterialet var pusfyldte bandager fra universitetshospitalets kirurgiske
afdeling. Herfra isolerede han cellekerner og ekstraherede en hidtil ubeskrevet hjmolekylr og fosforrig sur komponent som han navngav Nuklein (lat. nucleus, kerne). Senere foretog han, i hjembyen Basel,
yderligere ekstraktioner af det samme stof, denne
gang fra laksesd. Mieschers elev Richard Altmann
(1852-1900) forbedrede ekstraktionsmetoden og indfrte betegnelsen Nukleinsure (nukleinsyre) for den
oprensede komponent. Omkring r 1900 havde man
afklaret at nukleinsyre bestr af tre forskellige stofgrupper: fosfat, kulhydrat og nitrogenholdige baser.
Se mere om opdagelsen af DNA p http://www.karger.com/gazette/71/miescher/art_03.html

15

25139-book.indb 15

09/12/11 11.02

KAPITEL 1 | MENNESKETS GENOM

Cellekernen
(det nuklere
genom)

Mitokondrie
(mitokondriegenomet)
Menneskecelle

Figur 1.1.Elementr skitse af et tvrsnit af en celle


til illustration af lokaliseringen af dens arvemasse (genom). Genomet bestr af to distinkte dele: 1) det nuklere
genom, lokaliseret i cellekernens kromosomer, og 2) mitokondriegenomet, lokaliseret i mitokondrierne.

Nr man taler om menneskets genom, mener


man nutidsmenneskets, arten Homo sapiens
genom. I modstning til et individ har en art
ikke noget entydigt genom, men menneskets
genom kan defineres som det minimumsst af
DNA-molekyler der reprsenterer en normal
arvemasse hos mennesket. Det vil for det nu-

klere genoms vedkommende sige 24 DNAmolekyler som reprsenterer dem der er indeholdt i menneskets 24 forskellige kromosomer:
knskromosomerne X og Y samt de 22 autosomer (kromosomerne 1-22 inkl.) (Fig. 1.2 og
Kap. 4, s. 83). Dette betegnes det haploide
genom (haploid = med t kromosomst, s.
55).
En detaljeret kortlgning af det haploide humane genom, i form af fastlggelsen af basesekvenserne for de 24 kromosomale DNA-molekyler, blev ivrksat i 1990 med det store internationale Human Genome Project (HGP) og formelt erklret for afsluttet i april 2003, prcis 50
r efter gennembruddet med afklaringen af
DNAs dobbelthelix-struktur (Boks 1.4). Der
resterer endnu (2011) 6-7 % af det i alt ca. 3,1
mia. basepar lange genom, som det ikke er lykkedes at sekventere frdigt. Dette skyldes tekniske vanskeligheder, idet de pgldende DNAsegmenter hovedsageligt bestr af hjt repeteret
DNA, dvs. mange kopier af gentagne sekvenser.

Figur 1.2.Kromosombestningen hos en kvinde med normal karyotype (46,XX); se ogs Figur 4.1 og Boks 4.2. Prparatet er bndfarvet (Giemsa-farvning), med kromosomspecifikke lyse og mrke bnd langs de enkelte kromosomer, hvilket
muliggr den parvise anordning af kromosomerne. Tallene angiver de enkelte autosomale kromosompar 1-22, bogstaverne X og Y angiver pladserne for knskromosomerne.

16

25139-book.indb 16

09/12/11 11.02

GENERELT OM ARVEMATERIALE

Det drejer sig for strstedelens vedkommende


om DNA i skaldt konstitutivt heterokromatin
(Boks 1.8) der ikke indeholder aktive gener. I
den del af genomet der indeholder sekvenser af
aktive gener, dvs. DNA i de eukromatinholdige
dele af kromosomerne, har man kortlagt over 99
% af DNA-sekvensen, i alt 2,85 mia. bp (2,85
Gb), se Tabel 1.1 (for lngdeangivelse af nukleinsyremolekyler, se Boks 1.5).
For mitokondriegenomet har man siden 1981
haft en referencesekvens. Den frst offentliggjorte sekvens viste sig dog at have en del fejl
som blev endegyldigt rettet i 1999 (Boks 1.10).
Denne mtDNA-sekvens stammer fra t enkelt
individ.
Man har ved denne detaljerede kortlgning
fet indsigt i menneskets helt grundlggende
biologi. Samtidig har man fet en meget vrdifuld referencesekvens for menneskets DNA til
brug for det daglige DNA-diagnostiske arbejde
i de klinisk genetiske afdelingers molekylrgenetiske laboratorier.

Generelt om arvemateriale
Arvemateriale bestr af molekyler tilhrende
stofgruppen kernesyrer (nukleinsyrer). Det er
kdemolekyler (polymerer) opbygget af enheder betegnet nukleotider. Der skelnes mellem to
slags nukleinsyre: deoxyribonukleinsyre, ogs
kaldet DNA (eng. tidligere Deoxyribose Nucleic
Acid, nu deoxyribonucleic acid), og ribonukleinsyre,
ogs kaldet RNA (eng. tidligere Ribose Nucleic
Acid, nu ribonucleic acid). Alle cellulre organismer fra de simpleste bakterier til de mest
komplekse planter og dyr, herunder mennesket
har nukleinsyren DNA som arvemateriale.
Blandt virus, som er biologiske strukturer med
arvemateriale, men ikke selvstndigt levende
organismer, har mange arter ligeledes DNA som
arvemateriale (DNA-virus), andre har RNA
(RNA-virus).

Boks 1.2 Det frste bevis for DNA som


arvemateriale
I 1944 offentliggjorde den amerikanske mikrobiolog
Oswald T. Avery (1877-1955) og medarbejdere forsgsresultater som viste at en stamme af harmlse
bakterier kunne ndres blivende til sygdomsfremkaldende ved at optage DNA fra en sygdomsfremkaldende stamme. Denne skelsttende pvisning af
DNA som brer af genetisk information var dog ikke
tilstrkkelig til i sig selv at overbevise det videnskabelige samfund om at arvemateriale generelt bestr
af DNA (se Boks 1.4).

Den grundlggende kemiske forskel mellem


DNA og RNA ligger i molekylernes kulhydrat
som i DNA er deoxyribose, i RNA ribose (Fig.
1.3, Boks 1.3), heraf nukleinsyrernes navne. I
begge nukleinsyrer indgr der fire forskellige
nukleotider, hver med deres nitrogenholdige
base. Purinbaserne adenin og guanin samt pyrimidinbasen cytosin er flles for DNA og RNA.
I RNA indgr desuden nukleotider med pyrimidinbasen uracil, mens DNA som fjerde base
har pyrimidinen thymin (5-methyluracil).
Boks 1.3 DNA og RNA
I begyndelsen af det 20. rhundrede var kalvebrisler
(thymus) og gr hovedkilderne til udvinding af nukleinsyre mhp. nrmere kemisk karakterisering. Kulhydratet i den grnukleinsyre man havde isoleret,
blev hurtigt identificeret som ribose, mens det tog
rtier at f fastlagt at det i nukleinsyren fra thymus
var deoxyribose. Konklusionen blev at de to nukleinsyrer var forskellige, hhv. hvad vi i dag betegner RNA
og DNA, og p den baggrund troede man i lang tid at
DNA var dyrerigets og RNA planterigets nukleinsyre.
Det var frst i 1930erne at det blev endeligt klarlagt
at bde plante- og dyreceller indeholder svel DNA
som RNA.

17

25139-book.indb 17

09/12/11 11.02

KAPITEL 1 | MENNESKETS GENOM

HOCH2 O
H
H

OH
H

OH OH

Ribose
B

HOCH2 O
OH H

HC

C
N

Deoxyribose

O
HC

OH
H

5'

3'
G
U
A
U
C

C
A
U
A
G

O
H3C

NH
C

C
HC

C
N

NH
C

Uracil

Thymin

Figur 1.3.Strukturelle forskelle mellem DNA og RNA. A. RNA indeholder kulhydratet ribose, mens DNA indeholder
2-deoxyribose. B. RNA indeholder basen uracil, DNA basen thymin (5-methyluracil). C. RNA-molekyler er polynukleotider
ligesom DNA-molekyler, med nukleotiderne koblet sammen af 3,5-fosfodiesterbindinger. I modstning til DNAet er cellernes RNA-molekyler i udgangspunktet enkeltstrengede, men det er essentielt for deres funktion at de kan baseparre
dels med sig selv, dvs. intramolekylrt som p skitsen her, dels med andre RNA-molekyler.

DNA-molekyler er polymerer af deoxyribonukleotider der danner linere kdemolekyler


(polynukleotider) med kovalent binding mellem
3-OH-gruppen i et nukleotids deoxyribose og
nabonukleotidets 5-fosfatgruppe (Fig. 1.4A).
Arvemassens DNA er endvidere dobbeltstrenget,
idet molekylerne bestr af to DNA-polynukleotider som er snoet omkring en flles akse i en
hjredrejet dobbelthelix (dobbeltspiral). De to
ender af en DNA-streng defineres som hhv. 5og 3-enden, hvor 5-enden er karakteriseret ved
en fri fosfatgruppe p den endestillede deoxyriboses 5-carbonatom, mens 3-enden har en fri
OH-gruppe p sin endestillede deoxyriboses
3-carbonatom. Strengene er modsat orienterede
(antiparallelle), idet 5-enden af den ene streng
ligger over for 3-enden af den anden. De to
strenge holdes sammen af hydrogenbindinger
mellem strengenes baser der p denne mde
danner molekylets basepar (Fig. 1.4B): adenin
(A) danner par med thymin (T), guanin (G) med
cytosin (C). De pgldende basepar, AT og GC,
er karakteriseret ved hhv. to og tre hydrogenbindinger mellem baserne. Som flge af baseparringerne er rkkeflgen af baserne (basesekvensen)

i et DNA-molekyles to strenge komplementre:


Sekvensen i den ene streng afspejler entydigt sekvensen i den anden. Dette er helt grundlggende for cellernes opformering og reparation af
DNA samt for det laboratoriemssige arbejde
med DNA.

DNA-replikation
Forud for en celledeling sker der en opformering af cellens DNA (Kap. 2, Fig. 2.1). Denne
proces, DNA-replikation, initieres ved bestemte
replikationsstartsekvenser (origins of replication)
og bestr af flgende trin:
1. Adskillelse af molekylets to strenge ved
brydning af baseparrenes hydrogenbindinger. Dette trin katalyseres af to typer af protein: helikaser og enkeltstrengsbindende
proteiner der hhv. bner dobbelthelixen og
holder den ben.
2. Syntese af korte RNA-strenge med DNAenkeltstrengene som skabeloner. For
RNA-syntese med DNA som skabelon
glder flgende baseparringsregler: guanin
parrer med cytosin, thymin i DNA parrer

18

25139-book.indb 18

09/12/11 11.02

DNA-REPLIKATION

O
O

H O
H C2 C 3H
1
4
C H H C
O 5
CH2
G
O

OH

O
A

T
5

T A

A
C

C G
T

H C
1
C H
2
H

HO
H
2
H C
1
C H
O

OH

C G
A T
A

CH2
O
5
C H
4
H 3C
O

H C
1
C H
2
H

CH2
O
5
C H
4
H 3C
O

T
5

O
P

T
H C
1
C H
2
H

HO P
O

N
N

N
N
N

N
O

Thymin

H
CH2

H O
2 3
H C C H
1
4
C H H C
O 5
CH2
A
O

O
3
C H
4
H C
5
CH2

HO

Hydrogenbindinger

C H
H C
3
O

C G
A T
C G
G C

T
C G

CH2

Adenin

Cytosin

N
H

Guanin

Figur 1.4.Et DNA-molekyles struktur. A. Til venstre er vist en modeltegning af et dobbeltstrenget DNA-molekyle (en
DNA-dobbelthelix). Det bestr af to DNA-strenge (polynukleotider) snoet omkring en flles akse s de danner en hjredrejet spiral. Strengene holdes sammen af hydrogenbindinger mellem baserne. Til hjre er vist den detaljerede opbygning
af de to polynukleotider, hvor nukleotiderne i hver DNA-streng er koblet sammen med 3,5-fosfodiesterbindinger, og baserne (A, G, C og T) er kovalent bundet til deoxyriboses carbonatom 1 og derudover via hydrogenbindinger til basepartneren i den anden streng. Pilene angiver strengenes orientering 53 og viser at de to strenge er modsat orienterede
(antiparallelle). B. DNAs to slags basepar: Adenin (A) danner par med Thymin (T), Cytosin (C) med Guanin (G) vha. hydrogenbindinger. Der er to hydrogenbindinger mellem A og T, og tre hydrogenbindinger mellem G og C.

med adenin i RNA, og adenin i DNA parrer med uracil i RNA. Den korte RNAstrengs rolle er at fungere som startmolekyle, primer, for den efterflgende DNA-

syntese. RNA-syntesen katalyseres af enzymet DNA-primase, en RNA-polymerase. I


modstning til DNA-polymeraser krver
RNA-polymeraser ikke nogen primer.
19

25139-book.indb 19

09/12/11 11.02

KAPITEL 1 | MENNESKETS GENOM

Boks 1.4 Opklaringen af DNAs


dobbelthelix-struktur.
I frste halvdel af 1900-tallet mente man at nukleinsyrer er opbygget af tetranukleotider, dvs. af gentagne enheder bestende af et af hver af de fire nukleotider som nukleinsyrebaserne reprsenterer.
Tetranukleotid-modellen understttede den opfattelse at de centrale stoffer i arvematerialet var proteiner, da kun de ville kunne rumme den tilstrkkelige variation; mske var DNA en slags sttteskelet
for proteinerne. Det blev der sat et stort sprgsmlstegn ved i 1944, da det pvistes at DNA fungerer
som arvemateriale i bakterier (Boks 1.2). Dette blev
fulgt op af fornyede kemiske studier af DNA, og i
slutningen af 1940erne offentliggjorde den strigskfdte biokemiker Erwin Chargaff (1905-2002) nye
mlinger af de fire baser i DNA fra forskellige kilder.
Resultaterne var uforenelige med tetranukleotidhypotesen, men viste samtidig at DNA indeholder lige
meget guanin og cytosin og lige meget adenin og
thymin (G/C = A/T = ca. 1); dette blev kendt som
Chargaffs regel. Derimod varierede forholdet (G+C)/
(A+T).
F r senere, i 1953, kom afklaringen af DNAs
molekylstruktur gennem et historisk bermt samarbejde mellem den amerikanske biolog James Watson (f. 1928) og den britiske fysiker Francis Crick

3. Syntese af nye DNA-strenge sker med udgangspunkt i RNA-primerne og med DNAenkeltstrengene som skabeloner. Her glder
DNA-baseparringsreglerne, og trinnet katalyseres af enzymet DNA-polymerase. Syntesen af en nukleinsyrestreng sker i retningen
53.
4. Afslutningsvis nedbrydes RNA-primerne, og
de derved opstede huller i DNA-strengene udfyldes med deoxyribonukleotider.
Processen katalyseres af DNA-polymerase.
Resultatet af DNA-replikationen er to dobbeltstrengede DNA-molekyler med samme
struktur som modermolekylet. I dattermolekylerne stammer den ene streng sledes fra modermolekylet, mens den anden er nysyntetiseret. DNA-replikationen karakteriseres derfor
som semi-konservativ.
Cellerne har flere forskellige DNA-polymeraser. I cellekernen foretages DNA-replikationen
af dels DNA-polymerase (der indgr i et multimert kompleks med DNA-primasen, se pkt. 2
ovenfor, og overtager syntesen efter denne), dels
DNA-polymerase der hurtigt aflser DNApolymerase . Mitokondrierne har deres egen
polymerase: DNA-polymerase (se s. 122).

(1916-2004) da det lykkedes dem at bygge en korrekt


model af et dobbeltstrenget DNA-molekyle, til dels
baseret p rntgenkrystallografiske data opnet af

Boks 1.5. Lngdeangivelse af DNA- og


RNA-molekyler

biofysikeren Rosalind Franklin (1920-58). Frst da de

Lngden af dobbeltstrenget DNA angives i basepar

lste sprgsmlet om baseparringer mellem adenin

(bp): 1.000 bp betegnes 1 kb (kilobase), 1 mio. bp

og thymin, hhv. guanin og cytosin, blev det klart at

betegnes 1 Mb (megabase) og 1 mia. bp betegnes 1

Chargaffs regel bunder i denne komplementaritet

Gb (gigabase). Lngden af enkeltstrenget nuklein-

mellem de to strenges basesekvenser. Molekylets

syre angives i antal nukleotider (nt).

dobbeltstrengede struktur med komplementre basesekvenser angav samtidig en umiddelbar mulighed for den opformering af molekylet til to prcise
kopier som arvematerialet skal kunne gennemg.
Efter dette gennembrud blev det efterhnden alment
accepteret at arvematerialet er DNA.

Arvematerialets funktion
Traditionelt beskrives arvemassen som bestende af diskrete strukturelle og funktionelle enheder kaldet arveanlg eller gener (Boks 5.1). Vi
vil derfor tage udgangspunkt i denne beskrivel-

20

25139-book.indb 20

09/12/11 11.02

PROTEINKODENDE GENER

Genom
DNA

Transkriptom
Transkription

Replikation

RNA

Proteom
Translation

Protein

Ikkeproteinkodende
funktionelt RNA

Figur 1.5.Skitse der viser flowet af den genetiske information i en celle. Genomet er cellens samlede genetiske information, transkriptomet er cellens samlede transkripter, og proteomet er den samlede gruppe af proteiner cellen syntetiserer. Angende ikkeproteinkodende funktionelt RNA se Tabel 1.4.

se, om end det hurtigt vil vise sig vanskeligt at


afgrnse et gen.
Den information der rummes i generne, udnyttes forskellige steder i og uden for cellen, samtidig med at genomet forbliver hvor det er. Det
problem lses ved at cellerne laver RNA-kopier
af genernes DNA og kanaliserer disse kopier
derhen hvor deres information udnyttes. Denne
RNA-syntese betegnes transkription1 (eng.
transcription, overskrivning; underforstet fra n
type nukleinsyre til en anden). Genet bliver
transkriberet, og det syntetiserede RNA-molekyle betegnes et transkript. P den baggrund har
man defineret et gen som bestende af det
DNA-segment der transkriberes, samt de sekvenser af basepar der regulerer transkriptionen.
Det er en helt central funktion for genomet at
kode for organismens proteiner der i form af enzymer og andre vigtige funktionsmolekyler er
ansvarlige for bl.a. de stofskifteprocesser der udgr livsfunktionerne. Det er da ogs kendskabet
til de proteinkodende gener der har strst betydning i den medicinske genetik idet, som det vil
fremg af senere kapitler i bogen, det er ndringer i disse gener og deres funktion der ligger til
grund for de mange forskellige kortlagte arvelige
sygdomme og for krftsygdomme. Gennemgan1 Bemrk at termen transkription i molekylrbiologi og genetik skrives med kun t s. Dette i modstning til retskrivningen inden for humaniora hvor man bruger termen transskription om fx overskrivning af en tekst fra t alfabet til et
andet, eller af et partitur fra en tonart til en anden.

gen af genomets opbygning og funktion vil derfor tage udgangspunkt i de proteinkodende gener og deres ekspression, dvs. hvordan de kommer til udtryk. Nyere forskning har vist at den
vrige del af genomet indeholder mange ikkeproteinkodende gener hvis genprodukter (ikkekodende RNA, s. 36) er strkt involveret i bl.a.
reguleringen af de proteinkodende geners ekspression. Denne gruppe af ikkekodende RNA
forventes at f stor betydning i den fremtidige
medicinske verden. I analogi med termen genom der betegner en celles/organismes arvemasse,
har man indfrt termerne transkriptom og proteom til at betegne en celles/organismes samlede
st af hhv. transkripter og proteiner. Mens alle
kroppens somatiske celler grundlggende har
samme genom, har de ca. 200 forskellige celletyper, som udgr kroppens forskellige vv og organer, i lbet af deres differentiering udviklet
hver deres transkriptom og proteom som basis
for deres karakteristiske struktur og funktion.

Proteinkodende gener
Den information der ligger i et proteinkodende
gen, er information om det pgldende proteins
aminosyresekvens. Der er tale om en fuldstndig
grundlggende information idet et proteins
aminosyresekvens afgr proteinmolekylets rumlige struktur og derigennem dets funktion. At
denne sekvensinformation kan rummes i genets
DNA (og i det tilsvarende RNA-transkript),
skyldes at der er en simpel, liner relation mel21

25139-book.indb 21

09/12/11 11.02

KAPITEL 1 | MENNESKETS GENOM

lem basesekvens (i et nukleinsyremolekyle) og


aminosyresekvens (i et protein), se Tabel 1.2.
Pga. den sproglige forskel mellem nukleinsyrer og proteiner, jf. udtrykket den genetiske kode, betragtes proteinsyntesen informationsmssigt som en oversttelse fra basesekvens til aminosyresekvens og betegnes i fagsproget en translation (dansk udtale; eng. translation, oversttelse).
Genets/transkriptets proteinkodende sekvens
translateres til proteinets aminosyresekvens.
Det pgldende informationsflow er resumeret i Fig. 1.5; translationsprocessen beskrives
nrmere senere (s. 33). Det transkript der bringer en kopi af genets proteinkodende sekvens
hen til det sted hvor translationen sker, betegnes
messenger-RNA eller blot mRNA (eng. messen
ger, bud, kurr).

Genstruktur exons og introns


Analyserne af det haploide genoms basesekvens
har vist at der er et sted mellem 20.000 og
25.000 proteinkodende gener i menneskets
genom. De varierer meget i strrelse og detailstruktur men har nogle grundlggende fllestrk (Fig. 1.11). Som model-gen for beskrivelsen af et proteinkodende gens struktur er her
valgt et af de sm proteinkodende gener: genet
for -globin, hmoglobinets -kde (Fig. 1.6,
se ogs s. 113). De frst kortlagte gener i menneskets genom, ogs hvad DNA-sekvensen angr, var netop de gener der koder for de forskellige hmoglobiners kder (Fig. 1.9).
Indtil 1977 var det den almindelige antagelse
at basesekvensen i et mRNA-molekyle er en tro
kopi af sekvensen i det pgldende gens ene
DNA-streng, blot med den forskel at mRNAet
har basen uracil i stedet for DNAets thymin.
Men da man efter genteknologiens gennembrud begyndte at kunne kortlgge genernes
faktiske strrelse, opdagede man at de allerfleste
proteinkodende gener indeholder mange flere
basepar end svarende til mRNAets basesekvens.

Dette skyldes at den sekvens der er reprsenteret i mRNA-sekvensen, p gen-niveau er delt


op i et antal delsekvenser (kaldet exons) der er
adskilt fra hinanden af kortere eller lngere sekvenser (kaldet introns) som ikke er reprsenteret i mRNAet, jf. Fig. 1.6.
Grnseovergangene mellem exons og introns
er karakteriseret ved bestemte sekvenser som er
meget ens i nsten alle proteinkodende gener.
Man taler sledes om konsensussekvenser for
hhv. 5- og 3-afgrnsningerne af introns. I den
DNA-streng hvis exonsekvenser er kopieret i
mRNA-sekvensen, begynder praktisk taget
samtlige proteinkodende geners introns med sekvensen GT i 5-enden, og de ender med AG i
3-enden. Som navnet konsensussekvens antyder, er der imidlertid tale om stor overensstemmelse i ogs andre af grnsesekvensernes positioner, se detaljer i Fig. 1.6. Dertil kommer en
tredje karakteristisk intronsekvens, den skaldte
forgreningssekvens (eng. branch site, ikke afbildet
i Fig. 1.6), som er en kort sekvens med et obligatorisk A lokaliseret ca. 30 baser fra intronens
3-ende. De nvnte sekvenser er af central betydning for dannelsen af et korrekt mRNA for
det pgldende gen, se afsnittet Transkription
og posttranskriptionel modificering nedenfor.
De frste og sidste exons i et proteinkodende
gen indeholder en kortere eller lngere sekvens
af basepar som ikke translateres og derfor betegnes UTR (eng. untranslated region, utranslateret
region), hhv. 5 UTR og 3 UTR (Fig. 1.6). En
UTR kan strkke sig over flere exons. Gennemsnitslngden for 5 UTR er ca. 170 bp,
mens den for 3 UTR er ca. fire gange strre. P
mRNA-niveau har UTR-sekvenserne forskellige funktioner: 5 UTR indeholder bl.a. en
sekvens der er afgrende for initieringen af

mRNAets translation; dels for hvilket nukleotid translationen starter ved dvs. hvor den proteinkodende sekvens begynder dels for om
translationen initieres hyppigt eller sjldnere (se

22

25139-book.indb 22

09/12/11 11.02

PROTEINKODENDE GENER

Promotorsekvenser

Transkriptionsstart

Transkriptionsstop

Exon 1

Exon 2

Exon 3

intron 1

-30
+1
TATA Cap ATG
box site startcodon

5'
3'

intron 2

-75
CCAAT
box

3'
5'

TAA
stopcodon

C
A
AAGGTGAGT

AATAAA
signal for trimning
og polyadenylering

(Y)n NYAGG

Konsensus-sekvenser for
5'- (donor) og 3'- (acceptor)
splejsningssignaler
Transkription
og capping
Cap Exon 1
5'
UTR

intron 1

Exon 2

intron 2

Det primre transkript


(pr-mRNA)

Exon 3

3'

UTR

Figur 1.6.Et proteinkodende gens struktur. Som eksempel er her vist en skitse af -globin-genets struktur, med regulatoriske promotorsekvenser lokaliseret opstrms for de proteinkodende sekvenser der begynder ved ATG.

afsnittet Translation og posttranslationelle modifikationer, s. 33). Derudover kan 5 UTR indeholde sekvenser der fungerer som bindingssteder for proteiner af betydning for mRNAets
stabilitet. 3 UTR indeholder dels en skaldt polyadenyleringssekvens, dels mlsekvenser for
mikro-RNA-betinget regulering af mRNAets
translation og evt. nedbrydning (se afsnittene
Transkription og posttranskriptionel modificering s. 28 og Mikro-RNA, s. 36).
De proteinkodende gener optager ca. 45 % af
genomet, men det er bemrkelsesvrdigt at det
er introns det meste, idet genernes samlede
exons, det man betegner organismens exom (jf.
genom, transkriptom og proteom), kun udgr
ca. 2 % af genomet. Den direkte proteinkodende
del af genomet udgr sledes mindre end 2 %.
I de resterende 98 % af genomet forekommer
der imidlertid tusindvis af DNA-segmenter
som sekvensmssigt er nrt beslgtede med
proteinkodende gener, men som pga. forskellige

mangler ikke er i stand til at kode for proteiner.


De betegnes pseudogener (se det flgende afsnit), og som navnet kan antyde, ans man dem
tidligere generelt for at vre uden funktion og
dermed noget overfldigt DNA (eng. junk
DNA) efterladt p evolutionens losseplads. De
senere rs funktionelle studier af genomet har
imidlertid vist at mindst en femtedel af pseudogenerne transkriberes.
Boks 1.6 Guinness-rekorder for gener
Det strste proteinkodende gen i menneskets genom
er dystrofin-genet, DMD (Duchenne muscular dystrophy, Duchennes muskeldystrofi, s. 293) som er beliggende p den korte arm af X-kromosomet. Det er
p ca. 2,4 Mb (2,4 mio. basepar) og har sit maksimale
udtryk i muskelceller hvor det med sine 79 exons koder for muskelproteinet dystrofin p 3.685 aminosyrerester (Fig. 14.3). Mutationer i DMD er rsag til de Xbundne muskelsvindssygdommene Duchennes mu-

23

25139-book.indb 23

09/12/11 11.02

KAPITEL 1 | MENNESKETS GENOM

skeldystrofi og Beckers muskeldystrofi. Et andet muskelprotein, titin, har med sine ca. 38.000 aminosyrerester rekorden som det strste protein der kodes for
i genomet. Genet, TTN, er p knap 300 kb og har det
strste antal exons (363), hvoraf en er den strst
kendte (lidt over 17 kb).

Pseudogener
Pseudogener er generelt ikkefunktionelle DNAsegmenter som ligner funktionelle gener. Man
skelner mellem processerede (eng. processed, forarbejdede) og ikkeprocesserede pseudogener. De
to typer pseudogener adskiller sig fra hinanden i
bde struktur og tilblivelse. Forskellen er den at
et ikkeprocesseret pseudogen minder meget om
det tilsvarende funktionelle gen idet det har en
tilsvarende exon/intron-struktur samt regulatoriske sekvenser som fx promotoren. Det antages
da ogs at vre opstet ved duplikation af det
funktionelle gen og efterflgende inaktiveret af
mutationer i DNA-sekvensen, jf. pseudogenerne
i globin-genklyngerne (Fig. 1.9). Hvis der kun er
tale om kopi af en mindre del af det funktionelle
gen, fx en enkelt exon, taler man om et genfragment.
Et processeret pseudogen indeholder hverken
intron- eller promotor-sekvenser. Det antages
derfor at vre dannet skaldt revers transkription, dvs. ved transkription af mRNA til DNA,
og efterflgende integrering af DNA-kopien i
genomet. Det kan i nogle tilflde ske at et processeret pseudogen transkriberes fordi det tilfldigvis er blevet sat ind tt p en promotor. I s
tilflde betegnes pseudogenet et retrogen. Det
autosomale gen for enzymet fosfoglyceratkinase
(PGK2) p kromosom 6p er formentlig et sdant retrogen. Det er interessant at ekspressionsmnstret for dette gen er meget forskelligt fra
det oprindelige X-bundne gens (PGK1). PGK2
udtrykkes kun i testes, mens PGK1 udtrykkes i
alle vrige vv. Den testisspecifikke ekspression

af PGK2 er formentlig en kompensatorisk reaktion p inaktivering af det X-bundne PGK1 i


det spermatogenetiske vv inden meiosen.

Genernes fordeling i genomet


Hvis de proteinkodende gener var jvnt fordelt i
genomet, ville der vre t gen pr. 125-150 kb
genomsekvens. Imidlertid er genttheden meget
varierende inden for et kromosom og fra kromosom til kromosom (Tabel 1.1). Subtelomer-regionerne, dvs. regionerne 100-300 kb centromert
for telomererne (se Fig. 1.7B), er de omrder i
genomet der har den strste gentthed. De fleste
geners transkriberede segmenter ligger i en vis
A

Kromatid

Centromer

Telomer
B
100-300 kb
Subtelomer
region

Telomerassocierede
repeats

12 kb
Telomer

5
3
..... AGGGTTAGGGTTAGGGTTAGGGTTAGGGTTAG

..... TCCCAATCCCAATCCCAATCCCAATCC
3
5

Figur 1.7. A. Skitse af et metafasekromosom. Kromosomet bestr af to kromatider der holdes sammen i den
region der betegnes centromeret. Regionerne i enderne af
kromatiderne betegnes kromosomets telomerer. B. Skitse
af et kromatids telomerregion. De terminale afsnit med ca.
12 kb DNA udgr telomeren. Centromert herfor ligger en
region med 100-300 kb DNA bestende af telomer-associerede repeats (Tabel 1.6), og yderligere centromert herfor ligger den skaldte subtelomerregion, en region der er
forholdsvis rig p gener. C. Skitse af et kromatid med angivelse af den ene telomerregion og et udsnit af det telomere DNAs basesekvens. DNAet bestr af et par tusind
tandemrepeterede enheder seks basepar (indrammet).

24

25139-book.indb 24

09/12/11 11.02

PROTEINKODENDE GENER

afstand fra hinanden, men man har ogs fundet


mange overlappende gener, isr i omrder med
hj gentthed. Nogle gange er overlappet partielt, mens det i andre tilflde er fuldstndigt. Fx
indeholder genet NF1 (det gen der i muteret
form er rsag til neurofibromatose type 1) i intron 35 tre mindre gener, OMG, EVI2A og
EVI2B (Fig. 1.8). Hvert af disse tre gener er igen
opdelt i egne exons og introns, og deres transkriptionsretning er den modsatte af vrtsgenets.
Der er ogs eksempler p at gener for ikkekodende RNA overlapper proteinkodende gener.
Den ulige fordeling af generne i genomet har
man kendt til siden opdagelsen af at Giemsafarvning af kromosomerne giver et kromosomspecifikt bndmnster (Fig. 1.2). Cytogenetiske undersgelser sammenholdt med kliniske
observationer tydede p at der var frre gener i
de mrke G-bnd og som flge heraf at genttheden i de lyse bnd mtte ligge over gennemsnittet for genomet. En forudsigelse som er blevet bekrftet ved kortlgningen af genomet.
De mange forskellige gener hos mennesket
kan for nogles vedkommende inddeles i multigen-familier og super-familier, afhngigt af om
de fungerer i samme funktionelle reaktionsveje
(pathways), og af om de har strre eller mindre
grad af sekvensidentitet. Som eksempler p multigen-familier, hvor generne ligger i relativt
ttte klynger (eng. clusters) og har et evolutionrt og funktionelt fllesskab, kan nvnes
histon-multigen-familien p kromosom 6p samt
- og -globin-generne p hhv. kromosom 16p
og 11p (Fig. 1.9). Globin-genklyngerne er efter
alt at dmme resultatet af gentagne duplikationer i lbet af hvirveldyrenes evolution gennem
de seneste 500 millioner r. Disse to klynger af
gener koder for hmoglobin-kder der udtrykkes p forskellige udviklingstrin fra det tidlige
embryon til det fdte individ. Til denne familie
hrer ogs genet for det muskelspecifikke globin, myoglobin, p kromosom 22q. Som eksem-

Neurofibromatose type 1-genet


Intron 35

5
3

3
5
EVI2B

OMG

EVI2A

5kb

Figur 1.8.Skitse af tre proteinkodende gener (OMG,


EVI2A og EVI2B) beliggende i genet NF1s intron 35. Som
skitseret har hvert af de tre sm gener exons og introns.
Generne er skitseret p deres template-streng, og pilene viser transkriptionsretningen. OMG = oligodendrocyte myelin glycoprotein; EVI2 = ectopic viral integration
site 2.

pel p en superfamilie, hvor generne i genomet


bde ligger spredt og i klynger, kan nvnes immunglobulin-gen-superfamilien der bestr af
gener p kromosom 6p (HLA-vvstype-antigen-komplekset), kromosomerne 7p, 7q og 14q
(T-celle-receptor-gener) og p kromosomerne
2p, 14q og 22q (gener for immunglobulinernes
tunge og lette kder).
-globin-genklyngen
Kromosom 16p
2 1 2 1

-globin-genklyngen
Kromosom 11p

5
0

20

40

3
60 kb

Figur 1.9.Genklyngerne for - og -globinfamilierne.


Begge klynger indeholder gener som udtrykkes p forskellige trin i udviklingen: - og -globingenerne udtrykkes
embryonalt, -globingenerne ftalt sammen med
-globingenerne, og sent ftalt aflser ekspression af
-globingenet -globingenerne, sledes at stort set kun
- og -globingenerne udtrykkes efter fdslen ved syntese af hmoglobin A (22, s. 113); -globingenet har et
lavt ekspressionsniveau, jf. hmoglobin A2 (22).
Genklyngerne indeholder flere pseudogener (hvide symboler).

25

25139-book.indb 25

09/12/11 11.02

KAPITEL 1 | MENNESKETS GENOM

Tabel 1.1 Det haploide humane genom. DNA-indhold samt antal gener i hvert kromosom.Fra National Center for
Biotechnology Information (NCBI), Human Genome Project, oktober 2010
Kromosom

Mb DNA

% af genomet

Samlede antal gener

Antal gener/Mb*

% af gener i alt

247

8,0

4.220

17,1

13,1

2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
X
Y

243
199
191
181
171
159
146
140
135
134
132
114
106
100
89
79
76
64
62
47
50
155
58
3.080

7,9
6,5
6,2
5,9
5,6
5,2
4,7
4,5
4,4
4,4
4,3
3,7
3,4
3,3
2,9
2,6
2,5
2,1
2,0
1,5
1,6
5,0
1,9
100,0

1.491
1.550
446
609
2.281
2.135
1.106
1.920
1.793
379
1.430
924
1.347
921
909
1.672
519
1.555
1.008
578
1.092
1.846
454
32.185

6,1
7,8
2,3
3,4
13,3
13,4
7,6
13,7
13,3
2,8
10,8
8,1
12,7
9,2
10,2
21,2
6,8
24,3
16,3
12,3
21,8
11,9
7,8
10,45

4,6
4,8
1,4
1,9
7,1
6,6
3,4
6,0
5,6
1,2
4,4
2,9
4,2
2,9
2,8
5,2
1,6
4,8
3,1
1,8
3,4
5,7
1,4
100,0

* Bemrk variationen i gen-ttheden p de enkelte kromosomer

Figur 1.10.Transkription og translation. A. Skitse af transkription af DNA, dvs. syntese af RNA med den ene DNA-streng
som skabelon (template). Syntesen foretages af en RNA-polymerase der rekrutteres til opgaven af specielle proteiner kaldet
transkriptionsfaktorer. Den sker i retningen 53, dvs. komplementrt til 35-retningen p den DNA-streng der fungerer
som template. B. Skematisk afbildning af princippet i translation af messenger-RNA (mRNA). Tre p hinanden flgende baser
i mRNA (en triplet) udgr en kodeenhed (codon) for en given aminosyre, jf. den genetiske kode (Tabel 1.2), og basesekvensen
afkodes i en ubrudt lseramme af ikkeoverlappende codons i retningen 53, begyndende ved startcodon (AUG, koder for
aminosyren methionin). Afkodningen formidles af aminosyrespecifikke ladede tRNA-molekyler vha. disses anticodon som
baseparrer med den tilsvarende codon (se flere detaljer i delfigur d samt i afsnittet tRNA, s. 34), og trin for trin kobles
aminosyrerne sammen ved etablering af peptidbindinger under dannelse af det pgldende polypeptid/protein. C. Skitse af
et translationsforlb. Translationen formidles af ribosomer, og man definerer tre delprocesser i translationen: initiering, elongering og terminering. Hvert af disse trin formidles og reguleres af forskellige proteiner samt af ribosomalt RNA, herunder
katalytisk aktivt rRNA (ribozym). Se flere detaljer i afsnittet Translationen, s. 35. D. tRNA-molekylers struktur, her illustreret
ved tRNA for aminosyren fenylalanin (tRNAPhe), dels i stiliseret todimensionel struktur (skaldt klverbladsform), dels p
skitseret naturtro tredimensionel form. Acceptor-armen (3-enden af molekylet) tilhftes den specifikke aminosyre, jf. anticodon (her 3-AAG-5 der kan parre med de to fenylalanincodons, se Tabel 1.2. I RNA kan G parre med bde C og U). De tomme
felter i klverbladsformens basesekvens angiver modificerede nukleotider af forskellig slags.

26

25139-book.indb 26

09/12/11 11.02

TRANSKRIPTION OG POSTTRANSKRIPTIONEL MODIFICERING

A. Transkription
RNA
3'

5'
3'

5'

3'
DNA-dobbelthelix

B. Translation
Methionin

Glycin

Serin

Glycin

Isoleucin

Alanin

Polypeptid

5'

Codons

C
3'
mRNA

C. Translationsforlb
Ribosom
5' A U G
U A C

Ribosom

G G C

U C C

A U G

Met

Met

1. Initiering

Ribosom

G G C
C C G

U C C
A G G

Gly

Ser

A G U
U C A

Phe

U C C 3'

U A A

Leu
Met Ser

2. Elongering

3. Terminering

D. Strukturen af transfer-RNA (tRNA)


2. Tredimensionel struktur

1. Klverbladstruktur

C
G
G
A
U
U
U

A 3'
C
C
A
C
G
C
U
U
A
A
C U
G A C A C

C
C
A
G

C
C U G U G
U
A G Variabel loop
G
G
U
C

5' G

G A
G

Loop 1
G G A

C U C

G A G C

A
C Loop 2 A
U
G A A

Anticodon

Loop 3 G

54
Loop 3

64

5'

76

4
72

69

20

12

Variabel loop
44

3'
Acceptorende

Loop 1

26
38

32
Anticodon-loop
(Loop 2)

Anticodon

27

25139-book.indb 27

09/12/11 11.02

KAPITEL 1 | MENNESKETS GENOM

Transkription og posttranskriptionel
modificering

transkriptionsfaktorer, betegnes promotorer


(igangsttere, af lat. promovere, stte i gang). Gener der koder for celle/vvsspecifikke proteiner, er karakteriseret ved en promotor betegnet
TATA-boksen (5-TATAAAA-3) beliggende
25-30 bp opstrms for transkriptionsstart, mens
de skaldte husholdningsgener, dvs. gener der
koder for proteiner i det flles basale intermedire stofskifte, er kendetegnet ved en eller flere
skaldte GC-bokse (5-GGGCGG-3) i varierende afstand fra transkriptionsstart. Et andet almindeligt promotor-element er den skaldte
CAAT- eller CAT-boks (5-CCAAT-3) 75-80
bp opstrms for transkriptionsstart. Samlet betegnes promotorsekvenserne genets promotorregion (Fig. 1.6 og 1.11).
Efter bindingen til promotor-regionen rekrutterer og aktiverer transkriptionsfaktorerne
den RNA-polymerase (RNA-polymerase II)
som transkriberer proteinkodende gener. Derudover kan der vre regulatoriske sekvenser lokaliseret lngere opstrms eller nedstrms, evt. i
en afstand af flere hundredtusind basepar fra

Princippet i en transkription er skitseret i Fig.


1.10A. Ligesom DNA-syntese sker RNA-syntese i retningen 53 med den ene af genets
DNA-strenge som skabelon (template-strengen),
men i modstning til DNA-polymeraser krver RNA-polymeraser ikke primer. Ved
transkriptionen skelnes der ikke mellem exons
og introns. Der syntetiseres sledes t langt
RNA-molekyle med en kontinuert basesekvens
af bde exons og introns, ligesom i genet. Dette
skaldt primre transkript er et forstadium til
mRNAet og betegnes pr-mRNA (Fig. 1.6).
Bortset fra at RNA har uracil hvor DNA har
thymin, er basesekvensen i pr-mRNAet lig
med sekvensen i den DNA-streng der er komplementr til template-strengen, og som derfor
ogs ofte kaldes den RNA-lignende streng.
Processen begynder med binding af skaldte
generelle transkriptionsfaktorer til bestemte sekvenser i kort afstand fra det segment der skal
transkriberes. Sekvenser der binder generelle
-globin

CAT 0

3
0,5

1,0

1,5

2,0 kb

TATA
HPRT

2 3

78 9

25

50 kb

GC-rig
Faktor VIII
1
0

2-6

7 - 13
50

14
100

15 - 22

23 - 25
150

26
200 kb

TATA

Figur 1.11.Skitser af tre forskellige proteinkodende gener. Bemrk de forskellige strrelsesskalaer (hhv. ca. 2 kb, 50
kb og 200 kb) og exon/intron-fordelinger. Genernes exons er nummererede. CAT, TATA og GC-rig angiver regulatoriske elementer i genernes promotorregioner, jf. Fig. 1.6.

28

25139-book.indb 28

09/12/11 11.02

TRANSKRIPTION OG POSTTRANSKRIPTIONEL MODIFICERING

Figur 1.12. Modelskitse af initieringskompleks ved transkription af et proteinkodende gen. Figuren illustrerer binding
af generelle transkriptionsfaktorer og RNA-polymerase II (den muselignende figur) til genets promotorregion (med TATAboks) samt stimulering af komplekset ved yderligere tilknytning af et aktivatorprotein, bundet til en enhancer-sekvens i
stor afstand fra promotorregionen, men bragt i fysisk nrhed af denne ved slyngedannelse (looping) af DNAet. Noget
tilsvarende glder for silencer-sekvenser og dertil knyttede transkriptionshmmende proteiner.

promotorregionen. Det er bindingssteder for skaldte specielle transkriptionsfaktorer som interagerer med RNA-polymerase-komplekset i
promotorregionen. At dette kan lade sig gre,
selv over store afstande, skyldes DNA-molekylernes fleksibilitet (looping, se Fig. 1.12). P den
mde kan de DNA-bundne specielle transkriptionsfaktorer fysisk n proteinkomplekset i promotorregionen og dermed pvirke rekrutteringen af RNA-polymerasen i positiv eller negativ
retning, dvs. fungere som det der betegnes en
hancers (positive; eng. forstrkere) hhv. silencers
(negative; eng. (lyd)dmpere).
Det er promotorerne der afgr hvilken DNAstreng der bliver skabelon for RNA-syntesen,
samt hvor syntesen skal begynde (transkriptionsstart, Fig. 1.6 og 1.12). Mange af de proteinkodende gener hos mennesket har to eller flere
alternative promotorregioner, typisk forskellige
mht. binding af vvs- og udviklingsstadiespecifikke transkriptionsfaktorer. Der er fx beskrevet
mindst 8 forskellige promotorer i dystrofin-genet, DMD (Fig. 1.13, Boks 1.6), hvor den promotor der er lokaliseret nrmest genets 3-ende

(den generelle promotor, G) er den mest aktive


i ikkemuskelceller, fx i hjernen. Alternativt promotorbrug er en af grundene til at forskellige
celletyper kan danne forskellige mRNAer og
dermed funktionelt forskellige isoformer af et
givet protein ud fra samme gen.

Capping og polyadenylering
Straks efter transkriptionens start modificeres
transkriptets 5-ende ved pstning af et guaninribonukleotid hvis 5-fosfat bindes til
transkriptets 5-fosfat hvorved 5-enden fr en
fri 3-OH-gruppe, ligesom 3-enden. Dette endestillede specielle nukleotid, der derefter metyleres i guanindelens position 7 (m7GpppN)2,
betegnes cap (eng. kasket). Etableringen af capen
kaldes capping og er et srkende for RNA syntetiseret af RNA-polymerase II. Capen beskytter molekylet mod enzymatisk nedbrydning og
har endvidere betydning for initieringen af
translationen.
2 m7G = 7-methyl-guanosin; p = fosfat; N = 5-nukleosidet
(base+ribose) i det umodificerede primre transkript.

29

25139-book.indb 29

09/12/11 11.02

KAPITEL 1 | MENNESKETS GENOM

0
L1 C1

M1 P1

Dp427

500
2

CNS

1000
10 15 20

30 40

Dp260

G
2000

1500
45

Dp140

50

55

60

Dp116

kb
70

79

Dp71

Figur 1.13.Alternative promotorer. Skitse af dystrofin-genet (DMD) med angivelse af de otte forskellige promotorer
som betinger genets cellespecifikke ekspressionsformer. verste delfigur viser promotorernes positioner i det over 2.000
kb store gen. Pilene angiver transkriptionsstart og -retning. Bogstavsymbolerne angiver det vv den pgldende promotor er aktiv i: L lymfocytter, C hjernebark (cortex cerebri), M muskelceller, P purkinjeceller (lillehjernen), R retina, CNS
centralnervesystemet, S schwannske celler. G str for generel og er aktiv i mange andre celler end skeletmuskelceller
(hjerne, retina, nyre, lever, lunge samt hjertemuskelceller). Den nederste delfigur viser en skitse af genet med exons og
introns indtegnet sammen med de fire af promotorerne fra verste delfigur. Det er den aktive promotor der afgr transkriptionsstart. Dp-symbolerne refererer til de forskellige genprodukters strrelse i kDa (kilodaltons). Jo lngere inde i genet
transkriptionen starter, jo mindre bliver genproduktet.

Efter afslutningen af transkriptionen modificeres ogs transkriptets 3-ende idet den frnvnte polyadenyleringssekvens i 3 UTR
(hyppigst sekvensen 5-AAUAAA-3, Fig. 1.6)
binder et enzymkompleks der formidler fraspaltning af den sidste del af transkriptet, ved
klvning af molekylet ca. 30 nukleotider nedstrms for polyadenyleringssekvensen, og efterflgende polyadenylering. Polyadenylering bestr i en forlngelse af transkriptet ved syntese af
en 3-hale p ca. 200 adeninribonukleotider,
poly(A). Poly(A)-halen er af betydning for stabiliteten af mRNAet samt for dets transport ud af
kernen og efterflgende translation (se afsnittet
Translationen, s. 35).
Ligesom et gen kan have flere forskellige promotorregioner, kan det have mere end t polyadenyleringssignal, og alternativ polyadenylering
er endnu en mde hvorp forskellige celler kan
danne forskellige mRNA-molekyler ud fra
samme gen.Typisk er der tale om alternative polyadenyleringssekvenser i 3 UTR og dermed
om dannelse af mRNA-molekyler med forskellige lngder af denne sekvens. Dette kan have
betydning for hvilke mikro-RNAer der kan

bindes til mRNAet, og dermed for molekylets


stabilitet i den pgldende celletype. I nogle geners transkripter kan en ekstra polyadenyleringssekvens vre lokaliseret opstrms for 3
UTR sledes at de alternative polyadenyleringer
resulterer i mRNAer med forskellige proteinkodende sekvenser. Alternativ polyadenylering
er fx afgrende for om en B-lymfocyt syntetiserer antistofmolekyler der fastholdes i cellemembranen (ustimuleret lymfocyt) eller udskilles
(antigenstimuleret lymfocyt).

Splejsning, herunder alternativ splejsning


Den mest dramatiske posttranskriptionelle proces er fjernelsen af transkriptets intronsekvenser,
samtidig med at exonsekvenserne samles til n
enkelt proteinkodende sekvens under dannelse af
det skaldt modne mRNA. Denne proces betegnes splejsning (eng. splicing) og formidles af et
splejsosom (eng. spliceosome), en ansamling af fem
ribonukleoproteinkomplekser, dvs. komplekser
af RNA og protein. Kompleksernes RNA-molekyler er forholdsvis sm (< 200 nt) og tilhrer
den familie af RNA der betegnes snRNA (small
nuclear RNA). De fem snRNA-protein-kom-

30

25139-book.indb 30

09/12/11 11.02

TRANSKRIPTION OG POSTTRANSKRIPTIONEL MODIFICERING

plekser har hver sit snRNA og betegnes hhv. U1,


U2, U4, U5 og U6 (U for uracil som deres snRNA-molekyler er rige p).3
Splejsningsprocessen er en kompliceret proces
som her kun skal resumeres groft. Den er baseret
p dels baseparring mellem snRNA og splejsningssekvenser (splice sites) i pr-mRNA samt
mellem splejsosomkompleksernes snRNA-molekyler indbyrdes, dels binding af forskellige hjlpeproteiner til pr-mRNA. Sammen med hjlpeproteinerne scanner splejsosomet pr-mRNAet, og herunder bindes primrt U1 og U2 til
hhv. splejsningssignalet ved 5-enden af introns og
forgreningssekvensen. Derefter rekrutteres de tre
vrige splejsosomkomplekser, og det samlede
splejsosom bliver katalytisk aktivt. Pr-mRNAet
klves i exon/intron-overgangen i intronens
5-ende der kovalent bindes til forgreningssekvensens A hvorefter intron/exon-overgangen i
3-enden klves, og de flankerende exons splejses
sammen. Mutationer der pvirker splejsningen,
udgr en vsentlig del af de patogene mutationer, se afsnittet Splejsningsmutationer, s. 70.4
Mange pr-mRNAer bliver splejset p to eller flere forskellige mder hvorved forskellige
exon-kombinationer bliver inkluderet i det frdige transkript, typisk ved at en eller flere exons
udsplejses samtidig med introns, evt. at dette
glder den ene af to p hinanden flgende
exons der sledes optrder alternativt i mRNAmolekylerne. Fnomenet betegnes alternativ
splejsning og har til resultat at samme primre
transkript bliver ophav til flere forskellige slags
mRNA. Alternativ splejsning er den vigtigste
rsag til at organismen kan danne mange flere
3 U3 er involveret i splejsning af pr-rRNA.
4 Det homologe gen hos mennesket, DSCAM, blev fundet
frst. Det er beliggende p kromosom 21q og har vret
sat i forbindelse med Downs syndrom, jf. genets navn
som er et akronym af den betagnelse man har givet det
protein genet koder for: Downs syndrome cell adhesion
molecule.

forskellige proteiner end der er proteinkodende


gener (Fig. 1.14 og 1.15).
Ligesom alternativt promotorbrug og alternativ polyadenylering reguleres alternativ splejsning af forskellige proteiner som kan fremme
eller hmme udnyttelsen af splejsningssekvenserne for de enkelte exons. Det forhold at sdanne regulerende proteiner udtrykkes forskelligt i forskellige celletyper, bevirker at der bliver
tale om cellespecifikke splejsningsprofiler og
derigennem cellespecifikke mRNA-profiler
(transkriptomer) og proteinprofiler (proteomer)
sv.t. uddifferentieringen af forskellige celletyper.
Ud over at resultere i dannelse af forskellige
protein-isoformer kan alternativ spejsning resultere i forskelle i mRNA-molekylernes UTRsekvenser. Dette kan have stor funktionel betydning pga. 3 UTRs tidligere omtalte rolle i den
mikro-RNA-betingede regulering af genekspressionen posttranskriptionelt (s. 23).
Potentialet for alternativ splejsning fremgr
bl.a. af en analyse af det neuronspecifikt udtrykte gen Dscam hos bananfluer4 hvor man har pvist at dets pr-mRNA potentielt kan splejses
p ca. 38.000 forskellige mder hvilket giver
mulighed for en cellespecifikt udtrykt isoform
af det pgldende protein (et celleadhsionsmolekyle) i hvert af nervesystemets neuroner.

1 2

Pr-mRNA

1 2 3
13

Figur 1.14.Skitse af alternativ splejsning hvor det ene


mRNA indeholder exons 1 og 2, men ikke 3, medens det
andet indeholder exons 1 og 3, men ikke 2. Til hjre i figuren er skitseret hvorledes de resulterende proteiner kan
have forskellige rumlige strukturer der kan afspejle funktionelt forskellige proteiner pga. deres forskellige funktionelle domner.

31

25139-book.indb 31

09/12/11 11.03

KAPITEL 1 | MENNESKETS GENOM

-tropomyosin-gen

A
3
5

5
3 DNA
Transkription + splejsning
5

Muskel-mRNA

3 Glat muskel-mRNA

3 Fibroblast-mRNA
3 Fibroblast-mRNA

5
3

pA2

pA1

Gl. thyroidea
1

Calcitoningenet

Hjerne-mRNA

5a 5b

Neuronalt
vv

Neuronalt vv

Gl. thyroidea
Differentiel splejsning
og polyadenylering
mRNA

Cap

1 2 3

PolyA

Cap

1 2 3 5a 5b

PolyA

Translation
Polypeptidforstadium

Post-translationel
klvning

Polypeptid
Calcitonin

CGRP

Figur 1.15.Skitse af alternativ splejsning med cellespecifikke splejsningsmnstre. A. Skitse af genet for proteinet
alfa-tropomyosin og dets forskellige cellespecifikke alternativt splejsede primre transkripter. I skitsen angiver de helt
lyse felter genets introns. Den isoform af proteinet der syntetiseres i muskelceller, er involveret i muskelkontraktion, mens
de andre celletypers isoformers rolle er uklar. De sm pile angiver polyadenyleringssekvenser. B. Cellespecifik alternativ
polyadenylering og splejsning af calcitoningenets transkript. pA1 og pA2 angiver polyadenyleringssekvenser der anvendes
i hhv. gl. thyroidea og nervevv. Det funktionelle protein, calcitonin, som syntetiseres i gl. thyroidea kodes af exon 4,
mens genproduktet CGRP (calcitonin-gen-relateret protein) i nervevv kodes af 5-delen af exon 5 (5a).

RNA-editering
Ved RNA-editering (RNA editing) forstr man
en enzymatisk betinget deaminering af bestemte
baser i visse transkripter. Lrebogseksemplet er
deaminering af et ganske bestemt cytosin (C) til
uracil (U) i mRNA for apolipoprotein B (apoB).

Dette protein syntetiseres i leveren og i tarmepitel. I leveren har proteinet en lngde p 4.563
aminosyrer, mens det i tarmepitel kun er knap
halvt s langt. Forklaringen er at der ved RNAeditering i tarmepitelet skabes et translationsstop tidligt i apoB-mRNA idet der sker en dea-

32

25139-book.indb 32

09/12/11 11.03

DEN GENETISKE KODE

Den genetiske kode


Et proteins aminosyresekvens bestemmes af basesekvensen i det pgldende mRNAs proteinkodende segment, sledes at tre p hinanden
flgende baser koder for en given aminosyre, jf.
Tabel 1.2. De tre baser siges at udgre en triplet,
og den sledes kodende enhed betegnes en codon. De fire forskellige baser i RNA muliggr i
alt 64 forskellige tripletter. Heraf fungerer de 61
som aminosyrecodons, den ene AUG (codon
for methionin) ogs som startcodon, dvs. den
frste triplet i den proteinkodende sekvens.
Tripletterne UAA, UAG og UGA fungerer
som stopcodons, dvs. at det er en af dem der
markerer afslutningen p den proteinkodende
sekvens (se dog Tabel 1.2 vedrrende undtagelser for UGA).
To af aminosyrerne (methionin og tryptofan)
har kun n codon, de fleste har to eller fire, men
tre aminosyrer (leucin, serin og arginin) har seks
codons. I mRNAet fastlgger startcodon den
lseramme (eng. reading frame) der benyttes ved
translationen, idet aflsningen sker kontinuert
triplet for triplet (se Fig. 1.10C samt afsnittet
Translationen).

Tabel 1.2 Den genetiske standardkode

Frste base

Anden base

Tredje base

minering af cytosinet i codon nr. 2.153 s denne


ndres fra CAA (codon for aminosyren glutamin) til UAA (en stopcodon) (Tabel 1.2; mht.
codon-begrebet, se afsnittet Den genetiske
kode nedenfor).
En anden type RNA-editering er deaminering af adenin til hypoxanthin (adenosin til inosin). Dette er isr pvist i forbindelse med syntese af mikro-RNAer (s. 36) hvor man har fundet at en sdan RNA-editering af de dobbeltstrengede forstadier kan resultere i ndret stabilitet (nedbrydning) eller specificitet (ndret
mlsekvens).

Den genetiske standardkode er dn genetiske kode der


glder for de allerfleste arters nuklere genom. Den
blev dechifreret i 1960erne.
For mitokondriegenomets genetiske kode se Tabel 1.8.
Kode-enheden betegnes en codon og bestr af tre baser,
her gengivet p mRNA-niveau. Basesekvensen i en codon
er orienteret 53. I tabellen er anfrt trebogstavkoderne for de aminosyrer de forskellige codons/codonfamilier koder for, se Tabel 1.3 (side xx).
Tre af tripletterne UAA, UAG og UGA er stopcodons,
dog fungerer UGA i et lille antal nuklere geners mRNA
som codon for den selenholdige aminosyre selenocystein.

Translation og posttranslationelle
modifikationer
Ribosomer
Den mRNA-baserede proteinsyntese finder
sted p cytoplasmatiske organeller der betegnes
ribosomer. Det er store ribonukleoproteinkomplekser (ca. 70 % RNA og 30 % protein) som
hver bestr af en lille og en stor underenhed (su
bunit). Den type RNA der indgr i ribosomerne,
betegnes ribosomalt RNA (rRNA). Mitokondrierne har deres eget translationsapparat som
vil blive omtalt p s. 48 i afsnittet mtDNAmolekylet og dets funktion. Den flgende beskrivelse glder translationen af nuklert kodet
mRNA.

33

25139-book.indb 33

09/12/11 11.03

KAPITEL 1 | MENNESKETS GENOM

Tabel 1.3 Tre- og tbogstavkoder for de 21aminosyrer


der indgr i translationen
Aminosyre

det op i meget kompakte tredimensionelle


strukturer der stabiliseres af proteinmolekylerne
og gr ribosomet katalytisk aktivt (Boks 1.7).
Der findes flere hundrede 5S rRNA-gener, de
fleste i genklynger p kromosom 1. De tre vrige
rRNA-molekyler (18S, 5,8S og 28S) udsplejses
fra hhv. 5-enden, midten og 3-enden af prrRNA, et ca. 13.000 nukleotider langt transkript
af et gen der i diploide celler foreligger i ca. 400
kopier fordelt p genklynger i DNAet i de korte arme af de akrocentriske kromosomer.

Trebogstavkode

tbogstavkode

Alanin

Ala

Arginin

Arg

Asparagin

Asn

Asparaginsyre

Asp

Cystein

Cys

Fenylalanin

Phe

Glycin

Gly

Glutamin

Gln

Glutaminsyre

Glu

Boks 1.7 Ribozymer

Histidin

His

Splejsning er et af mange eksempler p at RNA kan

Isoleucin

Ile

Leucin

Leu

Lysin

Lys

Methionin

Met

Prolin

Pro

Selenocystein

Sec

Serin

Ser

Threonin

Thr

Tryptofan

Trp

Tyrosin

Tyr

Valin

Val

Der indgr fire forskellige slags rRNA i ribosomerne, betegnet hhv. 5S, 5,8S, 18S og 28S
rRNA. Tre af disse (28S, 5,8S og 5S rRNA)5
indgr, sammen med ca. 50 forskellige proteiner,
i ribosomets store subunit, og det fjerde (18S
rRNA) indgr, sammen med ca. 30 forskellige
proteiner, i den lille subunit.Vha. udtalt intramolekylr baseparring er rRNA-molekylerne fol-

katalysere forskellige kemiske processer, enten alene


eller i samspil med proteiner. Katalytisk aktive RNAmolekyler og ribonukleoproteinkomplekser betegnes
ribozymer (ribonukleinsyre-enzymer). Splejsosomer
og ribosomer er eksempler p vitale ribozymer.

Inden udsplejsningen modificeres transkriptet


massivt ved dels metylering af ribosens 2-OH i
ca. 100 af nukleotiderne, dels isomerisering af ca.
100 af uridin-nukleotiderne til pseudouridinnukleotider (ndret binding mellem uracil og
ribose). Bde disse modifikationer og udsplejsningen af de tre rRNA-molekyler formidles af
forskellige ribonukleoproteinkomplekser med
sm RNA-molekyler der betegnes snoRNA
(small nucleolar RNA), fordi disse processer finder
sted i den struktur i cellekernen der betegnes
nukleolen (nucleolus, kernelegemet). Det er
ogs her ribosomernes ribonukleoproteinkomplekser efterflgende samles.

tRNA
5 S str for Svedberg som er enheden for sedimentationsrate ved ultracentrifugering. Raten afhnger bl.a. af molekylernes strrelse. De fire rRNAer er hhv. ca. 120, 160,
1.900 og 4.700 nukleotider lange. Theodor Svedberg
(1884-1971) var en svensk kemiker; han fik nobelprisen i
kemi i 1926, bl.a. for sin opfindelse af ultracentrifugen.

Ud over mRNA og rRNA indgr der en tredje


speciel kategori af RNA-molekyler i translationen: tRNA (transfer-RNA eller transport-RNA),
som er de RNA-molekyler der bringer aminosyrerne til mRNAet. For hver af de aminosyrer

34

25139-book.indb 34

09/12/11 11.03

TRANSLATION OG POSTTRANSLATIONELLE MODIFIKATIONER

der indgr i proteinsyntesen, er der mindst t


specifikt tRNA mindst to for de aminosyrer
der har mere end fire codons (Tabel 1.2); for
aminosyren methionin er der to forskellige
tRNAer, hvoraf det ene er specifikt for initieringen af translationen og derfor betegnes initiator-tRNA. I alt er der i cellerne ca. 50 forskellige tRNAer, kodet af i alt ca. 500 gener i genomet. Genernes umiddelbare transkripter, prtRNA, gennemgr en rkke ndringer i form
af trimning og kemisk modificering af bestemte
nukleotider, og de modne tRNAer er sm
kompakte molekyler (ca. 80 nukleotider lange)
der vha. interne baseparringer er foldet op i en
karakteristisk ensartet rumlig form (Fig. 1.10D).
Aminosyren esterbindes via sin carboxylgruppe til sit tRNAs 3-OH-gruppe under dannelse
af aminoacyl-tRNA (ladet tRNA). Dette formidles af en aminoacyl-tRNA-syntase, et enzym der specifikt genkender bde den rigtige
aminosyre og det rigtige tRNA. Den pgldende aminosyres rette placering under proteinsyntesen sker ved baseparring mellem de tre baser i
aminosyrens codon i mRNAet og en triplet af
uparrede baser i det ladede tRNA, den skaldte
anticodon (Fig. 1.10B og C).

Translationen
Det er altafgrende for translationen at den begynder det rigtige sted i mRNA-sekvensen, dvs.
ved den proteinkodende sekvens startcodon. Et
segment af en nukleotidsekvens kan i princippet
lses i tre forskellige lserammer, men kun n af
dem er rigtig, nemlig den der er defineret af
startcodon (som flge heraf har nysyntetiserede
polypeptider methionin som N-terminal aminosyre, Fig. 1.10B og C).
Translationen af mRNA sker fra startcodon i
retningen 53, og proteinsyntesen tilsvarende i
retningen fra N-terminal aminosyre (fri aminogruppe) mod C-terminal (fri carboxylgruppe).
Den AUG-triplet der er startcodon, er oftest den

der er nrmest mRNAets 5-ende, men kun


hvis den er markeret af de rigtige omgivelser som
fremgr af den konsensussekvens for translationsstart man har pvist: 5-RccAUGG-3 (Kozaksekvensen), hvor R betyder purin (A eller G) og
AUG er startcodon. Aet i startcodon er sledes
den frste base i den proteinkodende sekvens og
gives positionen +1. For at virke som et strkt
startsignal skal sekvensen omkring startcodon
vre som konsensussekvensen, dvs. der skal bde
vre en purin i position -3 (der er ingen position
0) og et G i position +4. De to Cer i positionerne -1 og -2 er ikke s afgrende hvorfor de
skrives med smt i konsensussekvensen.
Proteinsyntesen kan som proces inddeles i tre
trin (Figur 1.10C): 1) Initiering (start), hvor der
dannes et initieringskompleks bestende af den
lille ribosom-subunit, ladet initiator-tRNA og
mRNA. Den store ribosom-subunit tilknyttes
ikke fr det ladede initiator-tRNA har fundet
startcodon i mRNAet. Dannelsen af initieringskomplekset krver forskellige initieringsfaktorer,
bl.a. for binding af mRNAet til den lille ribosom-subunit via dets cap og for fysisk tilnrmelse
mellem capen og mRNAets poly(A)-hale, hvilket stimulerer initieringen og muligvis ogs genbruget af ribosomerne efter endt translation. 2)
Elongering (forlngelse, dvs. syntese af proteinets aminosyrekde). Denne proces bestr af
codon-genkendelse (binding af ladet tRNA),
etablering af peptid-binding (katalyseret af 28S
rRNA, se Boks 1.7) og afslutningsvis forskydning translokering af mRNAet sv.t. tre nu
kleotider; dette trin krver elongeringsfaktorer.
3) Termineringen (stop) er det sidste trin og indledes nr der optrder en stopcodon i lserammen. En stopcodon kan ikke baseparre med nogen af tRNA-molekylerne, men genkendes af et
bestemt protein, en fristningsfaktor (eng. release
factor), hvis binding til translationskomplekset bevirker at det syntetiserede polypeptid frigres.

35

25139-book.indb 35

09/12/11 11.03

KAPITEL 1 | MENNESKETS GENOM

Posttranslationelle modificeringer
Efter translationen sker der forskellige former
for kemiske ndringer af polypeptidet, skaldte
posttranslationelle modificeringer, som er ndvendige for at opn det modne slutprodukt, fx et
aktivt enzym. Ud over fraspaltning af den Nterminale methionin kan der vre tale om fraspaltning af et lngere N-terminalt peptid, idet
en rkke proteiner syntetiseres som lngere
forstadier til det endelige funktionelle protein,
fx med en N-terminal sekvens der har den
funktion at f proteinet importeret til mitokondrierne eller eksporteret fra cellen. Andre vigtige posttranslationelle modificeringer kan best i
tilhftning af fx kulhydratgrupper (glykosylering) eller fosfatgrupper (fosforylering) eller i
oxidering af aminosyrer, fx lysin og prolin i collagen til hhv. hydroxylysin og hydroxyprolin, eller to cysteiner under dannelse af en disulfidbro.
I tilflde af at der pga. codon- eller splejsningsmutation syntetiseres et protein med en
forkert aminosyresekvens, vil proteinmolekylet
evt. vre ustabilt, fx fordi det ikke kan danne den
normale stabile rumlige struktur, og hurtigt blive
nedbrudt via et af cellens kvalitetskontrolsystemer, se ubikvitinylering Fig. 13.1, s. 234.

Ikkekodende RNA
Man har lnge kendt til gener i det nuklere
genom hvis slutprodukter er funktionelle ikkeproteinkodende RNA-molekyler (skaldt ikkekodende RNA, ncRNA; eng. non-coding RNA).
Fx rRNA og tRNA der har centrale funktioner
i protein-syntesen (Fig. 1.10), samt snRNA og
snoRNA der indgr i modningen af primre
transkripter, hhv. pr-mRNA og pr-rRNA
(Tabel 1.4). Inden for de seneste 10 r har man
karakteriseret nye former for ncRNA som er
vigtige aktrer i reguleringen af genekspression.
Det har vist sig at 90 % eller mere af det humane genom transkriberes, og at de nyopdagede transkripter omfatter tusindvis af ikke-

kodende RNAer. Nogle er lange, dvs. >200 nt,


og betegnes lncRNA (udtales link-RNA; eng.
long non-coding RNA), andre er ganske korte
(20-30 nt; miRNA og piRNA), se de flgende
afsnit. Mens sknnet over antallet af proteinkodende gener stagnerer eller ligefrem falder,
bliver der nu fundet flere og flere ncRNA-
gener. Disse har forskellige strrelser og mange
forskellige funktioner (Tabel 1.4).

Mikro-RNA
Mikro-RNA (miRNA, miR) er samlebetegnelse for korte ncRNA-molekyler p 20-23 nt
som er involveret i regulering af genekspression
p det posttranskriptionelle niveau. Det er sm
interfererende RNA-molekyler (siRNA, eng.
small interfering RNA) der virker ved at en sekvens p 6-8 baser (kaldet seed-sekvensen, eng.
seed, fr, kim) i molekylets 5-ende baseparrer
med komplementre sekvenser i mRNAs 3
UTR.
Et givet mikro-RNA kan have flere mRNAml, og resultatet af dannelsen af miRNA/
mRNA-komplekserne er typisk det at translationen af det pgldende mRNA standser, evt.
at mRNAet nedbrydes. P den mde kan
mange geners ekspression reguleres p en gang.
Man har pvist ca. 900 mikro-RNA-gener i
det haploide genom, men forskningsfeltet er i
rivende udvikling, og det sknnes at der er
mindst 1.000. Mange af generne transkriberes af
RNA-polymerase II, ligesom de proteinkodende gener, hvorfor det primre transkript (primiRNA) undergr bde capping og polyadenylering; andre transkriberes af RNA-polymerase
III, den samme RNA-polymerase som transkriberer tRNA- og 5S rRNA-generne.
Ved udtalt intern baseparring danner et primiRNA en dobbeltstrenget struktur med loop
(hrnlestruktur) der i cellekernen processeres
til et kort dobbeltstrenget miRNA-forstadium,
pr-miRNA, som eksporteres til cytoplasmaet.

36

25139-book.indb 36

09/12/11 11.03

IKKEKODENDE RNA

Nogle pr-miRNAer dannes ud fra introns


(skaldte mirtrons) udsplejset fra pr-mRNAer.
I cytosolen klves pr-miRNAer enzymatisk6
til korte dobbeltstrengede RNA-molekyler,
hvorfra den ene streng sdvanligvis nedbrydes
og den anden frigres som mikro-RNA. Sammen med nogle bestemte proteiner danner mikro-RNAerne de ribonukleoprotein-komplekser, kaldet miRISCs (micro RNA-induced si
lencing complexes, se Fig. 16.3 s. 321), som formidler mikro-RNAs binding til pr-mRNA.
De pgldende proteiner medvirker til at modulere mikro-RNAets virkning. Et af de proteiner der indgr i komplekserne, er FMR1, det
protein der kodes af genet FMR1 (se fragilt Xsyndrom, s. 310).
De regulatoriske funktioner er af overordnet
karakter, og mikro-RNAer ser ud til at vre
centrale molekyler i regulering af bl.a. differentiering og organudvikling.

Andre korte funktionelle ncRNAer


En stor gruppe RNAer p 25-30 nt optrder
jensynligt kun i gonaderne hvor de forekommer i op til 1 mio. molekyler pr. celle i spermatocytter og spermatider. De betegnes piRNA
(piwi-interacting RNA7), og der er pvist ca.
15.000 forskellige slags hos mennesket. Strstedelen af dem har en basesekvens der er komplementr til sekvensen i transkripter af transposoner (s. 39), og det formodes derfor at de har en
vigtig funktion ved at hmme ekspressionen af
transposoner i kimbanen og dermed forhindre
at der sker mutationer ved insertionen af transposoner i gener p nye steder i genomet.

Lange ikkekodende RNAer


Man sknner at > 80% af den samlede transkription i en celle har med lange ikkekodende
RNA-molekyler at gre (long non-coding RNA,
lncRNA link-RNA). De pgldende geners struktur ligner overordnet de proteinkodende geners, og de er ofte mange tusind basepar lange. Man har til dato pvist flere end
10.000 forskellige lncRNAer, hvoraf mange
udtrykkes vvs- og udviklingsspecifikt. En rkke af dem er involveret i regulering af genekspression via epigenetiske modifikationer som fx
metylering af CpG-sekvenser samt metylering
og acetylering af histoner (se s. 45). Et eksempel
er XIST-RNA (eng. X-inactivation specific
transcript, X-inaktiveringsspecifikt transkript) der
styrer X-kromosom-inaktiveringen (s. 46 og s.
119). Mange lncRNAer er involveret i imprintning af gener, dvs. det forhold at kun enten
den paternelle eller den maternelle allel af et gen
udtrykkes (se afsnittet om epigenetiske modifikationer s. 46). lncRNAer kan ogs modulere
transkription og proteinnedbrydning, ligesom
nogle er involveret i biosyntesen af organeller og
den subcellulre trafik.

Repetitivt DNA
Over halvdelen af genomet udgres af gentagne
DNA-sekvenser (repetitivt DNA) som enten
kan vre moderat eller kraftigt repeterede. De
inddeles i tre overordnede grupper: 1) intersper
sed repeats (Tabel 1.5), hvor de individuelle repeterede enheder er fordelt over hele genomet
p en tilsyneladende tilfldig mde, 2) tandem-repeteret DNA (Tabel 1.6), hvor de repeterede enheder ligger i forlngelse af hinanden
i blokke af forskellige lngder, og 3) segmentale duplikationer.

6 Enzymet kaldes Dicer (eng. to dice, skre i smstykker).


7 Piwi er betegnelsen for den gruppe proteiner som disse
RNAer virker i kompleks med. De er frst pvist hos bananfluer hvorfra de har deres navn, en forkortelse af Pelement induced wimpy testis.

37

25139-book.indb 37

09/12/11 11.03

KAPITEL 1 | MENNESKETS GENOM

Tabel 1.4 Forskellige typer ikkekodende RNA (ncRNA) og deres funktion


RNA-type
strrelse (nt)

Undergrupper

Antal
typer

Funktion

Genorganisation

Ribosomalt RNA
(rRNA)
120-4700 nt

Mitokondrielle,
12S rRNA og
16S rRNA

1 af hver

Del af mitokondrielle ribosomer

To nabogener i mtDNA
(Fig. 1.17)

Cytosoliske
5S RNA, 5,8S RNA,
18S RNA, 28S RNA

1 af hver

Del af cytosoliske ribosomer

rDNA-klynger p de
akrocentriske kromosomers korte arme

Transfer RNA
(tRNA)
70-80 nt

Mitokondrielle

22

Aflser mitokondrielt mRNA

Enkeltkopi-gener.

Cytosoliske

49

Aflser cytosolisk mRNA

700 tRNA-gener og
-pseudogener fordelt
over genomet

Sm nuklere RNAer
(snRNA)
60-360 nt

Splejsosom-familie:
U1,U2,U4,
U5, U6, U11, U12

Udsplejsning af introns fra


pr-mRNA

Omkring 200 snRNAgener fordelt over


genomet

Ikke splejsosomassocieret: U7

mange

Modning af histon-pr-mRNA

Enkeltkopi-gener

C/D-klassen
(bestemte sekvenser flles)

246

Modning af rRNA ved metylering

Beliggende i introns af
proteinkodende gener

Sm nukleolre RNA er
(snoRNA)
60-300 nt

U3: Klvning af pr-rRNA


U3: 5-6 kopier p 17p.
Selvstndig promotor
94

Modning af rRNA ved isomerisering af uridiner i pr-RNA

Beliggende i introns af
proteinkodende gener

Sm Cajal-legeme-RNAer
(scaRNA)

25

Modning af visse snRNAer

Beliggende i introns af
proteinkodende gener

RNA-ribonukleaser

Modner tRNA i kernen og i


mitokondrierne

Enkeltkopi-gener

H/ACA-klassen
(bestemte sekvenser flles)

Mikro-RNA (miRNA)
22 nt

>70 familier af beslgtede miRNAer

1000

Mange regulatoriske funktioner


i celledifferentiering og vvsudvikling

Fordelt i genomet, nogle


i klynger

Piwi-associeret RNA
(piRNA)
24-31 nt

89 individuelle
grupper

>15.000

Kun udtrykt i knsceller, hvor de


bremser transposon-aktivitet

89 genklynger fordelt i
genomet

Endogen short interfering


RNA (endo-siRNA)
21-22 nt

Mange

?>10.000

Involveret i gen-regulation i
somatiske celler

Mange genklynger
fordelt i genomet

Lange ikkekodende RNAer


(lncRNA)
Ofte >1kb

Mange

>3.000

Involveret i gen-regulation
og mono-allel ekspression (Xinaktivering, imprintning)

Enkeltkopi-gener,

Forskellige sm cytoplasmatiske RNAer (sncRNA)


80-500 nt

TERC

Telomerase-komponent til
telomer-syntese

Enkeltkopi-gen p 3q26

BC200

Neuralt RNA, regulerer syntesen


af dendritproteiner

Enkeltkopi-gen p 2p16

38

25139-book.indb 38

09/12/11 11.03

IKKEKODENDE RNA

Tabel 1.5 De forskellige typer af interspersed repeat-DNA i menneskets genom


Type af repeat

Undertype

Strrelse p repeat-enhed

SINEs:
Short Interspersed
Nuclear Elements

Alu
MIR-familier
LINE-1 (Kpn)

LINEs:
Long Interspersed
Nuclear Elements

LINE-2
LINE-3
LTR-elementer:
Long Terminal Repeats ERV klasse I
ERV(K) klasse II
ERV(L) klasse III
MaLR
Andre DNAtransposoner

hAT
Tc-1
PiggyBack
Uklassificeret

Antal kopier

% af genomet

Fuld lngde 0,3 kb


Middelstrrelse 0,13 kb

1.090.000
468.000

10
2

Fuld lngde 6,1 kb


Middelstrrelse 0,8 kb
Middelstrrelse 0,25 kb

516.000

5-13

315.000
37.000

2,1
0,2

Middelstrrelse 1,3 kb
Middelstrrelse 0,5 kb

112.000
8.000
83.000
240.000

0,2
4

294.000
195.000
75.000
2.000
60.000

2,5

Varierende, men
middelstrrelse mske 0,25 kb
Middelstrrelse mske 0,4 kb

Interspersed repeats

Strstedelen af det repetitive DNA er interspersed


repeat DNA, dvs. gentagne DNA-segmenter
spredt i genomet (Tabel 1.5). Det er segmenter
som er deriveret fra skaldte transposoner, dvs.
DNA-segmenter der udviser mobilitet inden
for genomet. Der findes 4 typer af transposoner:
SINEs (short interspersed nuclear elements), LINEs
(long interspersed nuclear elements), LTR-elementer (long terminal repeats) og andre DNA-transposoner.
LINEs, SINEs og LTR-elementer er skaldte
retrotransposoner. Deres mobilitet beror p at
der i cellen laves DNA-kopier af transkripterne
(vha. enzymet revers transkriptase) med efterflgende indstning af kopierne et andet sted i
genomet. Andre DNA-transposoner kan migrere direkte ved at de skres ud fra deres lokalitet
og sttes ind igen et andet sted i genomet (se
ogs afsnittet Insertion ved transposition, s.
76). Transposoner er meget udbredte i genomet
og hyppige i proteinkodende geners UTRer. De
kan have regulerende funktioner i genomet ved

0,8

bl.a. at udgre alternative promotorer i forskellige gener.


Blandt de forskellige transposoner er de ca.
300 bp lange primatspecifikke Alu-elementer
blandt de hyppigst forekommende med omkring
1,1 million kopier (forstavelsen Alu hentyder til
at disse elementer oprindeligt blev karakteriseret
ved at de kunne klves af restriktionsenzymet
AluI). De udgr i alt ca. 10% af genomet.
Alu-elementer kan have patogen betydning p
forskellige mder. Et eksempel p et meget Alurigt gen er BRCA1 som er involveret i arvelig
disposition for mamma- og ovariecancer
(HBOC, se s. 242). Genet har en udstrkning p
ca. 80 kb, og omkring 40 % heraf udgres af Aluelementer. Man har pvist at BRCA1-mRNA
forekommer i to former den ene har en kort 5
UTR og udtrykkes i normalt brystkirtelvv.
Den anden form har en lngere 5 UTR, som
flge af insertion af et Alu-element i genet. Den
lngere form udtrykkes i mammacancervv ved
den sporadiske form for brystkrft. Nr 5 UTRregionen er blevet forlnget som flge af Alu39

25139-book.indb 39

09/12/11 11.03

KAPITEL 1 | MENNESKETS GENOM

element-insertion, bliver effektiviteten af


BRCA1-mRNAets translation reduceret med
90%. Ved den arvelige form for mammacancer
har man fundet mutationer i BRCA1-genet som
medfrer nedsat funktion af BRCA1-proteinet.
Den patofysiologiske mekanisme i de to situationer er sledes formentlig den samme, nemlig
nedsat funktion af BRCA1-proteinet, men den
genetiske rsag er forskellig.
Den hyppige forekomst af repeterede elementer disponerer for opsten af deletioner og duplikationer pga. skv overkrydsning (Fig. 3.9). Det
forklarer bl.a. forekomsten af tilflde af familir
hyperkolesterolmi der skyldes deletions- og
duplikationsmutationer i genet for LDL-receptoren hvor der forekommer flere Alu-elementer.
Af andre sygdomme, hvor man har fundet at
transposoner er involveret i patogene mutationer, fx inaktiverende insertion af et LINE-element i en exon, kan nvnes hmofilierne A og
B og coloncancer (APC-genet).
Tandemrepeteret DNA

Der findes flere familier af tandem repeats som


alle er opbygget af blokke (arrays) af tandemre-

peterede enheder (Tabel 1.6). Den repeterede


enhed varierer i strrelse fra et enkelt op til knap
200 basepar.
De enkelte blokke kan forekomme p f eller
mange kromosomale lokalisationer og kan have
betydning i forbindelse med eksempelvis den
rekombination der foregr under meiosen, samt
for dannelsen af duplikationer og deletioner
(Fig. 3.8 og 3.9). Ud fra strrelsen af den repeterede enhed kan det strkt repeterede ikkekodende DNA inddeles i tre hovedgrupper: 1)
satellit-DNA, 2) minisatellit-DNA, og 3) mikrosatellit-DNA.
Der er flere familier af satellit-DNA (-, -,
satellit 1 etc., Tabel 1.6) som alle hovedsageligt
findes i centromerer og heterokromatiske kromosomregioner og bestr af blokke som samlet
kan blive op imod 1-5 Mb lange. Den repeterede enhed (repeatet) er fra 5 til 171 bp lang og
repeteret flere tusinde gange.
Minisatellit-DNA bestr af mindre blokke,
hvor strrelsen af repeat-enheden er p 6-64 bp.
Dette resulterer i samlede repeat-blokke p typisk
mellem 100 bp og 20 kb. Der findes minisatellitDNA i kromosomernes telomerer og som hy-

Tabel 1.6Tandemrepeteret DNA


Gruppe

Satellit-DNA (blokke p fra 100 kb til mange Mb)


-satellit-DNA (alphoid DNA)
-satellit-DNA (Sau3A-familie)

Satellit 1 (AT-rigt)

Satellit 2 og 3

Strrelse
p repeatenhed
5-171 bp

Kromosomal lokalisation

Isr ved centromererne

171 bp Centromert heterokromatin p alle kromosomer


68 bp Centromert heterokromatin p 1,9,13,14,15,21,22 og Y
25-48 bp
5 bp

Centromert heterokromatin p de fleste kromosomer


De fleste, mske alle, kromosomer

Minisatellit-DNA (blokke p 0,1-20 kb)

6-64 bp

Ved eller tt p telomerer af alle kromosomer

Telomer-familie
Hypervariabel familie og telomer-associerede repeats

6 bp
9-64 bp

Alle telomerer
Alle kromosomer, ofte tt p telomerer

Mikrosatellit-DNA (blokke ofte p mindre end 150 bp)

1-4 bp

Spredt rundt p alle kromosomer

40

25139-book.indb 40

09/12/11 11.03

IKKEKODENDE RNA

pervariable minisatelliter rundt omkring i genomet, ofte nr telomererne. De frste hjvariable DNA-markrer man anvendte i retsgenetiske
undersgelser (DNA-profilanalyser), var minisatellitter som udgjorde restriktionsfragmentlngdepolymorfier, RFLPer (se afsnittet Genetiske
markrer og markranalyse, s. 77).
Mikrosatellit-DNA bestr af korte blokke
hvor den repeterede enhed oftest er 1-6 bp i
lngden. Det er karakteristisk for mikrosatellitterne at antallet af repeterede enheder kan ndres i forbindelse med skred under DNA-replikationen (replication slippage, Fig. 3.7) eller som
flge af en skv overkrydsning (Fig. 3.8). En
medicinsk srlig vigtig type af mikrosatellitter
er dem med en repeteret enhed p 3 bp, de skaldte trinukleotidrepeats, se afsnittene Repeatsygdomme (s. 287).
Den store variation i lngden af mange miniog mikrosatellitblokke gr dem til vigtige genetiske markrer (se Boks 3.2).
Mindre DNA-sekvensvariationer

Gruppen inddeles i tre forskellige typer:


1. Mikrosatellitter (short tandem repeat polymor
phisms, STRPs)
2. Insertion-deletion-polymorfier (indels)
3. Enkeltnukleotid-polymorfier (single nucleo
tide polymorphisms, SNPs, snips, SNPer)
Mikrosatellitter er VNTRer (variable number of
tandem repeats) med enheder (repeats) p 1-6 bp.
De udgr ca. 3 % af det humane genom, og der
findes n mikrosatellit for ca. hver 2 kb. Lngdevariationer skyldes variationer i antallet af re
peats som flge af enten skv overkrydsning eller
replication slippage. Dinukleotidrepeats, (CA)n og
(TA)n, er de vigtigste, bde hvad angr hyppighed og anvendelse som genetiske markrer. De
mindre hyppige er tri- og tetranukleotidrepeats,
og de er ogs mindre udsatte for replication slip
page. Trinukleotidrepeats er, som nvnt, medi-

cinsk vigtige i forbindelse med de skaldte trinukleotidrepeatsygdomme, mens mikrosatellitter med tetranukleotidrepeats har fundet stor
praktisk anvendelse som markrer inden for
retsgenetikken (DNA-profilanalyse) og ved
koblingsanalayse (s. 135 og Fig. 5.3A).
Indels: Insertion-deletion-polymorfier kan vre
af forskellig strrelse, typisk 100-1.000 bp, og
opstr som oftest som flge af insertion eller
deletion af en transposon. I skrivende stund har
man identificeret over 30.000 indels. De findes
spredt i genomet, i geners introns og exons samt
i deres promotorregioner. Dette betyder at de
kan pvirke genekspressionen samt proteiners
struktur og/eller funktion.
Enkeltnukleotid-polymorfier (SNPer, snips),
er, som navnet siger, DNA-sekvensvariationer
der omfatter et enkelt basepar, hvor der kan
vre substitution, insertion eller deletion. Man
har nu identificeret mere end 10 millioner
SNPer fordelt over genomet, og de er blevet
katalogiseret i en offentligt tilgngelig SNPdatabase. For r tilbage etableredes et internationalt konsortium med det forml at kortlgge
enkeltnukleotid-variationer i forskellige befolkningsgrupper, til brug for bl.a. undersgelser over deres evt. association med fnotypiske,
herunder sygdomsrelaterede, forandringer. Man
har i projektet bl.a. typet over 1 mio. SNPer i
DNA-prver fra individer i Afrika, USA, Kina
og Japan. Analyserne viste at der i hovedparten
af nukleotidpositionerne generelt set ikke er
stor variation, men at der i ca. 1 ud 300 bp forekommer hyppige variationer. Disse variationer
skyldes ikke nymutationer, men er opstet i lbet af menneskets evolution. I store populationsbaserede studier genomdkkende associationsstudier (genomewide association studies,
GWAS, s. 134) har man brugt dem som markrer til pvisning af en evt. genetisk kompo41

25139-book.indb 41

09/12/11 11.03

KAPITEL 1 | MENNESKETS GENOM

nent i udbredte sygdomme som diabetes mellitus, astma, Crohns sygdom og cancer (se Kap.
6).
Strukturelle genomiske variationer

Indtil for nogle f r siden antog man generelt at


variationerne i det humane genom l i strrelsesordenen 1-100 bp, og at der ikke normalt
forekom strre strukturelle variationer. Pga. den
hastige udvikling i micro array-teknologierne
gennem de seneste 5 r (s. 344), hvor det er blevet muligt at undersge hele genomer i n arbejdsgang med nsten ubegrnset oplsning,
har man imidlertid opdaget en ny type af variation kaldet strukturelle variationer.
Termen strukturelle genomiske variationer refererer til en ny klasse af forandringer i
det nuklere genomiske DNA som er strre
end 1.000 basepar. Det kan vre ubalancerede
kopitalsvariationer (copy number variations,
CNVer) i form af deletioner og duplikationer
eller mindre hyppige balancerede neutrale variationer (genomiske inversioner, reciprokke
translokationer).
Ubalancerede strukturelle genetiske variationer har vret kendt i mange r, men man har
troet at de var begrnset til sjldne genetiske
syndromer ssom Williams syndrom (deletion
i bndregion 7q11.23) og Charcot-Marie-Tooths neuropati type IA (duplikation i bndregionen 17p11.2, s. 287). Det kom derfor som
en stor overraskelse da undersgelser med anvendelse af micro array-teknologi viste at der
hos raske individer kan forekomme ubalancerede variationer som omfatter store DNAsegmenter p 100-2.000 kb, uden nogen tilsyneladende association med sygdom. Der er
databaser som katalogiserer disse strukturelle
variationer, eksempelvis databaserne DECIP-

HER og ECARUCA,8 og til dato (2010) er


der pvist ca. 15.000 steder i genomet hvor der
er beskrevet knap 90.000 kopitalsvariationer
som berrer mere end 1.000 gener.
Balancerede neutrale variationer, som inversioner og translokationer, er ikke fundet med
samme hyppighed. Det skyldes at de ikke kan
detekteres med de effektive high throughput
microarray teknologier, men krver sekventeringsbaserede metoder som er mere kostbare
og tidskrvende, hvorfor man endnu ikke har
fet undersgt s mange individer. Man har
endnu ikke fet kortlagt alle de CNVer der
kan forekomme eller deres hyppigheder i befolkningerne, ligesom man heller ikke ved om
de reelt kan betegnes som normale kopitalsforandringer. Disse forhold gr det vanskeligt
at fortolke micro array-resultater nr der pvises
CNVer som ikke er kendt som patogene forandringer.
Segmentale duplikationer

Op til 5 % af det humane haploide genom bestr af lange DNA-segmenter p 100-400 kb


som findes i to eller flere nsten identiske kopier og jensynligt blev en del af vores genom
for 25-40 millioner r siden. Duplikationer
med > 90 % DNA-sekvensidentitet forekommer isr pericentromert og i de subtelomere
regioner. Sdanne duplikationer er ofte ca. 1 kb
store. De benvnes low copy repeats (LCR) og
kan forekomme p samme eller hvert sit kromosom. Nr de sidder p samme kromosom,
kan de vre orienteret i samme eller i modsat
retning og i strre eller mindre afstand fra hinanden, hvilket har betydning for om bestemte
genomiske forandringer er rekurrente (tilbagevendende) eller ej. 22q11-deletionssyndrom
(DiGeorges sekvens, Boks 4.8) er et eksempel
8 European Cytogeneticists Association Register of Unbalanced Chromosome Aberrations.

42

25139-book.indb 42

09/12/11 11.03

DNAETS ORGANISERING I CELLEKERNEN KROMATIN OG KROMOSOMER

p en rekurrent genomisk forandring der i > 80


% af tilfldene skyldes en bestemt deletion p
grund af et bestemt LCR. I tilflde hvor strrelsen af et LCR er > 10 kb med omkring 97
% sekvensidentitiet, har det vist sig at medfre
genomisk instabilitet som resulterer i deletioner, insertioner og translokationer.

DNAets organisering i cellekernen


kromatin og kromosomer
Den samlede lngde af de 46 DNA-molekyler i
en cellekerne i cellecyklens G1-fase (s. 55) er
knap 2 meter. De er pakket i en cellekerne som
for en typisk menneskecelle vil vre omkring
5-8 m i diameter. Omregnet svarer det til at en
tennisbold indeholder en ca. 20 km lang meget
tynd trd (ca. 20 m i tykkelse).

Nr cellekernen kan rumme de ca. 2 meter


DNA, skyldes det at DNAet er pakket med forskellige proteiner i det tidligere nvnte nukleoproteinkompleks, kromatin (Boks 1.8). Disse
proteiner omfatter dels en familie af basiske proteiner kaldet histoner, dels en heterogen gruppe
af sure, skaldte non-histon-proteiner, som er
knap s velkarakteriserede som histonerne. De
forskellige hierarkiske niveauer i pakningen af
kromosomer er skematiseret i Figur 1.16.
Der er fem hovedtyper af histoner (H1, H2A,
H2B, H3 og H4) som spiller en srdeles vigtig
rolle for pakningen af DNAet, og som har vsentlig betydning for bl.a. genekspressionen. To
kopier af hver af de fire histoner H2A, H2B, H3
og H4 danner tilsammen en histon-oktamr. Et
ca. 140 bp langt segment af DNA-dobbelthelix-

Kromatider
13
12
11.2
11.1
11.1
11.2
12
21.1
21.2
21.3
22
23
q 24

9,5 Mb
6,0 Mb
7,0 Mb

25

8,0 Mb

600 nm

2 nm

4,5 Mb
5,5 Mb
3,0 Mb 1,5 Mb
8,5 Mb
8,0 Mb
4,5 Mb
7,5 Mb

600 nm 600 nm
Nukleosom

Kromatinloop (~75 kb)

30 nm
Scaffold

Linker

DNAdobbelthelix

10 nm
30 nm
Kromatinfiber

10 nm

Figur 1.16. Pakning af DNA i cellekernen; fra dobbelthelix til metafasekromosom. Tegningen viser et idiogram af kromosom 17 i G-bndfarvning (400-bnds oplsning). Til venstre for kromosomet er anfrt bndnummereringen, og til hjre
for de omtrentlige lngder af DNA-segmenterne i de enkelte lyse og mrke bnd. Til hjre for idiogrammet er vist en
stiliseret tegning af DNAet i kromosomets to kromatider, til illustration af at hvert kromatid indeholder en enkelt DNAdobbelthelix. I kromatiderne er DNA-dobbelthelixerne pakket som illustreret i tegningens nederste del. Den omtrentlige
pakkeratio (lngdeforholdet mellem pakket og upakket DNA) er 1:10 for 10 nm-fiberen, 1:36 for 30 nm-fiberen og 1:
>10.000 for metafasekromosomet.

43

25139-book.indb 43

09/12/11 11.03

KAPITEL 1 | MENNESKETS GENOM

en vindes knap to omgange omkring en sdan


histon-oktamr, ligesom en trd om en spole.
Det enkelte kompleks af histon-oktamr og
DNA-segment kaldes et nukleosom og er den
grundlggende strukturelle enhed i kromatinet.
Betydningen af disse fire histoner afspejles i det
forhold at deres aminosyresekvenser er meget
velbevarede gennem evolutionen. Histon H1,
hvis aminosyresekvens varierer en del mere
mellem arterne end de vrige histoners, binder
mere eller mindre kraftigt til DNAet p siden af
hvert nukleosom, hvilket har betydning for om
kromatinet er hhv. lukket (kompakt) eller bent
(lst) (Boks 1.8). Dette pakningsniveau bestemmes af kemiske modifikationer af DNA og
histoner. P grund af en mindre kraftig H1-binding, og en udbredt acetylering af histon-oktamrerne, er det meste kromatin i interfasen organiseret i en ben form (eukromatin). Dette
kan dog variere betydeligt fra celletype til celletype og har betydning for om DNAet er tilgngeligt. Andet kromatin findes i en lukket
form (heterokromatin). Det forbliver undret
gennem cellecyklus pga. kraftig H1-binding.
De enkelte nukleosomfibre (10 nm-fiberen,
Fig. 1.16) pakkes yderligere s der dannes en 30
nm-kromatinfiber der foldes i form af skaldte
loops (slynger) eller domner som med intervaller p omkring 10-100 kb er fastgjort til et nonhiston-protein-netvrk kaldet scaffold (proteinskelet). De enkelte loops er bundet til proteinskelettet via AT-rige DNA-regioner kaldet SARs
(scaffold attachment regions). Denne looping er ogs
med til at bringe DNA-sekvenser som sidder
langt fra hinanden mlt p den linere sekvens
tt sammen, s de og deres bundne proteiner
kan interagere (jf. afsnittet Transkription og
posttranskriptionel modificering, s. 28, samt
Fig. 1.12).

Boks 1.8 Eukromatin og


heterokromatin
Ved kromatin forstr man det kompleks af DNA og
proteiner som udgr kromosomerne. Termen er oprindeligt indfrt af cytologer i slutningen af 1800-tallet for den farvbare substans i kromosomerne (kromosom = farvbart legeme; gr. kromos, farve, og
soma, legeme). Det var den samme substans Miescher i sine kemiske undersgelser gav navnet Nuklein (Boks 1.1).
Man skelner mellem to former af kromatin: en kompakt strkt farvbar form, heterokromatin, og en mindre kompakt og mindre strkt farvbar form, eukromatin.
HETEROKROMATIN
1 Konstitutivt heterokromatin indeholder repeteret
DNA uden proteinkodende gener. Det bevares
kompakt i sin organisation igennem cellecyklus.
Konstitutivt heterokromatin omfatter bl.a. kromatinet i centromerer og telomerer samt i hovedparten af Y-kromosomet.
2 Fakultativt heterokromatin er sommetider inaktivt,
lukket, til andre tider aktivt, bent. Man mener at det indeholder gener som er inaktive i nogle
typer celler eller i bestemte dele af cellecyklus,
mens de i andre celler eller andre dele af cellecyklus er aktive. Nr generne er inaktive, pakkes
kromatinet som heterokromatin. Det menes at kromatinstrukturen er s kompakt at de proteiner som
er involveret i genekspression, ikke kan f adgang
til DNAet. Det inaktive X-kromosom hos kvinder i
somatiske celler er et eksempel.
EUKROMATIN
De resterende kromosomregioner som indeholder de
aktive gener, er mindre kompakte og tillader at ekspressions-proteinerne fr adgang til DNAet. Eukromatin udgr over 90 % af kromatinet og findes
spredt i kromosomerne.

44

25139-book.indb 44

09/12/11 11.03

DNAETS ORGANISERING I CELLEKERNEN KROMATIN OG KROMOSOMER

Epigenetisk variation, kromatinkonformationens


betydning for genekspression

Med afslutningen af det humane genomprojekt


har vi fet en omfattende viden om det genetiske materiale der skal til for at danne et individ
og vedligeholde dets celler og organsystemer.
Forstelsen af hvordan den biologiske information anvendes, krver dog langt mere end et
simpelt katalog over gener, selvom dette i sig
selv er en vsentlig information.
Forstelse af d biologiske forhold som er afgrende for hvilke af de mange gener der skal
vre aktive i hvilke celler og p hvilket tidspunkt, samt hvilke dele af de enkelte gener som
skal udtrykkes i de enkelte celler, er mindst lige
s vigtig som selve det humane genoms sekvens
information.
Man har allerede pvist vigtige faktorer i disse
systemer, skaldt epigenetisk variation (variation
der ikke vedrrer genomets basesekvens), der
har betydning for den differentierede anvendelse
af cellernes genetiske information. De epigenetiske forhold varierer fra celletype til celletype
og har yderligere den vigtige egenskab at de kan
videregives ved den somatiske celledeling. Under knscelledannelsen sker der derimod det at
de fleste parentale epigenetiske modifikationer
falder bort.
Epigenetiske faktorer ndrer pr. definition ikke basesekvensen i DNAet, men modificerer i
stedet kromatinet, hvilket inkluderer DNA-metylering og posttranslationelle modifikationer af
de histoner der pakker DNAet i nukleosomer. I
modstning til genomet, som i det vsentligste
er uforandret i de fleste celler hos mennesket, er
epigenomet produktet af en kontinuerlig foran-

dring i cellerne under deres differentiering. Dette medfrer et stadig mere begrnset mnster i
hvilke gener der udtrykkes, og som kan modificeres af miljfaktorer. En celles epigenom kan
defineres som kombinationen af alle de kromatinmodifikationer der forekommer i den givne
celletype, og som bestemmer dens unikke genudtryk. Epigenomer er foranderlige gennem fx
vvs og organers udvikling, pvirkelige af miljfaktorer, ndret ved visse sygdomme og kan
vre forskellige selv hos individer med samme
genotype (bl.a. enggede tvillinger). I Tabel 1.7
er der givet en oversigt over de epigenetiske modifikationer histon-modifikationer og DNAmetylering som har betydning for aktive og
mindre aktive gener. Noget tyder p at processerne for DNA-metylering og histon-acetylering er koblede, men den nrmere biologiske
betydning heraf er endnu ikke klarlagt.
Histonmodifikationer betydning for kromatinkonformation og genekspression

Det er en ndvendig, men ikke tilstrkkelig, betingelse for at der kan ske genekspression at kromatinet findes i form af eukromatin. Det er bestemte modifikationer af histonerne som bestemmer kromatinets konformation. Histonerne kan
modificeres ved acetylering, metylering (mono,
di og tri) samt fosforylering. Det er en kombination af disse som bestemmer om kromatinet bestemte steder i genomet er i en ben eller i en
lukket form, men generelt set har eukromatin
(aktive gener, Tabel 1.7) hyperacetylerede histoner, mens heterokromatin er hypoacetyleret. Der
findes store familier af enzymer som er ansvarlige
for histon-modifikationerne.

Tabel 1.7Epigenetiske modifikationer ved aktive og inaktive gener


Epigenetisk modifikation

Aktive gener

Inaktive gener

DNA-metylering

Hypometylering af promotor-regionen

Hypermetylering af promotor-regionen

Histon-acetylering

Acetylerede histoner

De-acetylerede histoner

45

25139-book.indb 45

09/12/11 11.03

KAPITEL 1 | MENNESKETS GENOM

Genernes ekspression eller aktivitet bestemmes af den mde hvorp nukleosomerne er pakket i hjereordens strukturer, dvs. den overordnede kromatinkonformation. Der findes to basale varianter: heterokromatin som er en lukket inaktiv konformation, og eukromatin som
er en ben potentielt aktiv konformation
(Boks 1.8). Heterokromatin kan vre konstitutivt, hvilket betyder at det bevarer den lukkede
struktur under hele cellecyklus. Dets DNA bestr isr af segmenter af repeterede DNA-sekvenser med kun f gener imellem. Heterokromatin kan ogs vre fakultativt, hvilket betyder
at den lukkede konformation er reversibel som
det for eksempel kan ses ved det inaktive Xkromosom fra den ene generation til den nste.
DNA-metylerings betydning for genekspressionen

DNA-metylering er den bedst beskrevne epigenetiske mekanisme til regulation af genekspressionen. Hos mennesket er der nsten udelukkenede tale om metylering af cytosin i C5-positionen i cytosin-guanin-sekvenser (CpG, s. 67).
Der findes omkring 30.000 steder i genomet
hvor der i et DNA-segment p 1-2 kb er en
ophobning af CpG-dinukleotider, skaldte
CpG-er. De forekommer ofte i husholdningsgenernes promotorregioner (s. 28) hvor de typisk er umetylerede i alle celletyper. G e n e re l t
kan det siges at ekspressionen af gener korrelerer
omvendt med hvor mange metylerede cytosinbaser der er i og omkring de regulatoriske omrder af genet. Aktive gener har f eller ingen
metylerede cytosiner (hypometylering) i deres
promotorregion, mens inaktive gener har mange metylerede cytosin-baser i og omkring promotorregionen (hypermetylering).
I normale celler foregr DNA-metylering
isr i d genomiske omrder som har repeterede
sekvenser ssom satellit-DNA, SINEs og LINEs
samt ved geners promotorregion og deres exon
1. Der findes ogs spredte CpG-sekvenser i

exons og introns samt mellem gener. Man har


fundet at ca. 70 % af CpG-dinukleotiderne i
genomet er metyleret. Der findes ogs gener
som ikke har CpG-er, bl.a. generne for vksthormon og insulin.
Epigenetiske modifikationer, herunder X-kromosom-inaktivering og genomisk imprintning

Epigenetiske modifikationer medfrer ndringer i genernes ekspression, men involverer, som


anfrt, ikke forandringer i selve DNA-sekvensen, ud over metylering af cytosiner. De epigenetiske forandringer kan i cellen eksistere over
forskellig tid. X-kromosom-inaktivering og imprintning er eksempler p epigenetiske modifikationer der bevares gennem de somatiske celledelinger, men ophves i meiosen. For imprintnings vedkommende undergr genomet p
ny en knsspecifik imprintning under meioseforlbet. Der er dog enkelte eksempler p epigenetiske effekter som kan nedarves og som da
kaldes paramutationer.
X-kromosom-inaktivering og imprintning resulterer i mono-allel genekspression, dvs. at kun
den ene allel p et givet locus er aktiv. Disse epigenetiske forandringer afhnger af DNA-metylering. Der findes tre DNA-metyltransferaser
(DNMT1, DNMT3A og DNMT3B) som kan
metylere CpG-sekvenser. DNMT1 kan kun metylere hemimetylerede CpG-sekvenser (dvs. CpG
hvis komplementre sekvens i DNAets modsatte
streng er metyleret) der optrder efter DNA
replikationen i mitosen, og enzymet er dermed
med til at vedligeholde en fuldt metyleret DNAsekvens. DNMT3A og DNMT3B metylerer
umetylerede CpG-sekvenser som optrder i
meiosen, og disse enzymer kan dermed de novo
etablere metylering, fx i form af imprintning.
Tidligt i den hunlige embryogenese sker der i
somatiske celler normalt en tilfldig, men permanent inaktivering af det ene X-kromosom
som flge af hypermetylering. Det er et eksem-

46

25139-book.indb 46

09/12/11 11.03

MITOKONDRIE-DNA (MTDNA)

pel p en epigenetisk forandring der bevares


gennem mitoserne, men ikke fra mor til barn.
Dette betyder at ca. halvdelen af de somatiske
celler hos kvinder har det paternelt nedarvede
X-kromosom aktivt, mens de vrige celler har
det maternelle X-kromosom aktivt (se nrmere
om X-kromosom-inaktivering i Kap. 5, s. 119ff.).
I embryoner med kvindelig knskromosombestning er begge X-kromosomer aktive op til
64-128 cellestadiet, hvorefter enten det maternelle eller det paternelle X-kromosom inaktiveres i de enkelte celler i den cellehob der udvikles
til fosteret. Inaktiveringen af X-kromosomet initieres ved XIC (X-inativeringscenteret) der sidder p Xq13, og bredes derefter ud over nsten
hele kromosomet. XIC transkriberes til et stort
ikkekodende RNA, lncRNAet XIST, som kun
bliver udtrykt fra det X-kromosom der inaktiveres. Det primre XIST-RNA splejses og polyadenyleres til et 17 kb stort modent XIST-RNA
der rekrutterer proteiner som organiserer kromatinet til en inaktiv lukket konformation. Det
er dog ikke hele X-kromosomet der inaktiveres
idet bl.a. de pseudoautosomale regioner og visse
andre mindre regioner undslipper. XIST er kun
ndvendig for initieringen af X-kromosom-inaktiveringen, ikke for vedligeholdelsen heraf.
Ved imprintning afhnger genekspressionen i
de pgldende loci af den parentale oprindelse.
Hos mennesket er der pvist imprintede gener i
flgende kromosomregioner: 6q24-q26, 7q21q22, 7q32, 7p12, 8q24, 11p15, 14q32, 15q11-q13,
19q13 og 20q13. Man har ligeledes fundet at den
mono-allelle ekspression er knyttet til bestemte
vv og bestemte stadier i individets udvikling.
For visse geners vedkommende er det vigtigt om
det er den maternelle eller den paternelle allel der
udtrykkes, mens det for andre geners vedkommende er ligegyldigt, s lnge det kun er den ene
allel der udtrykkes. For eksempel inaktiveres den
paternelle UBE3A-allel i hjernevv, mens genet
udtrykkes bi-allelt i alle andre vv.

For andre gener betyder det ikke noget for


den normale funktion hvilken allel der udtrykkes. Det kan fx nvnes at der findes omkring
900 gener der koder for receptorer i nsens olfaktoriske organ af betydning for vores lugtesans. I hver olfaktoriske nervecelle udtrykkes
kun n allel af t enkelt receptorgen, hvilket bevirker at den nervecelle kun reagerer p n bestemt lugt.
Epigenetiske modifikationer har ogs sygdomsmssig betydning, hvilket bl.a. understreges
af det stigende antal sygdomme, hvor det er pvist at disse modifikationer er involveret i patogenesen. En kobling mellem DNA-metylering
og cancer blev kendt for flere r siden, hvor det
blev pvist at cancercellers genom er hypometyleret i forhold til normale cellers. Det er interessant at dette tab af metylering hovedsageligt er
sket i de repetitive omrder af genomet. Der findes ogs andre grupper af sygdomme, hvor forstyrret imprintning har patogenetisk betydning,
eksempelvis Beckwith-Wiedemanns syndrom
samt Prader-Willis og Angelmans syndromer (se
nrmere herom i Kap. 15, s. 312ff.).
Med baggrund i ovenstende syndromer er
der nu betydelig farmakologisk interesse for at
udvikle medikamina som skal kunne revertere
epigenetiske abnormiteter.

Mitokondrie-DNA (mtDNA)
En somatisk celle indeholder flere hundrede,
evt. afhngigt af celletypen flere tusind mitokondrier, som igen hver isr indeholder op til
10 molekyler mtDNA. Der kan sledes forekomme mange tusind kopier af dette molekyle i
hver celle. For de modne knscellers vedkommende forholder det sig sdan at en gcelle indeholder op mod 100.000 mitokondrier, mens
en sdcelle i sit langt mindre cytoplasma-volumen kun indeholder 50-100 mitokondrier som
yderligere under normale forhold nedbrydes
efter befrugtningen.
47

25139-book.indb 47

09/12/11 11.03

KAPITEL 1 | MENNESKETS GENOM

Dette er baggrunden for at mitokondrieDNA nedarves via gceller, dvs. i rene kvindelinjer skaldt maternel arvegang (Kap. 5).9
Den forholdsmssigt hyppige forekomst af
sygdomsfremkaldende (patogene) mutationer i
mtDNA gr at ogs denne strrelsesmssigt beskedne del af genomet har betydelig medicinsk
vigtighed. Der er da ogs i det seneste rti sket
en strk stigning i antallet af patienter hvor man
har pvist en mtDNA-mutation som rsag til
deres sygdom, typisk af neuromuskulr art (s.
121). Det er derfor vigtigt at man som lge er
fortrolig med mitokondrie-DNA og patogene
mtDNA-mutationers kliniske manifestationer,
ligesom det ved udredning af familieanamnese
og fortolkning af stamtrer er vigtigt at vre
opmrksom p om de foreliggende oplysninger
er forenelige eller uforenelige med maternel arv
(se Kap. 5, Figur 5.1e og 5.1f).
Boks 1.9. Mitokondriers evolutionre
baggrund
Mitokondriers grundlggende molekylrbiologi
minder meget om forholdene hos bakterier og menes at afspejle at mitokondrierne er evolutionre
rester af en bakterieart som i eukaryoternes (de kerneholdige organismers) tidlige evolution blev optaget i en eukaryot og indgik i et symbiotisk forhold
med denne. Under rmillionernes udvikling af denne
symbiose menes strstedelen af den pgldende
bakteries genom gradvist at vre blevet overfrt til
eukaryotens cellekerne. En lille del af vores kernegenom er sledes efter al sandsynlighed fhv. mitokondriegenommateriale.

9 Der er fra Rigshospitalet publiceret det forelbig eneste


kendte tilflde af paternel nedarvning af mitokondrieDNA hos mennesket: Schwartz M. & J. Vissing. Paternal
inheritance of mitochondrial DNA. New Engl. J. Med.
2002; 347: 576-80. Parallelpublikation, Paternel nedarvning af mitokondrielt DNA i Ugeskrift for Lger 2003;
165: 3627-30.

mtDNA-molekylet og dets funktion


Menneskets mtDNA er et lille ringsluttet DNAmolekyle p knap 16.600 basepar (16,6 kb), se
Boks 1.9 og 1.10. Siden 1986 har man kendt
hele mitokondrie-DNAets kodende funktion
(Figur 1.17). Denne del af menneskets genom
var sledes beskrevet i detaljer flere r fr den
store kortlgning af det nuklere genom blev
indledt.
mtDNA indeholder i alt 37 gener. Heraf koder 2 for ribosomalt RNA (hhv. 12S og 16S
rRNA), 22 koder for tRNA, og 13 er proteinkodende. De 13 mitokondrielle mRNAer
translateres alle p mitokondriets egne ribosomer under anvendelse af mitokondrielt tRNA
og dermed i overensstemmelse med mitokondriernes genetiske kode (Tabel 1.8). Alle 13 polypeptider har desuden deres funktion i mitokondriet hvor de er engageret i den oxidative
fosforylering (OXPHOS) og dermed i mitokondriernes livsvigtige syntese af ATP (adeno
sintrifosfat).
Puriner (adenin og guanin) og pyrimidiner
(cytosin og thymin) er ulige fordelt mellem mtDNA-molekylets to strenge, hvilket er baggrunden for at den ene streng betegnes H-strengen (H = heavy), den anden L-strengen (L =
light). For 12 af de 13 proteinkodende gener i
mtDNA samt for 14 af de 22 tRNA-gener og
begge rRNA-gener er H-strengen templatestreng ved syntesen af det primre transkript
(Fig. 1.17). For den helt overvejende del af de
mitokondrielle gener er L-strengen derfor den
RNA-lignende streng, dvs. den streng hvis basesekvens er lig sekvensen af det funktionelle
transkript, sfremt thymin (T) erstattes med uracil (U). Dette er baggrunden for at L-strengens
sekvens er mitokondriegenomets referencesekvens, ogs ved beskrivelse af mutationer i de
gener hvor L-strengen er template-streng, fx
ND6 (se Tabel 5.5 s. 113).

48

25139-book.indb 48

09/12/11 11.03

MITOKONDRIE-DNA (MTDNA)

Kontrolregionen
Val

12S
Phe
OH

16S

Cytb

Thr
Pro

H-strengen

Glu
ND6

Leu (UUR)
ND5

ND1
IIe
Met

Gln

ND2

Leu (CUN)
Ser (AGY)
His
Ala
Asn
Cys
Tyr

Trp
OL

CO I

ND4

L-strengen
Ser (UCN)
Asp
Lys
CO II

Arg
Gly

ND4L

ND3

CO III
ATPase 6
ATPase 8

Figur 1.17.Genetisk kort over menneskets mitokondrie-DNA (mtDNA). Det ringsluttede DNA-molekyles to strenge,
H- hhv. L-strengen, er tegnet som to koncentriske cirkler. Molekylets 37 gener er markeret som kasser (rRNA- og protein
generne) hhv. sm udfyldte cirkler (tRNA-generne) beliggende p den af de to strenge der er template ved syntesen af
genets funktionelle RNA-transkript. Gensymboler: 12S og 16S er generne for mitokondriernes to rRNA-molekyler, hhv. 12S
rRNA og 16S rRNA. ND1-ND6 er gener for subunits i enzymkomplekset NADH-dehydrogenase, COI-III er generne for subunits i enzymkomplekset cytokrom c-oxidase, ATPase6 og ATPase8 koder for subunits i ATP-syntase, og Cytb for cytokrom
b. De sm tRNA-gener er markeret med trebogstavkoden for den tilhrende aminosyre (Tabel 1.3). Leucin-tRNA (Leu) og
serin-tRNA (Ser) har hver to forskellige gener sv.t. deres to codon-familier (Tabel 1.2), jf. codon-angivelserne i de anfrte
parenteser (R = purin, Y = pyrimidin, N = purin el. pyrimidin). OH og OL angiver replikationsstart for hhv. den tunge og den
lette streng. Kontrolregionen er ikkekodende, men indeholder foruden OH separate transkriptionsstartsekvenser for de
to strenge samt to regioner med hjvariable sekvenser. Molekylets basepar nummereres fortlbende fra basepar nr. 1 (i
kontrolregionen) og frem, i retningen mod uret (pilen). (Adapteret fra Attardi G. The elucidation of the human mitochondrial genome. A historical perspective. BioEssays 1986;5:34-9).

Tabel 1.8Den genetiske kode for menneskets mtDNA.Forskelle fra standardkoden, Tabel 1.2
Codon

Standardkoden

mtDNA

AUA

Ile

Met

UGA

Stop el. Sec

Trp

AGA

Arg

Stop

AGG

Arg

Stop

49

25139-book.indb 49

09/12/11 11.03

KAPITEL 1 | MENNESKETS GENOM

Boks 1.10 Referencesekvensen for


mitokondrie-DNA (mtDNA).
Den frste basesekvens af mtDNA fra mennesket
blev offentliggjort i 1981.10 Den var p 16.569 basepar, fortlbende nummereret med et bestemt basepar i kontrolregionen som nr. 1. Det pgldende
mtDNA var udvundet fra en moderkage, men pga.
analyseproblemer blev en lille del af sekvensen taget fra en anden persons mtDNA, og da der i et par
andre positioner yderligere var tvivl om analyseresultaterne, anbragte man her de basepar man entydigt havde fastlagt i de tilsvarende positioner i oksemtDNA. Det blev der frst rettet endeligt op p 10 r
senere ved fornyet sekventering af det oprindelige
placenta-mtDNA.11 Ved revisionen viste det sig at
der i 1981-sekvensen var anfrt et basepar for meget i positionerne 3.106-3.107 (i genet for 16S
rRNA). Den reviderede referencesekvens (rCRS) er
sledes kun p 16.568 bp, men af hensyn til den allerede meget omfattende litteratur om variation i
bestemte positioner, herunder vigtige patogene mutationer (Tabel 5.5, s. 113), valgte man at bibeholde
den oprindelige nummerering og acceptere et hul i
sekvensen sv.t. position 3107.

Mitokondriegenomet er specielt, bl.a. ved at


ingen af dets gener indeholder introns, ligesom
der stort set heller ikke er nogen basepar mel
lem generne, nr undtages den skaldte kontrolregion. Det er den ca. 1.100 bp lange sekvens mellem generne for prolin-tRNA
(tRNAPro) og phenylalanin-tRNA (tRNAPhe)
(Figur 1.17). Den informationsmssige kompakthed i mtDNAet understreges af at tran
skripterne fra de fleste af de proteinkodende
gener afsluttes med en ufuldstndig stopcodon
10 Anderson S et al. Sequence and organization of the human mitochondrial genome. Nature 1981; 290: 457-465.
11 Andrews RM et al. Reanalysis and revision of the Cambridge reference sequence for human mitochondrial
DNA. Nature genetics 1999; 23: 147.

(U eller UA) der frst fuldendes til UAA ved


den posttranskriptionelle polyadenylering af
mRNAet.

Sekvensvariation i mtDNA
Ved rutinemssig mtDNA-analyse vil man hos
de allerfleste personer kun pvise n mtDNAsekvens. Denne homogene tilstand betegnes homoplasmi; dette til forskel fra den sjldnere situation hvor der pvises to forskellige sekvenser,
skaldt heteroplasmi.
P populationsniveau er der til gengld tale
om en betydelig sekvensvariation mellem tilfldigt udvalgte individer; jo fjernere beslgtet
kvindelinjerne er, des strre er sekvensvariationen.
Den langt overvejende del af sekvensvariationen mellem individer er uden fnotypiske konsekvenser og betegnes derfor som normalgenetisk variation. Strstedelen af den normalgenetiske variation forekommer i to ca. 400 bp store
segmenter af kontrolregionen kaldet hypervariable regioner. Dertil kommer en del polymorfier i den kodende del af mtDNAet samt dn
lejlighedsvise variation der skyldes patogene
mutationer (disse vil blive omtalt i Kap. 5, se afsnittet Mitokondriesygdomme, side 121ff.).

Haplotyper og haplogrupper
En persons mtDNA-sekvens betegnes ogs vedkommendes mtDNA-haplotype. I forbindelse
med kortlgning af fordelingen af haplotyper
blandt Jordens forskellige etniske grupper har
man defineret en snes forskellige hovedgrupper
af haplotyper, kaldet haplogrupper. Disses sekvenser har kunnet indpasses i et sammenhngende overordnet stamtr for nutidsmenneskets
mtDNA med rdder i et flles stam-mtDNA
hos en kvinde i Afrika for anslet 150.000200.000 r siden, populrt kaldt den mitokondrielle Eva.

50

25139-book.indb 50

09/12/11 11.03

BETYDNING OG PERSPEKTIVER

Kromosomalt
DNA

Cellekernen

Mitokondrie
mtDNA

KerneTranskription proteiner

snRNA

cDNA

Transkription

Andre
proteiner

mRNA

rRNA

tRNA

rRNA
tRNA
mRNA

Andet fuktionelt RNA


(miRNA, lncRNA mv.)

Ribosomproteiner
N

Protein

N ..... C
Eksport til andre
celler/vv

Translation
C
OXPHOS

Andre organeller + cytosol

Figur 1.18.Gen-ekspression i en celle, hhv. nuklere gener (kromosomalt DNA i cellekernen) og mitokondrielle gener
(mtDNA i mitokondrierne). I cellekernen dannes et primrt transkript som i cellekernen processeres til det funktionelle
RNA-molekyle. Bemrk at et transkript kan reverstranskriberes til DNA af viralt eller cellulrt kodet revers transkriptase.
DNAet kan efterflgende integreres i det kromosomale DNA. Mitokondrierne syntetiserer deres egne rRNA- og tRNAmolekyler samt mRNA til syntese af 13 proteiner der indgr i syntesen af ATP (den oxidative fosforylering, OXPHOS). De
mitokondrielle DNA- og RNA-polymeraser samt ribosomale proteiner, enzymerne i de mitokondrielle stofskifteprocesser
trikarboxylsyrecyklus, fedtsyreoxidationen og urinstofcyklus samt hovedparten af proteinerne i den oxidative fosforylering
kodes af nuklere gener og syntetiseres af cytosoliske ribosomer, hvorefter de importeres af mitokondrierne.
angiver posttranslationelle modifikationer ssom fx glykosylering og fosforylering.

Betydning og perspektiver
Allerede i 1969, dvs. 20 r fr det humane
genomprojekt (Human Genome Project, HGP)
blev sat i gang, foreslog den amerikanske kardiolog og humangenetiker Victor McKusick (Boks
1.11) at menneskets gener skulle kortlgges.
Han sammenlignede en kortlgning af menneskets arvemasse med 1500-tallets banebrydende
studier af menneskets anatomi og foruds at den
ville f en tilsvarende revolutionerende betydning for lgevidenskaben.

Boks 1.11 Victor A. McKusick


Victor McKusick (1921-2008) betragtes af mange
som grundlggeren af den moderne kliniske genetik. Han var bl.a. manden bag vrket Mendelian
Inheritance in Man (MIM), en omfattende katalogisering af menneskets gener og mendelske egenskaber, herunder monogene sygdomme. Frst i bogform
og siden tilgngelig p internettet i form af OMIM,
Online Mendelian Inheritance in Man, en meget
vrdifuld database for klinisk genetik (www.ncbi.
nlm.nih.gov/omim). McKusick var en af foregangsmndene i den betydningsfulde Human Genome
Organisation, bedre kendt under akronymet HUGO.

51

25139-book.indb 51

09/12/11 11.03

KAPITEL 1 | MENNESKETS GENOM

Han blev sammenslutningens frste prsident og


satte i den grad sit prg p organisationen at man,
med reference til en kendt fransk forfatter, ofte spgefuldt omtalte den som Victors HUGO.

Med det humane genomprojekts sekventering af arvemassen er det rigtignok lykkedes at


s at sige fridissekere vores molekylrgenetiske
anatomi og derved blotlgge den ngne biologiske opskrift p et menneske. Men medens
den klassiske anatomi meget hndgribeligt viser
os menneskelegemets struktur, og i vid udstrkning giver os en umiddelbar indsigt i organsystemernes indbyrdes samspil, er genomets anatomi en ret s rodet og uoverskuelig strrelse, og
udnyttelse af informationen herom stiller store
faglige krav, herunder til avanceret informationsteknologi.
Tilvejebringelsen af selve referencesekvensen,
og dens umiddelbare tilgngelighed via internettet, har dog allerede haft stor betydning.
Uanset den genetiske variation mellem individuelle genomer har den officielle referencesekvens status som genetisk norm fet afgrende
betydning for konkrete daglige laboratoriediagnostiske bedmmelser af DNA-analyser af patienter og familier. Dertil kommer den udvidelse af det diagnostiske spektrum som kortlgningen har muliggjort, derved at flere og flere
gener har kunnet identificeres vha. den tilvejebragte genomsekvens.
Ligesom det frste store big science-projekt i
vor tid, Apolloprojektet om mnelandingen, har
HGP krvet og affdt en enorm teknologisk
udvikling og konkurrence. Dette har fet betydning for alle de omrder hvor molekylrgenetiske analyser er, eller netop er blevet, et centralt
vrktj. Ud over den kliniske genetik, inkl. cancergenetikken og de multifaktorielle sygdomme, glder dette bl.a. virus- og bakteriediagnostik samt retsmedicin (DNA-profilanalyser), an-

tropologi og arkologi (revolutionerende analyser af gammelt DNA). Dertil kommer biologisk grundforskning i almindelighed, hvor de
seneste rtiers eksponentielt voksende kortlgning af diverse biologiske arters genomer med
detaljerede molekylre data kraftigt har underbygget og detailbelyst dn biologiske evolution
som Charles Darwin (1809-82) for over 150 r
siden argumenterede solidt og modigt for. Sammenligninger med basesekvenser og aminosyresekvenser i hhv. gener og proteiner hos andre
arter er blevet vigtige i vurderingen af de sekvensvariationer der pvises ved DNA-analyse
af patienter og risikopersoner i den kliniske genetik (s. 79).
Analyser af individuelle genomer for tusindvis
af sekvensvariationer i form af SNPer og kopitalsvarianter i genomdkkende associationsstudier (GWAS, genomewide association studies, se
Kap. 6), mhp. afklaring af det genetiske grundlag
for en lang rkke komplekse sygdomstilstande,
har i de senere r sendt laviner af resultater ud i
faglitteraturen. Sidelbende har den teknologiske udvikling inden for molekylrgenetikken
bragt sekvensanalyse af hele genomet hos enkeltpersoner inden for praktisk rkkevidde12.
Med den voldsomme gning i mngden af molekylrgenetiske data bliver det en kmpe udfordring at fortolke den diagnostiske relevans af
dels de mange associationer mellem markrer
og sygdom der pvises ved de nvnte associationsstudier, dels de talrige sekvensvarianter som
genomsekventeringerne vil byde p.
Efter afklaringen af genomets struktur er den
store udfordring forstelsen af dets funktion. De
grundlggende principper og molekylrbiologiske detaljer i genekspression transkription
og translation er for lngst blevet udredt, men
12 Det forudses at en sdan analyse inden lnge vil kunne
udfres for under 10.000 kr. og p mindre end en uge. Til
sammenligning kostede tilvejebringelsen af den frste
genomsekvens 2,7 milliarder US dollars og tog 13 r.

52

25139-book.indb 52

09/12/11 11.03

BETYDNING OG PERSPEKTIVER

tilbage str afklaringen af dn koordinerede afspilning af (stam)cellers genetiske program som


bevirker vvsdifferentiering og organdannelse
med en selvstndig organisme som slutresultat.
Svarene p de mange udestende sprgsml herom forventes tilvejebragt gennem bl.a. den
igangvrende kortlgning af epigenetiske mekanismer og disses betydning for hvilke dele af
genomet der udtrykkes hvor og hvornr som
afspejlet i cellernes transkriptomer og proteomer. Dette vil give grundlag for en beskrivelse
og forstelse af udviklingsfejl p svel celle- som
organniveau, i form af cancer og organforstyrrelser/misdannelser, med nye muligheder for
forebyggelse og behandling.
I dette p mange mder uoverskuelige felt er
det vigtigt at holde fast i de allerede opnede

landvindinger inden for kortlgningen af det


molekylrgenetiske grundlag for d mange alvorlige monogene sygdomme der rammer familier her i landet. Denne kortlgning har muliggjort en prcis diagnostik samt et tilbud om
forebyggelse af nye tilflde i familierne gennem
bl.a. fosterdiagnostik og selektiv abort. Forudstningen for en effektiv generel forebyggelse i befolkningen er imidlertid at anlgsbrerne bliver
fundet inden de fr deres frste barn med den
pgldende sygdom. Med udviklingen af arrayteknologier (Kap. 17) er et tilbud om omkostningseffektiv molekylrgenetisk screening for
kendte patogene mutationer blevet et nrliggende og vidtgende uproblematisk stort potentielt befolkningsgode som faget klinisk genetik
vil kunne argumentere strkt for at f indfrt.

53

25139-book.indb 53

09/12/11 11.03

You might also like